> 文章列表 / Page 26

2016-02-15

【MySQL学生手册】表维护操作类型

本文地址:https://www.askmaclean.com/archives/mysql-maintenance-type.html   第10章 表的维护   章节概述 本章介绍如何在MySQL中进行表的维护管理。你会了解: 分辨表维护操作类型 执行表维护SQL语句 使用客户端及工具程序来进行表维护 修理InnoDB表 启用对MyISAM表的自动修复   10.1 表维护操作类型 一些表维护操作对于判定并修正数据库中的问题(例如,当一张表由于服务器奔溃而导致损坏后)或帮助MySQL优化表查询时非常有用。MySQL(根据存储引擎)可允许你执行几种类型的维护操作: 存储引擎名 MyISAM InnoDB CHECK…
#POST 5 MIN READ
2016-02-15

Oracle Acs资深顾问罗敏 老罗技术核心感悟: 11g大对象数据新技术

作者为:  SHOUG成员 – ORACLE ACS高级顾问罗敏 本文永久地址:https://www.askmaclean.com/?p=16572 IT系统不仅需要存储和处理大量的传统结构化数据,而且对各类半结构化,例如XML文档、Word文档等,以及非结构化的图片、图像、视频等信息的处理需求也日益增长。Oracle自8i开始就推出了大对象(LOB)技术,用于存储半结构化和非结构化的数据。 本章将首先介绍传统LOB技术的运用,并总结传统LOB技术的不足,然后将介绍Oracle 11g新一代的大对象处理技术:SecureFiles,以及将传统LOB向SecureFiles进行迁移的相关技术,最后介绍相关案例和进一步的参考资料。 传统LOB技术的运用 LOB字段分为存储二进制的BLOB字段、存储字符类型的CLOB、存储国家字符集的NCLOB,以及存储外部文件的BFILE等类型。LOB字段的设计和使用并不复杂,例如,以下就是创建一个包含LOB字段表的语句:     CREATE TABLE print_media ( product_id NUMBER(6) ,…
#POST 11 MIN READ
2016-02-14

Oracle 12c Dynamic statistics与 之前版本Dynamic Sampling动态采样的区别

动态统计信息(Dynamic Statistics)是一个新的概念。在11g的数据库,我们知道的动态采样(dynamic sampling)是在优化sql语句之前收集最基本的对象的统计信息。 12c优化器会判断当前有效的统计信息是否足够,否则使用动态统计信息。动态统计信息是一个持久的统计信息,会存储在统计仓储中,因此可能会被其他的查询语句使用。在12c中, 优化器会判断是否动态统计信息是有用的,是否动态采样是正确的方法,并能自动决定动态采样的级别。   动态统计信息 : During the compilation of a SQL statement, the optimizer decides whether to…
#POST 1 MIN READ
2016-01-31

Hadoop 权限指导

本文固定链接:https://www.askmaclean.com/archives/hadoop-permissions-guide.html 本文是官方文档的翻译,原文地址是: http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsPermissionsGuide.html     1.概述   HDFS为文件和目录实现了一个权限模块,一大部分共享是POSIX模式。每个文件和目录关联到一个用户和一个组。文件和目录以用户所有者来权限划分,其他的用户可以是一个组的成员,也可以是所有其他的用户。对于文件来说,r 权限是读文件的权限,w 权限是写或者追加到文件的权限。对于目录来说,r权限是列出目录内容的权限,w权限是删除和创建文件或目录的权限,x权限是访问子目录的权限。 于POSIX模式对比,文件没有setuid或setgid位,因为没有可执行文件的概念。同样地,对于目录也没有setuid和setgid位。粘贴位可以被设置在目录上,可以防止除了超级用户之外,目录所有者或文件所有者在这个目录中删除或移动文件。在文件上设置粘贴位没有作用。总的来说,一个文件或目录的权限是它们的模式。一般来说,Unix用户的表现模式将被使用,包括这个表述上的8进制方法。当文件或目录被创建,它们的所有者是客户端进程的标识,它们的组时父目录的组(BSD规则)。 HDFS也提供了POSIX ACLs(访问控制列表)支持,来增加对特定命名用户或命名组的更细粒度规则的文件权限。ACLs在后面有更详细的讨论(www.askmaclean.com)。 每个客户端进程访问HDFS拥有2部分标识:用户名和组列表。当文件和目录被一个客户端进程访问时,HDFS必须进行权限检查。 如果用户名匹配所有者,那么所有者权限是通过的。 如果组权限匹配组列表中任何一个成员,那么组权限是通过的。 否则,其他权限是通过的。 如果权限检查失败,客户端操作就失败。
#POST 12 MIN READ
2016-01-25

【MySQL学生手册】MySQL表分区类型

本文地址:https://www.askmaclean.com/archives/mysql-partition-type.html   9.2 分区类型 RANGE分区:基于列值所处在的给定范围来对行进行分区。 LIST分区:和RANGE分区类似,不过区别是基于一组离散值集合中的值匹配来进行分区。 HASH分区:分区的选择基于要插入行的列值进行用户定义功能函数计算后的返回值。其功能函数可以包括任意MySQL有效表达式并返回一个非负的整数值。 KEY分区:和Hash分区类似,不过区别是使用MySQL自有的哈希功能来对一列或多列进行哈希计算,其中的列值也可以包含除整数值之外的值,而MySQL并不关心列值的具体数据类型,在哈希计算后,都会返回一个整数值。   通常使用数据库分区时会按日期时间来都对数据进行分割。一些数据库系统支持显式时间日期分区语法,不过MySQL不支持。不过在MySQL中,想要基于DATE,TIME,或DATETIME列来建立分区,或基于使用这些列进行计算的表达式来进行分区都并不困难。   当通过KEY或LINEAR KEY建立分区时,你可以在不对DATE,TIME或DATETIME列进行任何值修改的情况下,直接使用它们来进行分区。例如,以下表分区语句在MySQL中是可行的: CREATE TABLE members ( firstname VARCHAR(25) NOT…
#POST 3 MIN READ
2016-01-20

云中制胜 – 记Oracle SPARC M7重磅来袭

即至农历春节前,Oracle终于完成其在中国最后一站 — 上海站的SPARC M7新产品宣讲。 作为一个坚定的Oracle粉,身居上海的我们自然也受到了会议邀请~。不过,和广大技术同胞不同的是,我们是以媒体人的身份来参加的,因此分支会议上会有些小小的不同:) 主题为《安“芯”防卫,智胜云端》的Oracle大会一如既往的座无虚席,虽然是产品介绍会,但是除了媒体之外,还是有非常多的IT技术人员到场听讲的。 也许是由于开场的时间稍有延后的关系,在Oracle中国区事业部的詹飞浪总经理做了简短的开幕致辞后,潘榆奇总监便开始了对Oracle SPARC M7的主题演讲。 此次Oracle力推的SPARC M7产品确实是一款Oracle的实力之作,诚如潘榆奇先生所言,Oracle的发展思路明确,”速度” -> “安全” -> “云”。 从软件到硬件的整合能力,到对一体机的长期投入研发,Oracle在其技术领域中一直处于标杆地位。现在Oracle更需要乘着云的东风,希望在硬件领域有更多突破。
#POST 5 MIN READ
2016-01-20

【MySQL学生手册】分区(Partition)

本文地址:https://www.askmaclean.com/archives/mysql-partition.html   第9章 分区(Partition)   章节概述 本章介绍在MySQL中分区的管理。你会了解: 理解分区概念 使用SHOW VARIABLES来确定服务端的分区支持 如何建立一张分区表 描述分区类型   9.1 分区概述 SQL标准中并不提供很多关于数据物理存储方面的指导。而SQL语句本身趋向于独立于数据结构或这些模式(schema/database),表,行或列下对应的介质进行运行。但是,大多数高级的数据库管理系统都会有一些方法来判断具体被用于存储的文件系统或硬件下的数据片的物理位置。在MySQL中,InnoDB存储引擎还支持表空间概念。在MySQL服务端,介绍分区之前,你可以配置不同的空物理目录来存储不同的数据库。 Tips:分区是从MySQL 5.1.14-Beta版本开始被引入的功能。   分区在此基础上更近一步,允许你在将单个表的各个部分分布在整个文件系统中(只要所设分区文件的大小遵守系统的规则)。实时上,一张表的不同部分可以如各个分割的表存储在不同位置。数据通过用户选择的规则进行的分割(我们称为分区功能),如按量值进行分区,或简单匹配一个值列范围进行分区,或使用内部哈希函数或一个线性函数进行分区等。如何分区由用户按分区类别来确定,其所用的功能匹配可以接受用户提供的表达式值作为参数,表达式可以是一个整型列值,或在对一个或多个列进行处理后来得出的一个整数来作为返回。表达式的值被传给分区功能函数,此函数会返回一个整数值代表了对应数据行应该被存放在哪个分区的分区号。此功能函数必须是非静态值和非随机值。它不能包含任何查询,但可以“虚拟的“使用在MySQL中有效的任意表达式(只要表达式返回的正整数小于最大可能的正整数值MAXVALUE即可)。…
#POST 6 MIN READ
2016-01-18

Oracle Acs资深顾问罗敏 老罗技术核心感悟:尝鲜Oracle 12c

作者为:  SHOUG成员 – ORACLE ACS高级顾问罗敏 尝鲜Oracle 12c 就在本书写作期间的2013年秋天,Oracle公司终于正式推出了令广大IT人士翘首以盼的12c数据库,c就是云(Cloud),意味着Oracle将12c定位为数据库云平台整体解决方案。 12c到底有哪些新特性和新技术?特别是在云计算方面有什么特色技术?在12c尚未正式推出的2013年春天,本人参加了一次公司内部的12c技术培训,发现12c林林总总的新特性真不少,但培训教材的前几章则在全面介绍两大技术领域:CDB/PDB架构和信息生命周期管理,可见这两大技术领域在数据库云平台和云计算方面的重要性。于是,本章也只涉足这两大技术领域,以及相关的实施案例。   新特性培训课的趣事 本人从2001年加入Oracle公司算起到2013年的12年间,Oracle数据库版本从9i一直发展到了12c,个人知识和能力也是伴随着Oracle技术的不断发展而共同进步。以下就是Oracle公司描述的最新几个版本的技术创新示意图:   在这12年间,本人也有幸参加了各个版本的新特性培训。记得在2001年参加9i新特性培训时,还是在国贸二座的Oracle大学一间大教室,公司内外听课者有数十人之众。而在2004年参加10g新特性培训时,人数就只有10余人了。再到2007年在上海Oracle大学参加11g新特性培训时,则只有区区3个人,其中包括本人在内的2位是Oracle内部员工,真正的客户就1位。而在2013年参加12c新特性培训时,也只有可怜的4个人,而且可能是因为12c尚未正式发布的缘故,4个人全部都是Oracle公司内部员工。 记得2007年在参加11g培训时,当老师按照教材一上来就介绍有关ASM新特性时,那位唯一的客户一听就傻眼了:“老师,什么叫ASM啊?”。原来他们的系统还运行在9i平台,尚未接触过10g,更未听说过什么ASM,呵呵。感慨:以后听这种新特性的课程,一定不能跨版本。IT技术发展太快了。 在本次连续5天的12c培训过程中,因工作等各种原因,包括本人在内的4位听课者或多或少缺席了一些课程。到培训的最后一天,其他同学因故都缺席了,老师就只对我一个人滔滔不绝了,但老师依然是非常职业地抑扬顿挫,搞得我都不好意思了:“老师,就我一个人了,您不用那么大声音了。”呵呵。但我一直坚持到最后做完课程的所有练习。 IT技术的确发展太快,搞得客户都有点跟不上这种高速发展的步伐了。但作为原厂技术服务人员,紧跟IT技术发展潮流,并及时抢占技术制高点其实是我们的基本职业诉求。 虽然说总体感觉12c相比以前版本而言,并未发生很多革命性的根本变化。例如像10g一样,新增加ASM、clusterware等架构性技术。但5天的培训课程,感觉12c还是推出了大量新特性。限于篇幅,也根据自身理解,将只介绍几个12c最重要的新特性,包括在架构方面的新变化和新技术:Container DB和Pluggable DB,以及在信息生命周期方面的新技术。…
#POST 48 MIN READ
2016-01-17

Hadoop概念

本文固定链接:https://www.askmaclean.com/archives/hadoop-concepts.html     Hadoop概念   应用程序经常需求,超过廉价(商品)机器上可用的更多资源。许多组织发现自己的业务流程不再适合在单一的、具有成本效益的计算机上进行。一个简单却昂贵的解决方案是购买耗费大量内存,并具有多个CPU的专门机器 。该解决方案可最快扩展至机器所支持的程度,但是唯一的限制因素通常是你的预算。另一种解决方案是建立一个高可用性集群,它通常试图看起来像一个单台机器,并且通常需要非常专业化的安装和管理服务。许多高可用性集群都是有版权并且昂贵的。   获取必要的计算资源的一种更经济的解决方案是云计算。一种常用模式是:那些需要被转换的批量数据,其中每个数据项的处理基本上独立于其他数据项;也就是说,通过使用单指令,多数据(SIMD )方案。Hadoop提供一个云计算的开源框架,以及一个分布式文件系统。 本书的设计意图是作为使用Hadoop,一个由Apache软件基金会主办的项目,来开发和运行软件的实用指南。本章将为你介绍Hadoop的核心概念。目的是为下一章的内容做准备,下一章中你将了解Hadoop的安装和运行(www.askmaclean.com)。   Hadoop介绍   Hadoop是以发表于2004年的有关MapReduce的Google文章为基础,其发展始于2005年。当时,Hadoop的开发是为了支持一个叫做Nutch的开源网络搜索引擎项目。最终,Hadoop从Nutch中分离出来,成为Apache基金会下自己的一个项目。 今天Hadoop是市场上最知名的MapReduce框架。目前,有几家围绕Hadoop的公司已经发展到提供Hadoop软件的支持、咨询和培训服务。 Hadoop的核心是一个基于Java的MapReduce框架。然而,由于Hadoop平台的迅速普及,支持非Java用户群体很有必要。Hadoop已经发展到拥有以下改进,和支持该群体的子项目,并将其范围扩大到企业。
#POST 37 MIN READ