Oracle 数据表分区的策略

正在看的oracle教程是:oracle 数据表分区的策略。本文描述通过统计分析出医院信息系统需分区的表，对需分区的表选择分区键，即找出包括在你的分区键中的列(表的属性)，对大型数据的管理比较有意义，本文的工作在oracle8.1.6下实现。

　　oracle虽然是一个大型的dbms，但如果不对记录比较多的表进行处理，仍然发挥不了oracle管理大型数据的强大功能，因此对某些表进行分区，具有如下优点：

　　分区表中每个分区可以在逻辑上认为是一个独立的对象；

　　可以在一个表中的一个或多个分区上进行如删除、移动、析分等维护操作，而不会影响其它分区，具有分区独立性；

　　如果选择合适的分区策略，会大大的加快数据的查询速度。

　　一找出需分区的表

　　本节描述通过统计分析出医院his系统需分区的表，对需分区的表找出包括在你的分区键中的列(表的属性)，即选择分区键。

　　1、基于访问频度找出需分区的表

　　oracle8i允许访问数据库中的审核信息，借助于收集的审核信息，设计者能够确定哪些表的数据是真正最频繁访问的，即找出那些表，需要进行分区。

　　打开审核：在作为sys或sysstem登录到数据库后，动行如下脚本，打开对象的审核功能。

　　这些代码的运行将产生“audon.sql”的输出文件，它包含下面清单中所示格式的语句

　　使用命令@audon.sql激活上述代码以打开审核功能收集收集审核信息，建立一个表以保存概要信息：

　　将审核信息从dba_audit_object表中取出并装入概要表中：

　　关闭审核：

　　这些代码的运行将产生“audoff.sql”的输出文件。

　　使用命令@ audoff.sql激活上述代码以关闭上述对象的审核功能。

　　清除审核信息：

　　分析审核信息

　　以上是his系统临床医嘱部分24小时内对表的访问情况，从上面的查询得表1-1。

　　表1-1

　　group_order_master( 医嘱套攴主记录) 、group_order_item(医嘱套攴明细)，表的行数比较少，不适合分区；drug_stock（药品库存）虽然存取频率比较高，但表的行数比较少，因此也不适合分区。我们选择表的行数比较多、存取频率比较高的表作分区处理，如 doctor_orders、orders、orders_costs，考虑到doctor_orders是医生工作站上医生开的医嘱，orders是由doctor_orders生成、护士工作站上执行的医嘱，两个表结构类似，而医嘱与药品、卫生材料、计费联系比较密切的是orders，因此重点介绍对表orders的处理。

　　2、基于列值选择分区键

　　使用sql*plus下用命令analyze收集末分区表的统计信息，按照oracle推荐的取样20%进行分析，并将统计结果保存在数据字典中。

　　对dba_tab_columns数据字典视图进行查询

　　产生表1-2

　　表1-2

　　从表1-2中，我们可以看到欲分区表的各个候选分区键的分布频谱，order_code（医嘱代码）键值没有出现一种均匀分布，用它作分区键，明显不合适；

　　order_class（医嘱类别代码）、ordering_dept（开医嘱科室代码），键值出现均匀分布，如用它的各个键值作基于范围的分区，每个分区具有的记录数比较均匀，但这种方法对于每天增加上万条记录的表来看，显然不是最优的。如果选用start_date_time（医嘱开始时间）建立范围分区，每月的数据建立一个分区，在每个分区内基于ordering_dept建立散列子分区，每月的数据形成一个组合分区，会使每个分区的记录数分布均匀、查询速度提高、易于备份和删除。因为大多数的统计和查询是在一个月的范围内，而且从实际的查询效果看，跨月和跨年数据的统计和查询速度，也比未分区的时候大大缩短，效果非常明显。

Oracle 数据表分区的策略

相关推荐