高水位线(hwl)下的许多数据块都是无数据的,但全表扫描的时候要扫描到高水位线的数据块,也就是说oracle要做许多的无用功!因此oracle提供了shrink space碎片整理功能。对于索引,可以采取rebuild online的方式进行碎片整理,一般来说,经常进行dml操作的对象dba要定期进行维护,同时注意要及时更新统计信息!
一:准备测试数据,使用hr用户,创建t1表,插入约30w的数据,并根据object_id创建普通索引,表占存储空间34m
复制代码 代码如下:
sql> conn /as sysdba
已连接。
sql> select default_tablespace from dba_users where username=’hr’;
default_tablespace
————————————————————
users
sql> conn hr/hr
已连接。
sql> insert into t1 select * from t1;
已创建 74812 行。
sql> insert into t1 select * from t1;
已创建 149624 行。
sql> commit;
提交完成。
sql> create index idx_t1_id on t1(object_id);
索引已创建。
sql> exec dbms_stats.gather_table_stats(‘hr’,’t1′,cascade=>true);
pl/sql 过程已成功完成。
sql> select count(1) from t1;
count(1)
———-
299248
sql> select sum(bytes)/1024/1024 from dba_segments where segment_name=’t1′;
sum(bytes)/1024/1024
——————–
34.0625
sql> select sum(bytes)/1024/1024 from dba_segments where segment_name=’idx_t1_id’;
sum(bytes)/1024/1024
——————–
6
二:估算表在高水位线下还有多少空间可用,这个值应当越低越好,表使用率越接近高水位线,全表扫描所做的无用功也就越少!
dbms_stats包无法获取empty_blocks统计信息,所以需要用analyze命令再收集一次统计信息
复制代码 代码如下:
sql> select blocks, empty_blocks, num_rows from user_tables where table_name =’t1′;
blocks empty_blocks num_rows
———- ———— ———-
4302 0 299248
sql> analyze table t1 compute statistics;
表已分析。
sql> select blocks, empty_blocks, num_rows from user_tables where table_name =’t1′;
blocks empty_blocks num_rows
———- ———— ———-
4302 50 299248
sql> col table_name for a20
sql> select table_name,
2 (blocks * 8192 / 1024 / 1024) –
3 (num_rows * avg_row_len / 1024 / 1024) “data lower than hwm in mb”
4 from user_tables
5 where table_name = ‘t1’;
table_name data lower than hwm in mb
——————– ————————-
t1 5.07086182
三: 查看执行计划,全表扫描大概需要消耗cpu 1175
复制代码 代码如下:
sql> explain plan for select * from t1;
已解释。
sql> select * from table(dbms_xplan.display);
plan_table_output
——————————————————————————–
plan hash value: 3617692013
————————————————————————–
| id | operation | name | rows | bytes | cost (%cpu)| time |
————————————————————————–
| 0 | select statement | | 299k| 28m| 1175 (1)| 00:00:15 |
| 1 | table access full| t1 | 299k| 28m| 1175 (1)| 00:00:15 |
————————————————————————–
四:删除大部分数据,收集统计信息,全表扫描依然需要消耗cpu 1168
复制代码 代码如下:
sql> delete from t1 where object_id>100;
已删除298852行。
sql> commit;
提交完成。
sql> select count(*) from t1;
count(*)
———-
396
sql> exec dbms_stats.gather_table_stats(‘hr’,’t1′,cascade=>true);
pl/sql 过程已成功完成。
sql> analyze table t1 compute statistics;
表已分析。
sql> select blocks, empty_blocks, num_rows from user_tables where table_name =’t1′;
blocks empty_blocks num_rows
———- ———— ———-
4302 50 396
sql> explain plan for select * from t1;
已解释。
sql> select * from table(dbms_xplan.display);
plan_table_output
——————————————————————————
plan hash value: 3617692013
————————————————————————–
| id | operation | name | rows | bytes | cost (%cpu)| time |
————————————————————————–
| 0 | select statement | | 396 | 29700 | 1168 (1)| 00:00:15 |
| 1 | table access full| t1 | 396 | 29700 | 1168 (1)| 00:00:15 |
————————————————————————–
五:估算表在高水位线下还有多少空间是无数据的,但在全表扫描时又需要做无用功的数据
复制代码 代码如下:
sql> select table_name,
2 (blocks * 8192 / 1024 / 1024) –
3 (num_rows * avg_row_len / 1024 / 1024) “data lower than hwm in mb”
4 from user_tables
5 where table_name = ‘t1’;
table_name data lower than hwm in mb
——————– ————————-
t1 33.5791626
六:对表进行碎片整理,重新收集统计信息
复制代码 代码如下:
sql> alter table t1 enable row movement;
表已更改。
sql> alter table t1 shrink space cascade;
表已更改。
sql> select sum(bytes)/1024/1024 from dba_segments where segment_name=’t1′;
sum(bytes)/1024/1024
——————–
.125
sql> select sum(bytes)/1024/1024 from dba_segments where segment_name=’idx_t1_id
‘;
sum(bytes)/1024/1024
——————–
.0625
sql> select table_name,
2 (blocks * 8192 / 1024 / 1024) –
3 (num_rows * avg_row_len / 1024 / 1024) “data lower than hwm in mb”
4 from user_tables
5 where table_name = ‘t1’;
table_name data lower than hwm in mb
——————– ————————-
t1 33.5791626
sql> exec dbms_stats.gather_table_stats(‘hr’,’t1′,cascade=>true);
pl/sql 过程已成功完成。
这个时候,只剩下0.1m的无用功了,执行计划中,全表扫描也只需要消耗cpu 3
sql> select table_name,
2 (blocks * 8192 / 1024 / 1024) –
3 (num_rows * avg_row_len / 1024 / 1024) “data lower than hwm in mb”
4 from user_tables
5 where table_name = ‘t1’;
table_name data lower than hwm in mb
——————– ————————-
t1 .010738373
sql> select * from table(dbms_xplan.display);
plan_table_output
——————————————————————————–
plan hash value: 3617692013
————————————————————————–
| id | operation | name | rows | bytes | cost (%cpu)| time |
————————————————————————–
| 0 | select statement | | 396 | 29700 | 3 (0)| 00:00:01 |
| 1 | table access full| t1 | 396 | 29700 | 3 (0)| 00:00:01 |
————————————————————————–
总共只有5个块,空块却有50个,明显empty_blocks信息过期
sql> select blocks,empty_blocks,num_rows from user_tables where table_name=’t1′;
blocks empty_blocks num_rows
———- ———— ———-
5 50 396
sql> analyze table t1 compute statistics;
表已分析。
sql> select blocks,empty_blocks,num_rows from user_tables where table_name=’t1′;
blocks empty_blocks num_rows
———- ———— ———-
5 3 396