|
【赛迪网-it技术报道】这篇论坛文章(赛迪网技术社区)主要针对oracle的普通表转换成分区表的解决方法进行了详尽的介绍,具体内容请参考下文。
在一个高可用系统中,如果需要改变一个表的定义是一件比较棘手的问题,尤其是对于7×24系统。oracle提供的基本语法基本可以满足一般性修改,但是对于把普通堆表改为分区表,把索引组织表修改为堆表等操作就无法完成了。而且,对于被大量dml语句访问的表,幸运的是,oracle从9i版本开始提供了在线重定义表功能,通过调用dbms_redefinition包,可以在修改表结构的同时允许dml操作。
在线重定义表具有以下功能:
修改表的存储参数;
可以将表转移到其他表空间;
增加并行查询选项;
增加或删除分区;
重建表以减少碎片;
将堆表改为索引组织表或相反的操作;
增加或删除一个列。
调用dbms_redefinition包需要execute_catalog_role角色,除此之外,还需要create any table、alter any table、drop any table、lock any table和select any table的权限。
在线重定义表的步骤如下:
1.选择一种重定义方法:
存在两种重定义方法,一种是基于主键、另一种是基于rowid。rowid的方式不能用于索引组织表,而且重定义后会存在隐藏列m_row$$。默认采用主键的方式。
2.调用dbms_redefinition.can_redef_table()过程,如果表不满足重定义的条件,将会报错并给出原因。
3.在用一个方案中建立一个空的中间表,根据重定义后你期望得到的结构建立中间表。比如:采用分区表,增加了column等。
4.调用dbms_redefinition.start_redef_table()过程,并提供下列参数:被重定义的表的名称、中间表的名称、列的映射规则、重定义方法。
如果映射方法没有提供,则认为所有包括在中间表中的列用于表的重定义。如果给出了映射方法,则只考虑映射方法中给出的列。如果没有给出重定义方法,则认为使用主键方式。
5.在中间表上建立触发器、索引和约束,并进行相应的授权。任何包含中间表的完整性约束应将状态置为disabled。
当重定义完成时,中间表上建立的触发器、索引、约束和授权将替换重定义表上的触发器、索引、约束和授权。中间表上disabled的约束将在重定义表上enable。
6.(可选)如果在执行dbms_redefinition.start_redef_table()过程和执行dbms_redefinition.finish_redef_table()过程直接在重定义表上执行了大量的dml操作,那么可以选择执行一次或多次的sync_interim_table()过程,以减少最后一步执行finish_redef_table()过程时的锁定时间。
7.执行dbms_redefinition.finish_redef_table()过程完成表的重定义。这个过程中,原始表会被独占模式锁定一小段时间,具体时间和表的数据量有关。
执行完finish_redef_table()过程后,原始表重定义后具有了中间表的属性、索引、约束、授权和触发器。中间表上disabled的约束在原始表上处于enabled状态。
8.(可选)可以重命名索引、触发器和约束。对于采用了rowid方式重定义的表,包括了一个隐含列m_row$$。推荐使用下列语句经隐含列置为unused状态或删除。
alter table table_name set unused (m_row$$);
alter table table_name drop unused columns;
下面是进行重定义操作后的结果:
原始表根据中间表的属性和特性进行重定义;
start_redef_table()和finish_redef_table()操作之间在中间表上建立的触发器、索引、约束和授权,现在定义在原始表上。中间表上disabled的约束在原始表上处于enabled状态。
原始表上定义的触发器、索引、约束和授权建立在中间表上,并会在删除中间表时删除。原始表上原来enabled状态的索引,建立在中间表上,并处于disabled状态。
任何定义在原始表上的存储过程和游标都会变为invalid,当下次调用时后自动进行编译。
如果执行过程中出现错误或者人为选择退出的话,可以执行dbms_redefinition.abort_redef_table()过程。
其中uname 参数是指用户;
oracle的普通表没有办法通过修改属性的方式直接转化为分区表,必须通过重建的方式进行转变,下面介绍三种效率比较高的方法,并说明它们各自的特点。
方法一:利用原表重建分区表
步骤:
sql> create table t (id number primary key, time date);
表已创建。
sql> insert into t select rownum, created from dba_objects;
已创建6264行。
sql> commit;
提交完成。
sql> create table t_new (id, time) partition by range (time)
2 (partition p1 values less than (to_date('2004-7-1', 'yyyy-mm-dd')),
3 partition p2 values less than (to_date('2005-1-1', 'yyyy-mm-dd')),
4 partition p3 values less than (to_date('2005-7-1', 'yyyy-mm-dd')),
5 partition p4 values less than (maxvalue))
6 as select id, time from t;
表已创建。
sql> rename t to t_old;
表已重命名。
sql> rename t_new to t;
表已重命名。
sql> select count(*) from t;
count(*)
----------
6264
sql> select count(*) from t partition (p1);
count(*)
----------
0
sql> select count(*) from t partition (p2);
count(*)
----------
6246
sql> select count(*) from t partition (p3);
count(*)
----------
18
优点:
方法简单易用,由于采用ddl语句,不会产生undo,且只产生少量redo,效率相对较高,而且建表完成后数据已经在分布到各个分区中了。
不足:
对于数据的一致性方面还需要额外的考虑。由于几乎没有办法通过手工锁定t表的方式保证一致性,在执行create table语句和rename t_new to t语句直接的修改可能会丢失,如果要保证一致性,需要在执行完语句后对数据进行检查,而这个代价是比较大的。另外在执行两个rename语句之间执行的对t的访问会失败。
适用于修改不频繁的表,在闲时进行操作,表的数据量不宜太大。
方法二:使用交换分区的方法
步骤:
sql> create table t (id number primary key, time date);
表已创建。
sql> insert into t select rownum, created from dba_objects;
已创建6264行。
sql> commit;
提交完成。
sql> create table t_new (id number primary key, time date) partition by range (time)
2 (partition p1 values less than (to_date('2005-7-1', 'yyyy-mm-dd')),
3 partition p2 values less than (maxvalue));
表已创建。
sql> alter table t_new exchange partition p1 with table t;
表已更改。
sql> rename t to t_old;
表已重命名。
sql> rename t_new to t;
表已重命名。
sql> select count(*) from t;
count(*)
----------
6264
优点:
只是对数据字典中分区和表的定义进行了修改,没有数据的修改或复制,效率最高。如果对数据在分区中的分布没有进一步要求的话,实现比较简单。在执行完rename操作后,可以检查t_old中是否存在数据,如果存在的话,直接将这些数据插入到t中,可以保证对t插入的操作不会丢失。
不足:
仍然存在一致性问题,交换分区之后rename t_new to t之前,查询、更新和删除会出现错误或访问不到数据。如果要求数据分布到多个分区中,则需要进行分区的split操作,会增加操作的复杂度,效率也会降低。
适用于包含大数据量的表转到分区表中的一个分区的操作。应尽量在闲时进行操作。
方法三:oracle9i以上版本,利用在线重定义功能
步骤:
sql> create table t (id number primary key, time date);
表已创建。
sql> insert into t select rownum, created from dba_objects;
已创建6264行。
sql> commit;
提交完成。
sql> exec dbms_redefinition.can_redef_table(user’, 't', dbms_redefinition.cons_use_pk);
pl/sql 过程已成功完成。
sql> create table t_new (id number primary key, time date) partition by range (time)
2 (partition p1 values less than (to_date('2004-7-1', 'yyyy-mm-dd')),
3 partition p2 values less than (to_date('2005-1-1', 'yyyy-mm-dd')),
4 partition p3 values less than (to_date('2005-7-1', 'yyyy-mm-dd')),
5 partition p4 values less than (maxvalue));
表已创建。
sql> exec dbms_redefinition.start_redef_table(‘user’, 't', 't_new', -
> 'id id, time time', dbms_redefinition.cons_use_pk);
可以改为:
sql> exec dbms_redefinition.start_redef_table(‘user’, 't', 't_new')
pl/sql 过程已成功完成。
sql> exec dbms_redefinition.sync_interim_table(‘user’, 't', 't_new')
现在,将中间表与原始表同步。(仅当要对表 t 进行更新时才需要执行该操作。)
sql> exec dbms_redefinition.finish_redef_table(user’, 't', 't_new');
pl/sql 过程已成功完成。
如果重组织失败,那么你就必须采取特殊的步骤来让它重新开始。由于重定义过程需要创建表格的快照,因此为了重新开始这一过程,你必须调用dbms_redefinition.abort_redef_table来释放快照。
dbms_redefinition.abort_redef_table过程有三个参数,即用户(schema)、原始表格(original table name)名称以及持有表格名称(holding table name)。它“出栈”并允许你开始重组织表格。
sql> select count(*) from t;
sql> select count(*) from t partition (p2);
sql> select count(*) from t partition (p3);
需要说明的是完成后,原表和中间表的结构也同时进行了交换,并且中间表里面有原表的数据备份。
优点:
保证数据的一致性,在大部分时间内,表t都可以正常进行dml操作。只在切换的瞬间锁表,具有很高的可用性。这种方法具有很强的灵活性,对各种不同的需要都能满足。而且,可以在切换前进行相应的授权并建立各种约束,可以做到切换完成后不再需要任何额外的管理操作。
不足:实现上比上面两种略显复杂,适用于各种情况。
然而,在线表格重定义也不是完美无缺的。下面列出了oracle9i重定义过程的部分限制:
你必须有足以维护两份表格拷贝的空间。
你不能更改主键栏。
表格必须有主键。
必须在同一个大纲中进行表格重定义。
在重定义操作完成之前,你不能对新加栏加以not null约束。
表格不能包含long、bfile以及用户类型(udt)。
不能重定义链表(clustered tables)。
不能在sys和system大纲中重定义表格。
不能用具体化视图日志(materialized view logs)来重定义表格;不能重定义含有具体化视图的表格。
不能在重定义过程中进行横向分集(horizontal subsetting)。
|