服务热线:13616026886

技术文档 欢迎使用技术文档,我们为你提供从新手到专业开发者的所有资源,你也可以通过它日益精进

位置:首页 > 技术文档 > 数据库技术 > Oracle技术 > DBA > 查看文档

oracle数据库中回滚监视的深入探讨

  同样,在回滚长期运行的事务时,经常会有些用户不停地询问相同的问题。这些问题是合理的,因为该事务进行了锁定,正常的处理经常受到回滚进程的影响。

  我们还在这地方吗?还要多长时间?

  听起来熟悉吗?这些问题可能是您在前往孩子们最喜爱的主题公园的路上,从汽车后座上提出来的,并且经常是不断地、越来越频繁地提出来。您不想告诉他们还确切需要多长时间吗 ― 或者更简单些,您自己知道答案吗?

  同样,在回滚长期运行的事务时,经常会有些用户不停地询问相同的问题。这些问题是合理的,因为该事务进行了锁定,正常的处理经常受到回滚进程的影响。

  在 oracle 9i database 及更低的版本中,您可以执行查询:

  select used_urec
  from v$transaction;

  该语句返回由当前事务所使用的重做记录的数量,而如果重复地执行该语句,将会显示连续减少的数值,因为回滚进程在其处理过程中会释放重做记录。随后您可以通过对一段间隔进行快照来计算其速率,然后推断出评估结束时间的结果。

  虽然在视图 v$transaction 中有一个名为 start_time 的列,但该列只显示整个事务的起始时间(也就是在回滚执行之前)。因此,除了推断,您没有办法知道回滚实际上是在什么时间执行的。

  事务回滚的扩展统计信息

  在 oracle database 10g 中,这种操作很简单。当事务回滚时,事件被记录在视图 v$session_longops 中,该视图显示长期运行的事务。用于回滚,如果进程耗时超过六秒,则记录出现在该视图中。在回滚执行以后,您可能会隐藏所查看的监视屏幕并执行以下的查询:

  select time_remaining
  from v$session_longops
  where sid = <sid of the session doing the rollback>;

  既然您意识到这个视图 v$session_longops 的重要性,就让我们来看它必须提供的其他信息。该视图在 oracle database 10g 的预览版中提供,但没有捕获关于回滚事务的信息。为了以一种易读的方式显示所有的列,我们将使用由 tom kyte 在 asktom.com 中所描述的 print_table 函数。此过程简单地以表格方式而不是常用的行方式来显示列。

  sql> set serveroutput on size 999999
  sql> exec print_table
    ('select * from v$session_longops where sid = 9')
  sid : 9
  serial#            : 68
  opname            :transaction rollback
  target            :
  target_desc          :xid:0x000e.01c.00000067
  sofar             : 20554
  totalwork           : 10234
  units             :blocks
  start_time          :07-dec-2003 21:20:07
  last_update_time       :07-dec-2003 21:21:24
  time_remaining        : 77
  elapsed_seconds        : 77
  context            : 0
  message            :transaction rollback:xid:
                                   0x000e.01c.00000067 :
  10234 out of 20554 blocks done
  username           :sys
  sql_address          :00000003b719ed08
  sql_hash_value        : 1430203031
  sql_id            :306w9c5amyanr
  qcsid             : 0

  注意,此处显示对行的所有更改,即使删除并重新插入行时也是如此。version_operation 列显示对该行执行的操作 (insert/update/delete)。完成这些操作不需要历史表或额外的列。

  让我们仔细检查这些列中的每一列。在会话中可能会有超过多个长期运行操作 ― 特别是因为视图中包含以前的会话中所有长期运行操作的历史。列 opname 显示该记录用于“事务回滚”,这为我们指出了正确的方向。列 time_remaining 显示所评估的剩余时间秒数,这在前面已经描述过,而列 elapsed_seconds 显示到目前为止所消耗的时间。

  那么该表如何提供对剩余时间的评估呢?可以在列 totalwork 中找到线索,该列显示要完成的“工作”总量,还有 sofar 显示到目前为止已经完成了多少工作。工作的单位显示在列 units 中。在本例中以数据块为单位;因此,到目前为止已经回滚了 20,554 个数据块中共计 10,234 个数据块。此操作到目前为止已消耗了 77 秒。因此,剩余数据块将消耗:

  77 * ( 10234 / (20554-10234) ) &#732; 77 秒

  但您不必利用这种方法来获得该数值,它已经清楚地显示出来了。最后,列 last_update_time 显示有关当前视图内容的时间,这将用于加强您对结果的解释。

  sql 语句

  另一部分重要的新信息是正在被回滚的 sql 语句的标识符。在早先,sql_address 和 sql_hash_value 用于获取正在被回滚的 sql 语句。新的列 sql_id 对应于视图 v$sql 的 sql_id,如下所示:

  select sql_text
  from v$sql
  where sql_id = <value of sql_id from v$session_longops>;

  该查询返回所回滚的语句,因此提供了额外的校验以及 sql 语句的地址和散列值。

  并行实例恢复

  如果 dml 操作是并行操作,则列 qcsid 显示并行查询服务器会话的 sid。在并行回滚事件中,如实例恢复以及随后的故障事务恢复期间,经常用到该信息经常。

  例如,假设在大型的更新期间,实例异常关闭。当实例启动时,发生故障的事务被回滚。如果启用了用于并行恢复的初始化参数值,则回滚并行地而不是串行地发生,如同它发生在常规事务回滚中一样。下一步的任务是评估回滚进程的完成时间。

  视图 v$fast_start_transactions 显示为回滚故障事务所产生的事务。类似的视图 v$fast_start_servers 显示对回滚进行处理的并行查询服务器的数量。这两个视图都在以前的版本中提供,但显示事务标识符的新列 xid 使得联接更方便了。在 oracle9i database 以及更低的版本中,您必须通过三列(usn ― 重做段号,slt ― 重做段中的存储区号,seq ― 序列号)来联接视图。其父集显示在 parentusn、parentslt 和 parentseq 中。在 oracle database 10g 中,您只需将其联接到 xid 列,其父 xid 由直观的名称表示:pxid。

  最有用的信息部分来自于 v$fast_start_transactions 视图中的列 rcvservers。如果发生并行回滚,则该列中显示并行查询服务器的数量。您可以查看该列,了解启动了多少并行查询进程:

select rcvservers from v$fast_start_transactions;

  如果输出是 1,则事务正在由 smon 进程进行串行回滚 ― 显然这是完成工作的一种不充分的方法。您可以将初始化参数 recovery_parallelism 的值改为除 0 或 1 以外的值,重新启动实例进行并行回滚。随后您可以执行 alter system set fast_start_parallel_rollback = high,按 cpu 数量的 4 倍创建并行服务器。

  如果上述查询的输出显示不是 1,则正在进行并行回滚。您可以查询同一视图 (v$fast_start_transactions) 来获得父事务和子事务(父事务 id ― pxid,而子事务 id ― xid)。xid 还可用于联接此视图与 v$fast_start_servers,以获得其他详细信息。

  结论

  总之,当在 oracle database 10g 中回滚长期运行的事务时 ― 无论是并行实例恢复会话还是用户执行的回滚语句 ― 您所需做的一切就是查看视图 v$session_longops 并评估还需要多少时间。


  

扫描关注微信公众号