服务热线:13616026886

技术文档 欢迎使用技术文档,我们为你提供从新手到专业开发者的所有资源,你也可以通过它日益精进

位置:首页 > 技术文档 > 数据库技术 > Oracle技术 > Oracle开发 > 查看文档

怎样解决cpu高度消耗(100%)的数据库问题 (1)

很多人在学习和工作中都曾遇到过服务器cpu消耗100%的性能问题,此类问题的产生原因一般都是因为系统中存在性能低下或者存在错误的sql语句。在这里我们通过一个实例介绍一个就如何捕获此类sql的常用方法.

系统cpu高度消耗,系统运行缓慢

os:sun solaris8
oracle:oracle9203

◆首先我们通过top命令来查看:

$ top

load averages:  1.61,  1.28,  1.25                     hswapjsdb             10:50:44
172 processes: 160 sleeping, 1 running, 3 zombie, 6 stopped, 2 on cpu
cpu states:     % idle,     % user,     % kernel,     % iowait,     % swap
memory: 4.0g real, 1.4g free, 1.9g swap in use, 8.9g swap free

   pid username thr pr nce  size   res state   time flts    cpu command
 20521 oracle     1 40   0  1.8g  1.7g run     6:37    0 47.77% oracle
 20845 oracle     1 40   0  1.8g  1.7g cpu02   0:41    0 40.98% oracle
 20847 oracle     1 58   0  1.8g  1.7g sleep   0:00    0  0.84% oracle
 20780 oracle     1 48   0  1.8g  1.7g sleep   0:02    0  0.83% oracle
 15828 oracle     1 58   0  1.8g  1.7g sleep   0:58    0  0.53% oracle
 20867 root       1 58   0 4384k 2560k sleep   0:00    0  0.29% sshd2
 20493 oracle     1 58   0  1.8g  1.7g sleep   0:03    0  0.29% oracle
 20887 oracle     1 48   0  1.8g  1.7g sleep   0:00    0  0.13% oracle
 20851 oracle     1 58   0  1.8g  1.7g sleep   0:00    0  0.10% oracle
 20483 oracle     1 48   0  1.8g  1.7g sleep   0:00    0  0.09% oracle
 20875 oracle     1 45   0 1064k  896k sleep   0:00    0  0.07% sh
 20794 oracle     1 58   0  1.8g  1.7g sleep   0:00    0  0.06% oracle
 20842 jiankong   1 52   2 1224k  896k sleep   0:00    0  0.05% sadc
 20888 oracle     1 55   0 1712k 1272k cpu00   0:00    0  0.05% top
 19954 oracle     1 58   0  1.8g  1.7g sleep  84:25    0  0.04% oracle

注释:现在你可以发现在进程列表里,存在两个高cpu耗用的oracle进程,他们分别消耗了47.77%和40.98%的cpu资源。

◆下一步找到存在问题的进程信息,以此确认它们是两个远程连接的用户进程。

$ ps -ef|grep 20521
  oracle 20909 20875  0 10:50:53 pts/10   0:00 grep 20521
  oracle 20521     1 47 10:43:59 ?        6:45 oraclejshs (local=no)
$ ps -ef|grep 20845
  oracle 20845     1 44 10:50:00 ?        0:55 oraclejshs (local=no)
  oracle 20918 20875  0 10:50:59 pts/10   0:00 grep 20845

◆下面我们再来看一下getsql.sql脚本

select   /*+ ordered */
         sql_text
    from v$sqltext a
   where (a.hash_value, a.address) in (
            select decode (sql_hash_value,
                           0, prev_hash_value,
                           sql_hash_value
                          ),
                   decode (sql_hash_value, 0, prev_sql_addr, sql_address)
              from v$session b
             where b.paddr = (select addr
                                from v$process c
                               where c.spid = '&pid'))
order by piece asc
/

注释:在此部分我们涉及了3个视图,并应用其关联进行数据获取。

首先我们需要输入一个pid,这个pid就是process id,也就是我们在top或ps中我们看到的pid.

注意,通过pid和v$process.spid相关联我们可以获得process的相关信息,进而通过v$process.addr和v$session.paddr相关联,我们即可以获得和session相关的所有信息.

然后再结合v$sqltext,就可以获得当前session正在执行的sql语句。

通过v$process视图,我们就以把操作系统和数据库关联起来了。

◆下面,我们来连接数据库,找到问题sql及进程

注释:通过top中我们观察到的pid,进而应用我的getsql脚本,得到了以下结果输出。

$ sqlplus "/ as sysdba"

sql*plus: release 9.2.0.3.0 - production on mon dec 29 10:52:14 2003

copyright (c) 1982, 2002, oracle corporation.  all rights reserved.


connected to:
oracle9i enterprise edition release 9.2.0.3.0 - 64bit production
with the partitioning, olap and oracle data mining options
jserver release 9.2.0.3.0 - production

sql> @getsql
enter value for spid: 20521
old  10: where c.spid = '&pid'
new  10: where c.spid = '20521'

sql_text
----------------------------------------------------------------
select * from (select vc2url,vc2pvdid,vc2mobile,vc2encryptflag,s
erviceid,vc2sub_type,cisorder,numguid,vc2key1, vc2needdisorder,v
c2packflag,datopertime from hsv_2cpsync where datopertime<=sysda
te and numguid>70000000000308 order by numguid) where rownum<=20

此时我们就可以做出结论,这段代码就是当前正在肆意消耗cpu的元凶.

下面我们需要找出这段代码的问题,看一看是否可以通过优化来提高其效率,减少资源消耗.

◆下一步则可以通过dbms_system包来跟踪该进程

sql> @getsid
enter value for spid: 20521
old 3: select addr from v$process where spid = &spid)
new 3: select addr from v$process where spid = 20521)

sid serial# username machine
----------------------------------------------------------------
45 38991 hsuser_v51 hswapjsptl1.hurray.com.cn


sql> exec dbms_system.set_sql_trace_in_session(45,38991,true);

pl/sql procedure successfully completed.

sql> !

扫描关注微信公众号