科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道浅谈DB2数据库故障处理及最佳实践

浅谈DB2数据库故障处理及最佳实践

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

当你在使用数据库时,可能会遇到各种不同的问题。本文描述常见的数据库故障,并给出了简单有效的解决方案。

作者:胡晶玉 来源:IT专家网 2008年6月4日

关键字: IBM 数据库 DB2

  • 评论
  • 分享微博
  • 分享邮件

2.数据库损坏

数据库最严重的问题莫过于数据库损坏,那么当数据库损坏时,最好的办法是从备份恢复数据库。如果无法从备份恢复,可以根据损坏的原因尝试相应的解决方案。

由于存储问题导致部分数据文件损坏,但是数据库还可以连接,这种情况可以采用导出数据库的表结果和数据的方法来恢复数据库。当然对损坏的表,导出是无法完成的,这是可以使用db2dart的导出数据功能来导出这些损坏的表的数据。

如果数据库损坏到已经无法连接的程度,那么除了从备份恢复,唯一的办法是使用db2dart来导出所有的数据了。

Tip:如何使用db2dart来导出数据
运行命令 db2dart <dbname> /DDEL
# Table object data formatting start.
# Please enter
# Table ID or name, tablespace ID, first page, num of pages:
# (suffic page number with 'p' for pool relative),
按照提示输入表名,表空间id,起始页数,需要导出的页数

3.数据库的活动日志被删除

这个问题经常会遇到。也属于数据库损坏的一种情况。并且数据库无法连接。

首先考虑是否有可以恢复的备份,如果有,可以从备份恢复,然后前滚到日志的末尾,可以完全恢复该数据库。如果没有可用的备份来恢复,可以通过IBM的技术支持中心来协助解决。如果想自己解决那只有使用db2dart工具了。

Tip:如何避免数据库的活动日志被删除
启用数据库的镜像日志功能
启用数据库的日志出口程序,这样可以避免手工来删除活动日志目录中的日志

当一定要手工删除活动日志目录中的归档日志时,使用命令 PRUNE LOGFILE PRIOR TO log-file-name,可以避免失误将活动日志删除

三、数据库性能问题

数据库的性能问题一般不属于故障,但是当性能问题变得很严重时,就变成了故障。

解决数据库的性能问题,可以从以下方面入手,检查数据库的配置,如缓冲池,排序堆等是否合理;检查数据库是否收集过统计信息,准确的统计信息对语句优化起着重要的左右;对sql语句进行优化;查看是否有系统资源瓶颈。

确认性能问题首先要从系统的资源消耗来分析,一般可以借助操作系统的工具,如aix的topas命令。数据库的性能问题一般的表现是应用变慢,甚至没有响应。

Tip:如何快速定位问题
如果系统的CPU利用很高,IO很少,那么数据库的排序较多
如果系统的IO繁忙,CPU很多是wait,那么说明数据库有过多的IO
如果系统CPU,IO都很空闲,那么说明可以是有锁的问题
如果系统IO,CPU都非常忙,说明有执行代价非常高的sql在执行
数据库一般有三类的性能问题,一是CPU占用过多,二是IO过于繁忙,三是有锁等待。

1.快速找到执行成本较高的sql

首先要打开监视器的开关
db2 update monitor switches using bufferpool on lock on sort on statement on table on uow on
在系统最繁忙的时候,运行
db2 get snapshot for all applications > app.out
然后在该文件中查找处于Executing状态的应用,找到执行的对应的sql语句。
如果用这种方法找不到,可以收集sql的快照
db2 get snapshot for dynamic sql on <dbname> > sql.out
这个快照记录了动态语句的快照信息,可以根据
Total execution time (sec.ms) = 0.000000
Total user cpu time (sec.ms) = 0.000000
Total system cpu time (sec.ms) = 0.000000
这些信息来找到最耗时的语句。

2.如何优化sql语句

DB2提供了很好的工具来做sql语句优化。首先要对找到的sql语句进行分析,看是否是该语句引起了性能问题。我们可以使用db2expln来查看sql语句的访问计划和执行成本。

首先将找到的sql语句写到一个文本文件中sql.in,以“;”结尾,然后运行
db2expln –d <dbname> -f <sql.in> -z “;” –g –o sql.exp
查看 sql.exp可以看到这个sql语句的执行成本。
如果确认该语句有问题,可以使用db2advis来通过建索引的方法来优化该语句
db2advis –d <dbname> -i sql.in
如果通过创建索引无法优化该语句,一般只能从业务角度优化。

3.如果发生锁的问题如何处理

发生锁的问题,一般有两种情况,一是锁等待,二是死锁。首先检查数据库配置参数locktimeout,该参数一定不能设为-1,因为会引起某些应用无限期的等待。

可以通过快照来确定数据库发生的问题是哪一种。
db2 get snapshot for db on <dbname>
查看输出中的下列内容:
Deadlocks detected = 0
Lock Timeouts = 0
如果发生了死锁,可以通过创建死锁监视器来分析产生死锁的原因,命令如下:
mkdir /tmp/dlmon
db2 connect to <db>
db2 create event monitor dlmon for deadlocks with detail write to file ‘/tmp/dlmon’ replace
db2 set event monitor dlmon state 1
…..等有死锁发生后
db2 set event monitor dlmon state 0
db2evmon –d /tmp/dlmon >/tmp/dlmon.out
分析/tmp/dlmon.out文件就可以找到造成死锁的信息,结合应用就可以找到造成死锁的原因了。

四、应用开发与数据库有关的问题

1.与64位实例数据库问题

目前随着硬件的升级,64位实例数据库开始广泛使用。有些人担心数据库使用64位以后,对程序的运行很大,因此不愿意使用64位的数据库,实际上64位数据库对客户的应用影响非常小,所以建议如果资源充足,尽量使用64位实例的数据库。可以通过创建一个32位实例的客户端,然后通过客户端来使用64位实例数据库的方法来将64位的问题完全忽略。如果使用java 存储过程或自定义函数,64位实例数据库需要安装64位的JDK。

2.从DB2 V7移植程序到V8有关问题

sqlc的应用程序中,数据类型long在V8中需要改成sqlint32,否则编译无法通过。如果确定long类型的数据长度与平台无关,也可以在编译时,指定LONGERROR NO选项。

在编译sqlc程序时可能会遇到sql20230的错误,原因是在V8中不允许在call中使用主机变量,将执行语句改成动态sql后,可以解决该问题。在执行存储过程时,遇到sql0433的错误,原因同上,将call 存储过程的语句改成动态调用即可。

3.Java程序问题

编写良好的程序是避免产生问题的关键。对JAVA程序有如下建议,一定要用数据库的连接池;在执行大量的sql语句时使用prepared statement。

结束语

本文描述常见的数据库故障,并给出了简单有效的解决方案。对某些技术问题,如命令的使用没有详细介绍,当需要时可以查阅DB2相关的文档。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章