ORACLE坏块(ORA-01578)处理方法


ORACLE的坏块即ORA-01578错,同时还可能伴随ORA-01110错,这种错误对于初学者或是那些没有实践经验的dba来说无疑是很棘手的。我当初就深受其害,写下这篇文章则是希望对大家有所帮助。

一、出问题时的情景

1、 我的一个计费的入库的进程停掉,报的便是ORA-01578错,对应用相关的表tg_bill03做SQL>select from tg_cdr03 where rownum<10;这样是可以的,但做SQL>select count(*) from tg_bill03;时则报ORA-01578错。

2、 检查alter

 1<sid>.log中看到一几条报错信息:   
 2  
 3Errors in file /oracle816/app/admin/billing/udump/ora_7281_billing.trc:   
 4  
 5ORA-01578: ORACLE data block corrupted (file # 126, block # 88490)   
 6  
 7ORA-01110: data file 126: '/dev/vgjf7/rdata471'   
 8  
 9  
10  
11二、事后分析产生这种问题的原因   
12  
131、 十之八九这个Oracle的数据库server打开了异步I/O(async io)或增加了写进程。   
14  
152、 硬件的I/O出现了错误。   
16  
173、 操作系统的I/O或缓存出现我问题,比如操作系统对于异步I/O的补丁没有打。   
18  
194、 手动的修改了数据文件中的数据,我模拟这个错误用的便是这种方式。   
20  
21  
22  
23三、解决方法   
24  
25这种问题的解决方法是很多的,如果你用的是归档方式,则可以基于时间点恢复来解决。不过这里介绍一种比较方便的解决方式,因为我的库没有开归档。Metaline关于ORA-01578的文字也很多,不过我看过后总觉得都不那么实用,不能解决实际的问题。   
26  
271、 解决这种问题的第一步是首先你要确定是什么段、哪个段坏了,是索引还是表?   
28  
29A、 打开alter<sid>.log,找到ORA-01578的报错信息,并记录下file#及block的值,我这里是126和88490。   
30  
31B、 执行以下语句看哪个段坏了   
32  
33SQL&gt;Select * from dba_extents   
34  
352 where file_id=<f>   
36  
373 and <b> between block_id and block_id+blocks-1;   
38  
39这里的F指的是file#,B指的是block#   
40  
41我的显示结果指出是tg_bill03出现了坏块。   
42  
43  
44  
452、如果确定下来坏的是索引段,这时你就可以轻舒一口气了,只要把这个索相删除然后重建一下就可以了,如果出现坏的是表段,则应往下走了。   
46  
47  
48  
493、 记录下这个表的建表语句   
50  
51为我方便,建议使用PL/SQL Developer来完成,如果你没有可以在http://www.allroundautomations.com/plsqldev.html去下载一个,操作步骤是这样的。   
52  
53A、 以表的owner用pl/sql developer连入oracle   
54  
55B、 在左面的树状栏中找到这个表tg_bill03,右击该表-&gt;view-&gt;View SQL,记录下sql,以备以下步骤中重建索引。   
56  
574、 实际处理了,以我的那个表为例   
58  
59A、 以tg_bill03的owner连入oracle   
60  
61B、 使用诊断事件10231   
62  
63SQL&gt; ALTER SYSTEM SET EVENTS ‘10231 trace name context forever,level 10’;   
64  
65C、创建一个临时表tg_bill_tmp的表中除坏块的数据都检索出来   
66  
67SQL&gt;CREATE TABLE tg_bill03_tmp as select * from tg_bill03;   
68  
69C、 更名原表,并把tg_bill03_tmp为tg_bill03   
70  
71SQL&gt;alter table tg_bill03 rename to tg_bill03_bak;   
72  
73SQL&gt;alter table tg_bill03_tmp to tg_bill03;   
74  
75D、在tg_bill03上重新创建索引、约束、授权、trigger等对象   
76  
77E、 利用表之间的业务关系,把坏块中的数据补足。   
78  
79  
80  
81四、如何尽量减少问题及问题的损失呢   
82  
83分析了产生问题的原因,我认为可以采取以下几个措施   
84  
851、 在为提高性能为操作系统打开异步I/O时,一定要与oracle及操作系统技术支持联系把操作系统与异步I/O相关的补丁要打全。   
86  
872、 制定一个良好的备份恢复策略,最好有表的exp备份   
88  
893、 要及时的检查硬件的状态,及时更换驱动器部件。   
90  
91  
92  
93结篇:其实坏块涉及的内容很多的,如果坏块发生的回滚段表空间、数据字典(system表空间)或联机日志,这些处理都是特难的,需要与oracle的supporter联系。不过这些方面的坏的机率很少很少的,在以后的文章中我也会做介绍。</b></f></sid></sid>
Published At
Categories with 数据库类
comments powered by Disqus