oracle dba应该定期做什么!


载自oracle中文技术论坛。从整体上介绍了一个dba的职责和任务等等。
ORACLE数据库管理员应按如下方式对ORACLE数据库系统做定期监控:
(1). 每天对ORACLE数据库的运行状态,日志文件,备份情况,数据

库的空间使用情况,系统资源的使用情况进行检查,发现并解决

问题。

(2). 每周对数据库对象的空间扩展情况,数据的增长情况进行监控,对数据库做健康检查,对数据库对象的状态做检查。

(3). 每月对表和索引等进行Analyze,检查表空间碎片,寻找数据库

性能调整的机会,进行数据库性能调整,提出下一步空间管理

计划。对ORACLE数据库状态进行一次全面检查。

每天的工作

(1).确认所有的INSTANCE状态正常

登陆到所有数据库或例程,检测ORACLE后台进程:

$ps –ef|grep ora

(2). 检查文件系统的使用(剩余空间)。如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。

$df –k

(3). 检查日志文件和trace文件记录alert和trace文件中的错误。

连接到每个需管理的系统

? 使用’telnet’

? 对每个数据库,cd 到bdump目录,通常是$ORACLE_BASE/

  1<sid>/bdump   
  2  
  3? 使用 Unix ‘tail’命令来查看alert_<sid>.log文件   
  4  
  5? 如果发现任何新的ORA- 错误,记录并解决   
  6  
  7(4). 检查数据库当日备份的有效性。   
  8  
  9对RMAN备份方式:   
 10  
 11检查第三方备份工具的备份日志以确定备份是否成功   
 12  
 13对EXPORT备份方式:   
 14  
 15检查exp日志文件以确定备份是否成功   
 16  
 17对其他备份方式:   
 18  
 19检查相应的日志文件   
 20  
 21(5). 检查数据文件的状态记录状态不是“online”的数据文件,并做恢复。   
 22  
 23Select file_name from dba_data_files where status=’OFFLINE’   
 24  
 25(6). 检查表空间的使用情况   
 26  
 27SELECT tablespace_name, max_m, count_blocks free_blk_cnt, sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_free   
 28  
 29FROM ( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name),   
 30  
 31( SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m, count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM dba_free_space GROUP BY tablespace_name )   
 32  
 33WHERE tablespace_name = fs_ts_name   
 34  
 35(7). 检查剩余表空间   
 36  
 37SELECT tablespace_name, sum ( blocks ) as free_blk ,   
 38  
 39trunc ( sum ( bytes ) /(1024*1024) ) as free_m,   
 40  
 41max ( bytes ) / (1024) as big_chunk_k, count (*) as num_chunks   
 42  
 43FROM dba_free_space GROUP BY tablespace_name;   
 44  
 45(8). 监控数据库性能   
 46  
 47运行bstat/estat生成系统报告   
 48  
 49或者使用statspack收集统计数据   
 50  
 51(9). 检查数据库性能,记录数据库的cpu使用、IO、buffer命中率等等   
 52  
 53使用vmstat,iostat,glance,top等命令   
 54  
 55(10). 日常出现问题的处理。   
 56  
 57每周的工作   
 58  
 59(1). 控数据库对象的空间扩展情况   
 60  
 61根据本周每天的检查情况找到空间扩展很快的数据库对象,并采取相   
 62  
 63应的措施   
 64  
 65\-- 删除历史数据   
 66  
 67\--- 扩表空间   
 68  
 69alter tablespace <name> add datafile ‘<file>’ size <size>   
 70  
 71\--- 调整数据对象的存储参数   
 72  
 73next extent   
 74  
 75pct_increase   
 76  
 77(2). 监控数据量的增长情况   
 78  
 79根据本周每天的检查情况找到记录数量增长很快的数据库对象,并采   
 80  
 81取相应的措施   
 82  
 83\-- 删除历史数据   
 84  
 85\--- 扩表空间   
 86  
 87alter tablespace <name> add datafile ‘<file>’ size <size>   
 88  
 89(3). 系统健康检查   
 90  
 91检查以下内容:   
 92  
 93init<sid>.ora   
 94  
 95controlfile   
 96  
 97redo log file   
 98  
 99archiving   
100  
101sort area size   
102  
103tablespace(system,temporary,tablespace fragment)   
104  
105datafiles(autoextend,location)   
106  
107object(number of extent,next extent,index)   
108  
109rollback segment   
110  
111logging &amp;tracing(alert.log,max_dump_file_size,sqlnet)   
112  
113(4). 检查无效的数据库对象   
114  
115SELECT owner, object_name, object_type FROM dba_objects   
116  
117WHERE status=’INVALID’。   
118  
119(5). 检查不起作用的约束   
120  
121SELECT owner, constraint_name, table_name,   
122  
123constraint_type, status   
124  
125FROM dba_constraints   
126  
127WHERE status = 'DISABLED’ AND constraint_type = 'P'   
128  
129(6). 检查无效的trigger   
130  
131SELECT owner, trigger_name, table_name, status   
132  
133FROM dba_triggers   
134  
135WHERE status = 'DISABLED’   
136  
137每月的工作   
138  
139(1). Analyze Tables/Indexes/Cluster   
140  
141analyze table <name> estimate statistics sample 50 percent;   
142  
143(2). 检查表空间碎片   
144  
145根据本月每周的检查分析数据库碎片情况,找到相应的解决方法   
146  
147(3). 寻找数据库性能调整的机会   
148  
149比较每天对数据库性能的监控报告,确定是否有必要对数据库性能进 行调整   
150  
151(4). 数据库性能调整   
152  
153如有必要,进行性能调整   
154  
155(5). 提出下一步空间管理计划   
156  
157根据每周的监控,提出空间管理的改进方法   
158  
159Oracle DBA 日常管理   
160  
161目的:这篇文档有很详细的资料记录着对一个甚至更多的ORACLE 数据库每天的,每月的,   
162  
163每年的运行的状态的结果及检查的结果,在文档的附录中你将会看到所有检查,修改的SQL   
164  
165和PL/SQL 代码。   
166  
167目录   
168  
1691.日常维护程序   
170  
171A. 检查已起的所有实例   
172  
173B. 查找一些新的警告日志   
174  
175C. 检查DBSNMP 是否在运行   
176  
177D. 检查数据库备份是否正确   
178  
179E. 检查备份到磁带中的文件是否正确   
180  
181F. 检查数据库的性能是否正常合理,是否有足够的空间和资源   
182  
183G. 将文档日志复制到备份的数据库中   
184  
185H. 要常看DBA 用户手册   
186  
1872.晚间维护程序   
188  
189A.收集VOLUMETRIC 的数据   
190  
1913.每周维护工作   
192  
193A. 查找那些破坏规则的OBJECT   
194  
195B. 查找是否有违反安全策略的问题   
196  
197C. 查看错误地方的SQL*NET 日志   
198  
199D. 将所有的警告日志存档   
200  
201E. 经常访问供应商的主页   
202  
2034.月维护程序   
204  
205A. 查看对数据库会产生危害的增长速度   
206  
207B. 回顾以前数据库优化性能的调整   
208  
209C. 查看I/O 的屏颈问题   
210  
211D. 回顾FRAGMENTATION   
212  
213E. 将来的执行计划   
214  
215F. 查看调整点和维护   
216  
2175.附录   
218  
219A. 月维护过程   
220  
221B. 晚间维护过程   
222  
223C. 周维护过程   
224  
2256.参考文献   
226  
227\----------------------------------------------------------------   
228  
229一.日维护过程   
230  
231A.查看所有的实例是否已起   
232  
233确定数据库是可用的,把每个实例写入日志并且运行日报告或是运行测试   
234  
235文件。当然有一些操作我们是希望它能自动运行的。   
236  
237可选择执行:用ORACLE 管理器中的‘PROBE’事件来查看   
238  
239B.查找新的警告日志文件   
240  
2411\. 联接每一个操作管理系统   
242  
2432\. 使用‘TELNET’或是可比较程序   
244  
2453\. 对每一个管理实例,经常的执行$ORACLE_BASE/<sid>/bdump 操   
246  
247作,并使其能回退到控制数据库的SID。   
248  
2494\. 在提示下,使用UNIX 中的‘TAIL’命令查看alert_<sid>.log,或是   
250  
251用其他方式检查文件中最近时期的警告日志   
252  
2535\. 如果以前出现过的一些ORA_ERRORS 又出现,将它记录到数据库   
254  
255恢复日志中并且仔细的研究它们,这个数据库恢复日志在〈FILE〉中   
256  
257C.查看DBSNMP 的运行情况   
258  
259检查每个被管理机器的‘DBSNMP’进程并将它们记录到日志中。   
260  
261在UNIX 中,在命令行中,键入ps –ef | grep dbsnmp,将回看到2 个   
262  
263DBSNMP 进程在运行。如果没有,重启DBSNMP。   
264  
265D.查数据库备份是否成功   
266  
267E.检查备份的磁带文档是否成功   
268  
269F.检查对合理的性能来说是否有足够的资源   
270  
2711\. 检查在表空间中有没有剩余空间。   
272  
273对每一个实例来说,检查在表空间中是否存在有剩余空间来满足当天   
274  
275的预期的需要。当数据库中已有的数据是稳定的,数据日增长的平均   
276  
277数也是可以计算出来,最小的剩余空间至少要能满足每天数据的增 长。   
278  
279A) 运行‘FREE.SQL’来检查表空间的剩余空间。   
280  
281B) 运行‘SPACE.SQL’来检查表空间中的剩余空间百分率   
282  
2832\. 检查回滚段   
284  
285回滚段的状态一般是在线的,除了一些为复杂工作准备的专用 段,它一般状态是离线的。   
286  
287a) 每个数据库都有一个回滚段名字的列表。   
288  
289b) 你可以用V$ROLLSTAT 来查询在线或是离线的回滚段的现在状 态.   
290  
291c) 对于所有回滚段的存储参数及名字, 可用   
292  
293DBA_ROLLBACK_SEGS 来查询。但是它不如V$ROLLSTAT 准确。   
294  
2953\. 识别出一些过分的增长   
296  
297查看数据库中超出资源或是增长速度过大的段,这些段的存储参 数需要调整。   
298  
299a) 收集日数据大小的信息, 可以用   
300  
301‘ANALYZE5PCT.SQL’。如果你收集的是每晚的信息, 则可跳过这一步。   
302  
303b) 检查当前的范围,可用‘NR.EXTENTS.SQL’。   
304  
305c) 查询当前表的大小信息。   
306  
307d) 查询当前索引大小的信息。   
308  
309e) 查询增长趋势。   
310  
3114\. 确定空间的范围。   
312  
313如果范围空间对象的NEXT_EXTENT 比表空间所能提供的最大范   
314  
315围还要大,那么这将影响数据库的运行。如果我们找到了这个目标,可   
316  
317以用‘ALTER TABLESPACE COALESCE’调查它的位置,或加另外 的数据文件。   
318  
319A)运行‘SPACEBOUND.SQL’。如果都是正常的,将不返回任何行。   
320  
3215\. 回顾CPU,内存,网络,硬件资源论点的过程   
322  
323A)检查CPU的利用情况,进到x:.htm =&gt;system   
324  
325metrics=&gt;CPU 利用页,CPU 的最大限度为400,当CPU 的占用保持   
326  
327在350 以上有一段时间的话,我们就需要查看及研究出现的问题。   
328  
329G.将存档日志复制到备用数据库中   
330  
331如果有一个备用数据库,将适当的存档日志复制到备用数据库的期望   
332  
333位置,备用数据库中保存最近期的数据。   
334  
335H. 经常查阅DBA 用户手册   
336  
337如果有可能的话,要广泛的阅读,包括DBA 手册,行业杂志,新闻 组或是邮件列表。   
338  
339\-------------------------------------------------------------   
340  
341二.晚间维护过程   
342  
343大部分的数据库产品将受益于每晚确定的检查进程的运行。   
344  
345A. 收集VOLUMETRIC 数据   
346  
3471\. 分析计划和收集数据   
348  
349更准确的分析计算并保存结果。   
350  
351a) 如果你现在没有作这些的话,用‘MK VOLFACT.SQL’来创建测定体积的 表。   
352  
353b) 收集晚间数据大小的信息,用‘ANALYZE COMP.SQL’。   
354  
355c) 收集统计结果,用‘POP VOL.SQL’。   
356  
357d) 在空闲的时候检查数据,可能的话,每周或每个月进行。   
358  
359我是用MS EXCEL 和ODBC 的联接来检查数据和图表的增长   
360  
361\-------------------------------------------------------------   
362  
363三.每周维护过程   
364  
365A. 查找被破坏的目标   
366  
3671\. 对于每个给定表空间的对象来说,NEXT_EXTENT 的大小是相同的,如   
368  
36912/14/98,缺省的NEXT_EXTENT 的DATAHI 为1G,DATALO 为500MB,   
370  
371INDEXES 为256MB。   
372  
373A) 检查NEXT_EXTENT 的设置,可用‘NEXTEXT。SQL’。   
374  
375B) 检查已有的EXTENTS,可用‘EXISTEXT。SQL’。   
376  
3772\. 所有的表都应该有唯一的主键   
378  
379a) 查看那些表没有主键,可用‘NO_PK.SQL’。   
380  
381b) 查找那些主键是没有发挥作用的,可用‘DIS_PK.SQL’。   
382  
383c) 所有作索引的主键都要是唯一的,可用‘ NONUPK。SQL’来检 查。   
384  
3853\. 所有的索引都要放到索引表空间中。运行‘MKREBUILD_IDX。SQL’   
386  
3874\. 不同的环境之间的计划应该是同样的,特别是测试环境和成品环境之间的 计划应该相同。   
388  
389a) 检查不同的2 个运行环境中的数据类型是否一致,可用   
390  
391‘DATATYPE.SQL’。   
392  
393b) 在2 个不同的实例中寻找对象的不同点, 可用   
394  
395‘OBJ_COORD.SQL’。   
396  
397c) 更好的做法是,使用一种工具,象寻求软件的计划管理器那样的 工具。   
398  
399B. 查看是否有危害到安全策略的问题。   
400  
401C. 查看报错的SQL*NET 日志。   
402  
4031\. 客户端的日志。   
404  
4052\. 服务器端的日志。   
406  
407D..将所有的警告日志存档   
408  
409E..供应商的主页   
410  
4111\. ORACLE 供应商   
412  
413http://www.oracle.com   
414  
415http://technet.oracle.com   
416  
417http://www.oracle.com/support   
418  
419http://www.oramag.com   
420  
4212\. Quest Software   
422  
423http://www.quests.com   
424  
4253\. Sun Microsystems   
426  
427http://www.sun.com   
428  
429\----------------------------------------------------------------   
430  
431四.月维护过程   
432  
433A.查看对数据库会产生危害的增长速度   
434  
4351\. 从以前的记录或报告中回顾段增长的变化以此来确定段增长带来危害   
436  
437B. 回顾以前数据库优化性能的调整   
438  
4391\. 回顾一般ORACLE 数据库的调整点,比较以前的报告来确定有害的发展 趋势。   
440  
441C. 查看I/O 的屏颈问题   
442  
4431\. 查看前期数据库文件的活动性,比较以前的输出来判断有可能导致屏颈 问题的趋势。   
444  
445D. 回顾FRAGMENTATION   
446  
447E. 计划数据库将来的性能   
448  
4491\. 比较ORACLE 和操作系统的CPU,内存,网络,及硬盘的利用率以此   
450  
451来确定在近期将会有的一些资源争夺的趋势   
452  
4532\. 当系统将超出范围时要把性能趋势当作服务水平的协议来看   
454  
455F. 完成调整和维护工作   
456  
4571.使修改满足避免系统资源的争夺的需要,这里面包括增加新资源或使预期 的停工。   
458  
459\----------------------------------------------------------------</sid></sid></name></sid></size></file></name></size></file></name></sid></sid>
Published At
Categories with 数据库类
Tagged with
comments powered by Disqus