载自oracle中文技术论坛。从整体上介绍了一个dba的职责和任务等等。
ORACLE数据库管理员应按如下方式对ORACLE数据库系统做定期监控:
(1). 每天对ORACLE数据库的运行状态,日志文件,备份情况,数据
库的空间使用情况,系统资源的使用情况进行检查,发现并解决
问题。
(2). 每周对数据库对象的空间扩展情况,数据的增长情况进行监控,对数据库做健康检查,对数据库对象的状态做检查。
(3). 每月对表和索引等进行Analyze,检查表空间碎片,寻找数据库
性能调整的机会,进行数据库性能调整,提出下一步空间管理
计划。对ORACLE数据库状态进行一次全面检查。
每天的工作
(1).确认所有的INSTANCE状态正常
登陆到所有数据库或例程,检测ORACLE后台进程:
$ps –ef|grep ora
(2). 检查文件系统的使用(剩余空间)。如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。
$df –k
(3). 检查日志文件和trace文件记录alert和trace文件中的错误。
连接到每个需管理的系统
? 使用’telnet’
? 对每个数据库,cd 到bdump目录,通常是$ORACLE_BASE/
1<sid>/bdump
2
3? 使用 Unix ‘tail’命令来查看alert_<sid>.log文件
4
5? 如果发现任何新的ORA- 错误,记录并解决
6
7(4). 检查数据库当日备份的有效性。
8
9对RMAN备份方式:
10
11检查第三方备份工具的备份日志以确定备份是否成功
12
13对EXPORT备份方式:
14
15检查exp日志文件以确定备份是否成功
16
17对其他备份方式:
18
19检查相应的日志文件
20
21(5). 检查数据文件的状态记录状态不是“online”的数据文件,并做恢复。
22
23Select file_name from dba_data_files where status=’OFFLINE’
24
25(6). 检查表空间的使用情况
26
27SELECT tablespace_name, max_m, count_blocks free_blk_cnt, sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_free
28
29FROM ( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name),
30
31( SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m, count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM dba_free_space GROUP BY tablespace_name )
32
33WHERE tablespace_name = fs_ts_name
34
35(7). 检查剩余表空间
36
37SELECT tablespace_name, sum ( blocks ) as free_blk ,
38
39trunc ( sum ( bytes ) /(1024*1024) ) as free_m,
40
41max ( bytes ) / (1024) as big_chunk_k, count (*) as num_chunks
42
43FROM dba_free_space GROUP BY tablespace_name;
44
45(8). 监控数据库性能
46
47运行bstat/estat生成系统报告
48
49或者使用statspack收集统计数据
50
51(9). 检查数据库性能,记录数据库的cpu使用、IO、buffer命中率等等
52
53使用vmstat,iostat,glance,top等命令
54
55(10). 日常出现问题的处理。
56
57每周的工作
58
59(1). 控数据库对象的空间扩展情况
60
61根据本周每天的检查情况找到空间扩展很快的数据库对象,并采取相
62
63应的措施
64
65\-- 删除历史数据
66
67\--- 扩表空间
68
69alter tablespace <name> add datafile ‘<file>’ size <size>
70
71\--- 调整数据对象的存储参数
72
73next extent
74
75pct_increase
76
77(2). 监控数据量的增长情况
78
79根据本周每天的检查情况找到记录数量增长很快的数据库对象,并采
80
81取相应的措施
82
83\-- 删除历史数据
84
85\--- 扩表空间
86
87alter tablespace <name> add datafile ‘<file>’ size <size>
88
89(3). 系统健康检查
90
91检查以下内容:
92
93init<sid>.ora
94
95controlfile
96
97redo log file
98
99archiving
100
101sort area size
102
103tablespace(system,temporary,tablespace fragment)
104
105datafiles(autoextend,location)
106
107object(number of extent,next extent,index)
108
109rollback segment
110
111logging &tracing(alert.log,max_dump_file_size,sqlnet)
112
113(4). 检查无效的数据库对象
114
115SELECT owner, object_name, object_type FROM dba_objects
116
117WHERE status=’INVALID’。
118
119(5). 检查不起作用的约束
120
121SELECT owner, constraint_name, table_name,
122
123constraint_type, status
124
125FROM dba_constraints
126
127WHERE status = 'DISABLED’ AND constraint_type = 'P'
128
129(6). 检查无效的trigger
130
131SELECT owner, trigger_name, table_name, status
132
133FROM dba_triggers
134
135WHERE status = 'DISABLED’
136
137每月的工作
138
139(1). Analyze Tables/Indexes/Cluster
140
141analyze table <name> estimate statistics sample 50 percent;
142
143(2). 检查表空间碎片
144
145根据本月每周的检查分析数据库碎片情况,找到相应的解决方法
146
147(3). 寻找数据库性能调整的机会
148
149比较每天对数据库性能的监控报告,确定是否有必要对数据库性能进 行调整
150
151(4). 数据库性能调整
152
153如有必要,进行性能调整
154
155(5). 提出下一步空间管理计划
156
157根据每周的监控,提出空间管理的改进方法
158
159Oracle DBA 日常管理
160
161目的:这篇文档有很详细的资料记录着对一个甚至更多的ORACLE 数据库每天的,每月的,
162
163每年的运行的状态的结果及检查的结果,在文档的附录中你将会看到所有检查,修改的SQL
164
165和PL/SQL 代码。
166
167目录
168
1691.日常维护程序
170
171A. 检查已起的所有实例
172
173B. 查找一些新的警告日志
174
175C. 检查DBSNMP 是否在运行
176
177D. 检查数据库备份是否正确
178
179E. 检查备份到磁带中的文件是否正确
180
181F. 检查数据库的性能是否正常合理,是否有足够的空间和资源
182
183G. 将文档日志复制到备份的数据库中
184
185H. 要常看DBA 用户手册
186
1872.晚间维护程序
188
189A.收集VOLUMETRIC 的数据
190
1913.每周维护工作
192
193A. 查找那些破坏规则的OBJECT
194
195B. 查找是否有违反安全策略的问题
196
197C. 查看错误地方的SQL*NET 日志
198
199D. 将所有的警告日志存档
200
201E. 经常访问供应商的主页
202
2034.月维护程序
204
205A. 查看对数据库会产生危害的增长速度
206
207B. 回顾以前数据库优化性能的调整
208
209C. 查看I/O 的屏颈问题
210
211D. 回顾FRAGMENTATION
212
213E. 将来的执行计划
214
215F. 查看调整点和维护
216
2175.附录
218
219A. 月维护过程
220
221B. 晚间维护过程
222
223C. 周维护过程
224
2256.参考文献
226
227\----------------------------------------------------------------
228
229一.日维护过程
230
231A.查看所有的实例是否已起
232
233确定数据库是可用的,把每个实例写入日志并且运行日报告或是运行测试
234
235文件。当然有一些操作我们是希望它能自动运行的。
236
237可选择执行:用ORACLE 管理器中的‘PROBE’事件来查看
238
239B.查找新的警告日志文件
240
2411\. 联接每一个操作管理系统
242
2432\. 使用‘TELNET’或是可比较程序
244
2453\. 对每一个管理实例,经常的执行$ORACLE_BASE/<sid>/bdump 操
246
247作,并使其能回退到控制数据库的SID。
248
2494\. 在提示下,使用UNIX 中的‘TAIL’命令查看alert_<sid>.log,或是
250
251用其他方式检查文件中最近时期的警告日志
252
2535\. 如果以前出现过的一些ORA_ERRORS 又出现,将它记录到数据库
254
255恢复日志中并且仔细的研究它们,这个数据库恢复日志在〈FILE〉中
256
257C.查看DBSNMP 的运行情况
258
259检查每个被管理机器的‘DBSNMP’进程并将它们记录到日志中。
260
261在UNIX 中,在命令行中,键入ps –ef | grep dbsnmp,将回看到2 个
262
263DBSNMP 进程在运行。如果没有,重启DBSNMP。
264
265D.查数据库备份是否成功
266
267E.检查备份的磁带文档是否成功
268
269F.检查对合理的性能来说是否有足够的资源
270
2711\. 检查在表空间中有没有剩余空间。
272
273对每一个实例来说,检查在表空间中是否存在有剩余空间来满足当天
274
275的预期的需要。当数据库中已有的数据是稳定的,数据日增长的平均
276
277数也是可以计算出来,最小的剩余空间至少要能满足每天数据的增 长。
278
279A) 运行‘FREE.SQL’来检查表空间的剩余空间。
280
281B) 运行‘SPACE.SQL’来检查表空间中的剩余空间百分率
282
2832\. 检查回滚段
284
285回滚段的状态一般是在线的,除了一些为复杂工作准备的专用 段,它一般状态是离线的。
286
287a) 每个数据库都有一个回滚段名字的列表。
288
289b) 你可以用V$ROLLSTAT 来查询在线或是离线的回滚段的现在状 态.
290
291c) 对于所有回滚段的存储参数及名字, 可用
292
293DBA_ROLLBACK_SEGS 来查询。但是它不如V$ROLLSTAT 准确。
294
2953\. 识别出一些过分的增长
296
297查看数据库中超出资源或是增长速度过大的段,这些段的存储参 数需要调整。
298
299a) 收集日数据大小的信息, 可以用
300
301‘ANALYZE5PCT.SQL’。如果你收集的是每晚的信息, 则可跳过这一步。
302
303b) 检查当前的范围,可用‘NR.EXTENTS.SQL’。
304
305c) 查询当前表的大小信息。
306
307d) 查询当前索引大小的信息。
308
309e) 查询增长趋势。
310
3114\. 确定空间的范围。
312
313如果范围空间对象的NEXT_EXTENT 比表空间所能提供的最大范
314
315围还要大,那么这将影响数据库的运行。如果我们找到了这个目标,可
316
317以用‘ALTER TABLESPACE COALESCE’调查它的位置,或加另外 的数据文件。
318
319A)运行‘SPACEBOUND.SQL’。如果都是正常的,将不返回任何行。
320
3215\. 回顾CPU,内存,网络,硬件资源论点的过程
322
323A)检查CPU的利用情况,进到x:.htm =>system
324
325metrics=>CPU 利用页,CPU 的最大限度为400,当CPU 的占用保持
326
327在350 以上有一段时间的话,我们就需要查看及研究出现的问题。
328
329G.将存档日志复制到备用数据库中
330
331如果有一个备用数据库,将适当的存档日志复制到备用数据库的期望
332
333位置,备用数据库中保存最近期的数据。
334
335H. 经常查阅DBA 用户手册
336
337如果有可能的话,要广泛的阅读,包括DBA 手册,行业杂志,新闻 组或是邮件列表。
338
339\-------------------------------------------------------------
340
341二.晚间维护过程
342
343大部分的数据库产品将受益于每晚确定的检查进程的运行。
344
345A. 收集VOLUMETRIC 数据
346
3471\. 分析计划和收集数据
348
349更准确的分析计算并保存结果。
350
351a) 如果你现在没有作这些的话,用‘MK VOLFACT.SQL’来创建测定体积的 表。
352
353b) 收集晚间数据大小的信息,用‘ANALYZE COMP.SQL’。
354
355c) 收集统计结果,用‘POP VOL.SQL’。
356
357d) 在空闲的时候检查数据,可能的话,每周或每个月进行。
358
359我是用MS EXCEL 和ODBC 的联接来检查数据和图表的增长
360
361\-------------------------------------------------------------
362
363三.每周维护过程
364
365A. 查找被破坏的目标
366
3671\. 对于每个给定表空间的对象来说,NEXT_EXTENT 的大小是相同的,如
368
36912/14/98,缺省的NEXT_EXTENT 的DATAHI 为1G,DATALO 为500MB,
370
371INDEXES 为256MB。
372
373A) 检查NEXT_EXTENT 的设置,可用‘NEXTEXT。SQL’。
374
375B) 检查已有的EXTENTS,可用‘EXISTEXT。SQL’。
376
3772\. 所有的表都应该有唯一的主键
378
379a) 查看那些表没有主键,可用‘NO_PK.SQL’。
380
381b) 查找那些主键是没有发挥作用的,可用‘DIS_PK.SQL’。
382
383c) 所有作索引的主键都要是唯一的,可用‘ NONUPK。SQL’来检 查。
384
3853\. 所有的索引都要放到索引表空间中。运行‘MKREBUILD_IDX。SQL’
386
3874\. 不同的环境之间的计划应该是同样的,特别是测试环境和成品环境之间的 计划应该相同。
388
389a) 检查不同的2 个运行环境中的数据类型是否一致,可用
390
391‘DATATYPE.SQL’。
392
393b) 在2 个不同的实例中寻找对象的不同点, 可用
394
395‘OBJ_COORD.SQL’。
396
397c) 更好的做法是,使用一种工具,象寻求软件的计划管理器那样的 工具。
398
399B. 查看是否有危害到安全策略的问题。
400
401C. 查看报错的SQL*NET 日志。
402
4031\. 客户端的日志。
404
4052\. 服务器端的日志。
406
407D..将所有的警告日志存档
408
409E..供应商的主页
410
4111\. ORACLE 供应商
412
413http://www.oracle.com
414
415http://technet.oracle.com
416
417http://www.oracle.com/support
418
419http://www.oramag.com
420
4212\. Quest Software
422
423http://www.quests.com
424
4253\. Sun Microsystems
426
427http://www.sun.com
428
429\----------------------------------------------------------------
430
431四.月维护过程
432
433A.查看对数据库会产生危害的增长速度
434
4351\. 从以前的记录或报告中回顾段增长的变化以此来确定段增长带来危害
436
437B. 回顾以前数据库优化性能的调整
438
4391\. 回顾一般ORACLE 数据库的调整点,比较以前的报告来确定有害的发展 趋势。
440
441C. 查看I/O 的屏颈问题
442
4431\. 查看前期数据库文件的活动性,比较以前的输出来判断有可能导致屏颈 问题的趋势。
444
445D. 回顾FRAGMENTATION
446
447E. 计划数据库将来的性能
448
4491\. 比较ORACLE 和操作系统的CPU,内存,网络,及硬盘的利用率以此
450
451来确定在近期将会有的一些资源争夺的趋势
452
4532\. 当系统将超出范围时要把性能趋势当作服务水平的协议来看
454
455F. 完成调整和维护工作
456
4571.使修改满足避免系统资源的争夺的需要,这里面包括增加新资源或使预期 的停工。
458
459\----------------------------------------------------------------</sid></sid></name></sid></size></file></name></size></file></name></sid></sid>