ORACLE数据库管理员的职责

ORACLE 数据库管理员的职责

ORACLE 数据库管理员应按如下方式对 ORACLE 数据库系统做定期监控：
(1). 每天对 ORACLE 数据库的运行状态 , 日志文件 , 备份情况 , 数据
库的空间使用情况 , 系统资源的使用情况进行检查 , 发现并解决
问题。
(2). 每周对数据库对象的空间扩展情况 , 数据的增长情况进行监控 , 对数据库做健康检查 , 对数据库对象的状态做检查。
(3). 每月对表和索引等进行 Analyze, 检查表空间碎片 , 寻找数据库
性能调整的机会 , 进行数据库性能调整 , 提出下一步空间管理
计划。对 ORACLE 数据库状态进行一次全面检查。
每天的工作
(1). 确认所有的 INSTANCE 状态正常
登陆到所有数据库或例程 , 检测 ORACLE 后台进程 :
$ps –ef|grep ora
(2). 检查文件系统的使用（剩余空间）。如果文件系统的剩余空间小于 20% ，需删除不用的文件以释放空间。
$df –k
(3). 检查日志文件和 trace 文件记录 alert 和 trace 文件中的错误。
连接到每个需管理的系统
? 使用’ telnet ’
? 对每个数据库 ,cd 到 bdump 目录 , 通常是 $ORACLE_BASE/

  1<sid>/bdump   
  2?  使用  Unix ‘tail’  命令来查看  alert_<sid>.log  文件    
  3?  如果发现任何新的  ORA-  错误  ,  记录并解决    
  4(4).  检查数据库当日备份的有效性。    
  5对  RMAN  备份方式  :   
  6检查第三方备份工具的备份日志以确定备份是否成功    
  7对  EXPORT  备份方式  :   
  8检查  exp  日志文件以确定备份是否成功    
  9对其他备份方式  :   
 10检查相应的日志文件    
 11(5).  检查数据文件的状态记录状态不是“  online”  的数据文件，并做恢复。    
 12Select file_name from dba_data_files where status=’OFFLINE’   
 13(6).  检查表空间的使用情况    
 14SELECT tablespace_name, max_m, count_blocks free_blk_cnt, sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_free   
 15FROM ( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name),   
 16( SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m, count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM dba_free_space GROUP BY tablespace_name )   
 17WHERE tablespace_name = fs_ts_name   
 18(7).  检查剩余表空间    
 19SELECT tablespace_name, sum ( blocks ) as free_blk ,   
 20trunc ( sum ( bytes ) /(1024*1024) ) as free_m,   
 21max ( bytes ) / (1024) as big_chunk_k, count (*) as num_chunks   
 22FROM dba_free_space GROUP BY tablespace_name;   
 23(8).  监控数据库性能    
 24运行  bstat/estat  生成系统报告    
 25或者使用  statspack  收集统计数据    
 26(9).  检查数据库性能，记录数据库的  cpu  使用、  IO  、  buffer  命中率等等    
 27使用  vmstat,iostat,glance,top  等命令    
 28(10).  日常出现问题的处理。    
 29每周的工作    
 30(1).  控数据库对象的空间扩展情况    
 31根据本周每天的检查情况找到空间扩展很快的数据库对象  ,  并采取相    
 32应的措施    
 33\--  删除历史数据    
 34\---  扩表空间    
 35alter tablespace <name> add datafile ‘<file>’ size <size>   
 36\---  调整数据对象的存储参数    
 37next extent   
 38pct_increase   
 39(2).  监控数据量的增长情况    
 40根据本周每天的检查情况找到记录数量增长很快的数据库对象  ,  并采    
 41取相应的措施    
 42\--  删除历史数据    
 43\---  扩表空间    
 44alter tablespace <name> add datafile ‘<file>’ size <size>   
 45(3).  系统健康检查    
 46检查以下内容  :   
 47init<sid>.ora   
 48controlfile   
 49redo log file   
 50archiving   
 51sort area size   
 52tablespace(system,temporary,tablespace fragment)   
 53datafiles(autoextend,location)   
 54object(number of extent,next extent,index)   
 55rollback segment   
 56logging &amp;tracing(alert.log,max_dump_file_size,sqlnet)   
 57(4).  检查无效的数据库对象    
 58SELECT owner, object_name, object_type FROM dba_objects   
 59WHERE status=  ’  INVALID  ’。    
 60(5).  检查不起作用的约束    
 61SELECT owner, constraint_name, table_name,   
 62constraint_type, status   
 63FROM dba_constraints   
 64WHERE status = 'DISABLED’ AND constraint_type = 'P'   
 65(6).  检查无效的  trigger   
 66SELECT owner, trigger_name, table_name, status   
 67FROM dba_triggers   
 68WHERE status = 'DISABLED’   
 69每月的工作    
 70(1). Analyze Tables/Indexes/Cluster   
 71analyze table <name> estimate statistics sample 50 percent;   
 72(2).  检查表空间碎片    
 73根据本月每周的检查分析数据库碎片情况  ,  找到相应的解决方法    
 74(3).  寻找数据库性能调整的机会    
 75比较每天对数据库性能的监控报告  ,  确定是否有必要对数据库性能进  行调整    
 76(4).  数据库性能调整    
 77如有必要  ,  进行性能调整    
 78(5).  提出下一步空间管理计划    
 79根据每周的监控  ,  提出空间管理的改进方法 
 80
 81Oracle DBA  日常管理    
 82目的：这篇文档有很详细的资料记录着对一个甚至更多的  ORACLE  数据库每天的，每月的，    
 83每年的运行的状态的结果及检查的结果，在文档的附录中你将会看到所有检查，修改的  SQL   
 84和  PL/SQL  代码。    
 85目录    
 861\.  日常维护程序    
 87A  ．  检查已起的所有实例    
 88B  ．  查找一些新的警告日志    
 89C  ．  检查  DBSNMP  是否在运行    
 90D  ．  检查数据库备份是否正确    
 91E  ．  检查备份到磁带中的文件是否正确    
 92F  ．  检查数据库的性能是否正常合理，是否有足够的空间和资源    
 93G  ．  将文档日志复制到备份的数据库中    
 94H  ．  要常看  DBA  用户手册    
 952\.  晚间维护程序    
 96A  ．收集  VOLUMETRIC  的数据    
 973\.  每周维护工作    
 98A  ．  查找那些破坏规则的  OBJECT   
 99B  ．  查找是否有违反安全策略的问题    
100C  ．  查看错误地方的  SQL*NET  日志    
101D  ．  将所有的警告日志存档    
102E  ．  经常访问供应商的主页    
1034\.  月维护程序    
104A  ．  查看对数据库会产生危害的增长速度    
105B  ．  回顾以前数据库优化性能的调整    
106C  ．  查看  I/O  的屏颈问题    
107D  ．  回顾  FRAGMENTATION   
108E  ．  将来的执行计划    
109F  ．  查看调整点和维护    
1105\.  附录    
111A  ．  月维护过程    
112B  ．  晚间维护过程    
113C  ．  周维护过程    
1146\.  参考文献    
115\----------------------------------------------------------------   
116一．日维护过程    
117A  ．查看所有的实例是否已起    
118确定数据库是可用的，把每个实例写入日志并且运行日报告或是运行测试    
119文件。当然有一些操作我们是希望它能自动运行的。    
120可选择执行：用  ORACLE  管理器中的‘  PROBE’  事件来查看    
121B  ．查找新的警告日志文件    
1221\.  联接每一个操作管理系统    
1232\.  使用‘  TELNET’  或是可比较程序    
1243\.  对每一个管理实例，经常的执行  $ORACLE_BASE/<sid>/bdump  操    
125作，并使其能回退到控制数据库的  SID  。    
1264\.  在提示下，使用  UNIX  中的‘  TAIL  ’命令查看  alert_<sid>.log  ，或是    
127用其他方式检查文件中最近时期的警告日志    
1285\.  如果以前出现过的一些  ORA_ERRORS  又出现，将它记录到数据库    
129恢复日志中并且仔细的研究它们，这个数据库恢复日志在〈  FILE  〉中    
130C  ．查看  DBSNMP  的运行情况    
131检查每个被管理机器的‘  DBSNMP’  进程并将它们记录到日志中。    
132在  UNIX  中，在命令行中，键入  ps –ef | grep dbsnmp,  将回看到  2  个    
133DBSNMP  进程在运行。如果没有，重启  DBSNMP  。    
134D  ．查数据库备份是否成功    
135E  ．检查备份的磁带文档是否成功    
136F  ．检查对合理的性能来说是否有足够的资源    
1371\.  检查在表空间中有没有剩余空间。    
138对每一个实例来说，检查在表空间中是否存在有剩余空间来满足当天    
139的预期的需要。当数据库中已有的数据是稳定的，数据日增长的平均    
140数也是可以计算出来，最小的剩余空间至少要能满足每天数据的增  长。    
141A  ）  运行‘  FREE.SQL’  来检查表空间的剩余空间。    
142B  ）  运行‘  SPACE.SQL’  来检查表空间中的剩余空间百分率    
1432\.  检查回滚段    
144回滚段的状态一般是在线的，除了一些为复杂工作准备的专用  段，它一般状态是离线的。    
145a)  每个数据库都有一个回滚段名字的列表。    
146b)  你可以用  V$ROLLSTAT  来查询在线或是离线的回滚段的现在状  态  .   
147c)  对于所有回滚段的存储参数及名字，  可用    
148DBA_ROLLBACK_SEGS  来查询。但是它不如  V$ROLLSTAT  准确。    
1493\.  识别出一些过分的增长    
150查看数据库中超出资源或是增长速度过大的段，这些段的存储参  数需要调整。    
151a  ）  收集日数据大小的信息，  可以用    
152‘  ANALYZE5PCT.SQL  ’。如果你收集的是每晚的信息，  则可跳过这一步。    
153b  ）  检查当前的范围，可用‘  NR.EXTENTS.SQL’  。    
154c  ）  查询当前表的大小信息。    
155d  ）  查询当前索引大小的信息。    
156e  ）  查询增长趋势。    
1574\.  确定空间的范围。    
158如果范围空间对象的  NEXT_EXTENT  比表空间所能提供的最大范    
159围还要大，那么这将影响数据库的运行。如果我们找到了这个目标，可    
160以用‘  ALTER TABLESPACE COALESCE’  调查它的位置，或加另外  的数据文件。    
161A  ）运行‘  SPACEBOUND.SQL’  。如果都是正常的，将不返回任何行。    
1625\.  回顾  CPU  ，内存，网络，硬件资源论点的过程    
163A  ）检查  CPU  的利用情况，进到  x:\web\phase2\default.htm =&gt;system   
164metrics=&gt;CPU  利用页，  CPU  的最大限度为  400  ，当  CPU  的占用保持    
165在  350  以上有一段时间的话，我们就需要查看及研究出现的问题。    
166G  ．将存档日志复制到备用数据库中    
167如果有一个备用数据库，将适当的存档日志复制到备用数据库的期望    
168位置，备用数据库中保存最近期的数据。    
169H.  经常查阅  DBA  用户手册    
170如果有可能的话，要广泛的阅读，包括  DBA  手册，行业杂志，新闻  组或是邮件列表。    
171\-------------------------------------------------------------   
172二．晚间维护过程    
173大部分的数据库产品将受益于每晚确定的检查进程的运行。  &lt;S</sid></sid></name></sid></size></file></name></size></file></name></sid></sid>