1 概述
随着光网络技术的演进,电信运营商和大型企业用户越来越关注保护其光传输网络和相应的网元管理系统;同时对于希望提高员工管理效率的企业,也逐步认识到网络管理系统建设的必要性。对应上述市场需求, cisco公司为其光传输网络的cisco transport manager(ctm)管理系统开发了一套高可用(ha)系统解决方案,使其能为客户提供高度强壮的管理系统配置, [被屏蔽广告]用于保护客户的任务关键型光传输网络。
ctm的ha解决方案提供了技术手段可以把管理系统的宕机时间降为最低,确保为客户提供所需要的电信级系统可靠性。而且,由于ctm的ha解决方案是由价格相对低廉、产品成熟的现有硬件和软件模块组成的,可以实现低的系统总拥有成本和方便客户利用现有的技术资源对其进行管理和维护。
2 为什么构造 ha 基础框架 ****
ctm的ha解决方案采用了高性能和高可靠的ip连接方案,利用为ctm管理服务器添加智能ha代理的方式,实现了管理服务器的故障自动检测和切换,保护客户光传输网络的网元管理系统持续运行。通过双sun服务器主机以及ctm管理软件,oracle数据库系统和veritas产品的紧密集成,客户就可以为其运营网络拥有一套功能强大的管理系统组合。由于降低了管理数据被破坏的可能性,提高了管理系统持续监控网络运行状态的能力,可以大大增强客户网络运营的安全感,因为他们知道即使在出现故障的情况下,ctm管理系统也可以提供不间断的管理服务。
3 ctm 的 ha 解决方案的优势 ****
ctm的ha解决方案提供了在专用软件出现故障或单点硬件失效时的管理系统自动切换功能,而且客户无需为其路由器/交换机设备重新配置ip地址。
- 高度强壮的系统配置
- 电信级的可靠性
- 减少存储在数据库中管理信息被破坏的可能性
- 多冗余部件预防单点硬件故障
- 低系统拥有成本
- 切实保护任务关键型光传输网络的网元管理系统
- 通过 ctm的智能ha代理实现自动恢复
- ha解决方案实现的ctm管理系统高可用性带来了网络运营成本的节省和避免业务运行的中断
- ha解决方案由业界最知名厂商的产品组成-veritas,oracle和sun
3.1 ctm 的 ha 解决方案的配置
下面这张拓扑图是一个典型的 ctm ha系统配置的连接示意图,图上还显示了ctm ha系统和与其相关的路由器/交换机网络的连接关系。
3.2 ha 系统特性
- 当检测到出现故障时,智能 ha代理自动对管理系统进行修复
- 服务器硬件和磁盘阵列冗余备份
- 管理系统切换后自动与 ons15000系列被管理设备进行重新连接
- 服务器内部的启动硬盘 /root文件系统镜像保护
- 服务器间支持多条心跳检测线路
- 当主管理系统运行时可以实时修改服务器配置
- 支持管理服务器间或服务器与磁盘阵列间的光纤接口
- 支持对磁盘阵列的 raid5+0配置进行优化
- 对任何外置硬盘的故障可以透明地恢复
- 支持冗余的ip接口卡
- 管理系统切换后自动与原有 ctm客户端进行重新连接
4 ctm的ha系统的组成模块
cisco transport manager(ctm)做为cisco公司光传输网络的电信级网元管理和子网管理系统,运行在标准的开放式unix系统平台:sun solaris8,具有非常高的单系统可靠性。管理系统包含的所有软件模块,如ctm服务器模块,ctm客户机模块,后台oracle8i数据库模块,集成接口ctm gateway/corba模块互相独立工作,多个模块既可以安装在一台服务器上,也可以分布式地安装在多台服务器上,模块间通过标准的通信接口进行互联。这种分布式的模块化体系结构确保了ctm管理系统本身的强壮性和易维护性。
做为电信运营商最有价值的网络基础设施之一,光传输网络规模巨大且系统复杂,所以非常依赖于网元管理系统和子网管理系统对网络进行控管。cisco公司在规划设计其光传输网络整体方案时,非常重视网络管理子系统的开发,专门为ctm管理系统设计开发了一套多系统容余备份的高可用方案。使ctm在确保单系统高可靠性的基础上还支持本地双机备份工作模式和异地双机备份工作模式,避免了由不可预测原因造成的单一硬/软件故障可能导致的管理系统失效,在最大程度上保证了ctm管理系统具有最高等级的高可用性,非常适合在电信运营商环境下采用。
ctm多系统容余备份的高可用(ha)方案是cisco公司联合多个处于业界领先地位的硬/软件合作伙伴--sun公司,oracle公司和veritas公司,共同开发完成的。可以实现在全系统中不存在任何一个单点失败点,使全系统在出现一个软件或硬件故障时能实现网元管理和子网管理的连续可用。
cisco公司ctm ha方案的特点为:
- 支持本地系统备份和异地系统备份功能
- 系统配置极为强壮
- 使宕机时间最小化,符合电信级高可靠性要求
- 降低管理系统数据库信息被破坏的风险
- 容余系统模块预防单点硬/软件故障
- 低拥有成本
- 保护任务关键型光传输网络管理系统平台的正常运行
- 出现故障时通过ctm 智能ha代理自动恢复
- 降低故障造成的营业损失,减少对业务造成的破坏
- ctm ha解决方案由业界最出色厂家的产品组成:veritas, oracle和sun
下面对ctm ha本地和异地系统备份方案分别进行详细介绍。
4.1 ctm ha本地系统备份方案
4.1.1 本地ha方案的系统配置
ctm ha本地系统备份方案由安装在同一个网管中心的一组两台1:1互为备份,可自动切换工作的ctm管理系统组成。每台ctm管理系统除安装标准的ctm服务器软件、oracle8i后台数据库等软件外还需要安装ctm智能ha代理软件和veritas公司开发的双机系统/数据库备份软件。具体需新增的软件清单如下:
- ctm ha agent 2.1
- veritas foundation suite ha, solaris, v3.5
- veritas cluster server oracle8i agent v2.0.1
注:由于一套ctm ha系统中同时只有一台ctm管理服务器为主用系统,所以每套ha系统只需配置一份ctm软件和一份ctm ha agent 2.0软件;但其它第三方软件,如oracle8i数据库软件和veritas双机备份软件,每台服务器都需要配置一份,并需要保证软件版本和配置的完全相。
为配合ctm ha系统的正常工作,每套系统中安装ctm软件的两台sun服务器的硬件和操作系统配置需要保持完全相同。为实现服务器间工作状态的相互检测,还需要在两台sun服务器间配置两条容余备份工作的交叉直连100base-t以太网“心跳”检测线,两条“心跳”检测线分别连接到sun服务器中加配的两块以太网卡,并分别配置独立的ip地址。为提高安装ctm系统的sun服务器本身的可用性,还可以考虑采取为sun服务器配置镜像工作的操作系统硬盘、支持raid5保护的外置磁盘阵列、n+1保护的电源、容余备份的网卡等措施。
下图为ctm本地ha方案的系统结构图:
4.1.2 本地ha方案的工作方式
当ctm智能ha代理检测到一个软件故障出现时,它会对出现故障的软件进程进行三次修复,如果故障还不能恢复,ctm的智能ha代理会控制主用管理系统自动切换到备份管理系统服务器;当ctm智能ha代理检测到一个严重的硬件故障时,它不会对故障采取任何修复操作,将直接启动系统切换。在ctm管理系统切换到备用管理服务器之前,智能ha代理将关闭主用服务器中的所有的激活进程,并按顺序启动备用服务器中所有需要的服务进程,整个过程大致需要5分钟时间。
在ctm管理系统出现自动切换后,新的主用ctm管理系统会自动与网络中的cisco ons 15000系列光传输设备进行连接,同步网元设备中的管理数据和告警信息,确保在系统切换过程中出现的告警信息不丢失。同时ctm客户机软件和上层oss系统也可以与新的主用ctm管理服务器进行连接,恢复所有网元管理和子网管理相关的操作。
4.1.3 虚拟ip地址
在安装/配置ctm ha方案时,需要为两台主备用的ctm管理服务器配置一个虚拟的ip地址。网络中所有ctm客户机,上层oss系统和光传输网元设备都通过这个虚拟ip地址与主用的ctm管理服务器进行通信,而各ctm管理服务器上的真实ip地址将被隐藏。当出现主用ctm管理服务器切换到备用ctm管理服务器的情况时,备用管理服务器不但能接管主用服务器的所有职能,还将接管这个虚拟ip地址用于与被管理网元设备和其它管理模块进行通信且切换发生后所有通信连接都将自动恢复。
4.2 ctm ha异地系统备份方案
4.2.1 异地ha方案的系统配置
ctm异地ha方案是在本地ha方案的基础上发展起来的,除保留原有本地ha方案中的所有硬软件要求外,通过增加配置veritas公司开发的异地系统/数据库备份模块实现不同管理中心的ctm管理系统间1:1的容余备份。在不同管理中心的ctm管理系统既可以是单机系统,也可以是已经实现了本地ha方案的容余系统。
为实现ctm管理系统异地ha方案,需要在异地间互为容余备份的每台ctm管理服务器中配置下列相关控制软件:
- ctm ha agent 2.1
- veritas global cluster manager, solaris, disaster recovery option v3.5
- veritas volume replicator, solaris, v3.5
- veritas foundation suite ha, solaris, v3.5
- veritas cluster server oracle8i agent v2.0.1
注:由于一套ctm 异地ha系统中同时只有一台ctm管理服务器为主用系统,所以每套ha系统只需配置一份ctm软件和一份ctm ha agent 2.0软件;但其它第三方软件,如oracle8i数据库软件和veritas双机备份软件,每台服务器都需要配置一份,并需要保证软件版本和配置的完全相同。
在异地的两套主备用ctm管理系统间进行的管理信息同步和数据库复制是通过veritas volume replicator软件建立的一个tcp通道(rlink)实现的。
下图为ctm异地ha方案的系统结构图,其中每个异地节点均为一套实施了本地ha保护的双机系统: