运维平台建设相关参考资料
目录
第 1 章 运维支撑系统助力宽带可持续发展 2004-9-16...................................................2
第 2 章 建立综合运维机制的必要性 .................................................................................4
第 3 章 技术创新提升服务水平 电信运维技术大比武 ...................................................7
第 4 章 电信运维管理技术手段发展分析 .........................................................................8
第 5 章 世界电信运维支撑系统(BOSS)3 月要闻综述 ...................................................15
第 6 章 建设现代运营支撑系统 .......................................................................................17
第 7 章 中国电信运维管理系统建设之我见 ...................................................................26
第 8 章 对电信运维管理体制的研究 ...............................................................................31
第 9 章 北京移动电子运行维护系统(E-OMS)工程 ..................................................39
第 10 章 建立宽带接入综合运维体制 ...........................................................................44
第 11 章 企业监控中心解决方案 ...................................................................................47
第 12 章 GSM 本地网集中操作维护系统 .....................................................................52
第 13 章 CNC Connected 商业网运维优势...................................................................55
第 1 章 运维支撑系统助力宽带可持续发展
2004-9-16
当前,以 ADSL 为代表的宽带接入发展已经呈燎原之势,千万级的用户规模使得宽带
接入成为运营商网络发展策略中必须重点考虑的重要组成部分。特别是在网络的运维支撑方
面,宽带接入为运营商提出了许多新的课题,即如何将宽带接入的发展与整个固定网络有机
结合,确保新业务与传统业务共同发展。
从中国宽带接入市场大的背景来看,网络边缘部分的融合正成为电信发展的大趋势。为
了顺应接入层融合的发展趋势,以及满足大客户综合业务一站式购齐的需求,运营商开始建
设综合业务接入网。相应地,运营商正在着手建立一套综合运维的机制,构筑面向市场、面
向用户的运行维护服务平台,打造集中统一的网络维护体系,使运营商的网络资源得以充分
利用和发挥,最大限度地保护现阶段对接入层的投资。
在接入层投资建设上,面对多元化的接入技术,建立一个模块化结构的公共接入平台应
该是发展趋势,而在接入层管理维护上,面对激烈的市场竞争和日益提高的用户服务质量的
要求,建立一种“以客户为中心,效益为导向”的综合运维支撑体系是适应新时期接入层融合
的必然趋势,可以有效降低维护的成本,加强对网络的维护,确保其安全、高效运行,从而
提高对用户、对市场的响应速度,更好地为用户和市场服务。
目前,建立综合运维体制模型的核心思想是“设备层统一维护,业务层分权维护”,从而
实现网络管理系统和业务管理系统的相对独立(统一的网管平台实现多业务网络的集中维护
管理,同时提供多个业务发放渠道,满足多业务网络各种业务开展的需求),组织结构也可
以相应地简化为接入网网管中心和数据维护中心。
首先是设备层统一管理。接入网网管中心负责综合接入网的设备层维护,其网络管理系
统可以实现窄带话音接口板、宽带 ADSL 与 LAN 接口板、数据专线接口板等基本硬件的维
测,实现硬件故障告警、环境电源监控和线路测试等,即保障接入层物理网络的安全稳定运
行。
对于设备层的统一管理,可以根据网络规模的大小,采用不同的网管平台,通过选用不
同的服务器配置和服务器数量实现全网设备的统一集中管理。该集中网管系统支持全网的拓
扑管理、环境电源监控、集中告警等功能,并可以根据行政区域的划分支持多个客户端的域
管理和授权,收集和统计各客户端上报的故障告警、性能统计等信息。各客户端主要负责本
区域设备的管理维护,接受统一网管中心的权限管理,向统一网管中心上报告警数据等。
其次要做到业务层分权管理。数据维护中心负责多业务的发放,其业务管理系统是根据
不同业务网资源情况,进行纵向调配的专业资源管理和用户管理系统。由于各专业业务网络
的维护人员对业务层比较熟悉,他们的精力可以集中在如何更好地开展各种业务,如何使网
络增值上。而对于设备本身、线路的维护则可以统一交给设备层的接入网网管中心。
业务层的分权管理主要是建立多业务的发放策略,通过业务端口管理功能实现多业务网
络的业务发放。同时,各业务的发放渠道在统一网管平台上有相应的权限控制,维护人员可
以根据自身的专业特长维护相应的业务网络。
针对大客户,要提供 SLA 服务以及综合运维“主动维护”解决方案。随着网络规模的扩
大,数据配置、告警、统计和检测手段的不足直接影响了运维效率。据不完全统计,90%以
上的故障均发生在 CPE 侧,由于目前缺乏有效的线路测试和终端管理手段,对故障未能及
时处理,影响了大客户的满意度。
为了提升对大客户的服务,运营商需要建立一种“主动维护”的综合运维机制,对用户的
网络进行定期检测和实时监控,在用户还没有感知的情况下,及时发现网络的故障隐患,将
其排除从而保障大客户网络的长期安全稳定运行,为大客户提供满意的 SLA 服务。“主动维
护”可以通过例行测试、性能统计分析、网络监控等网管功能来实现;建立例行测试制度,
利用网管系统强大的业务运营能力对全网设备进行综合性能分析和实时性能监控;应用专业
的网络监控系统,并通过报表输出,发现安全隐患,实现实时的故障诊断。
总之,随着 IT 技术的不断发展,运维支撑体系在 ADSL 等宽带接入的发展中将起到越
来越重要的作用,我们应充分结合业务的需求和网络的实际情况,做好运维支撑工作,为宽
带业务的发展提供有力的保证。
第 2 章 建立综合运维机制的必要性
(2003-10-09 08:40:18)
接入层发展趋势和运维需求
随着市场竞争的日益激烈以及网络向 NGN 的演进,如何兼顾网络技术发展和投资保护,快
速响应大客户个性化的综合业务需求,是目前接入层投资建设的焦点问题。
下一代网络是以分组交换为核心的业务驱动型网络,与现有的网络架构完全不同。对于占网
络整体投资 70%的接入层来讲,要实现接入层的融合,还存在一定的问题和困难。首先,
在业务提供上,现有接入层网络因核心网分离而采用叠加建网的方式,导致业务的开展受交
换机机型的限制和制约,与 NGN 分层建设的思路相矛盾,业务扩展性差。其次,在综合业
务需求上,大客户对宽窄带及数据等综合业务的需求还不明显,现有建网方式基本能满足其
打电话和宽带上网的业务需求,接入层综合业务统一平台的优势得不到很好的体现。再次,
在维护体制上,传统的维护方式按业务网独立设置维护部门,对于多业务需求的用户响应要
协调多个部门,业务开通时间长,故障受理环节多,已经极不适应竞争环境的发展,也阻碍
了接入层的融合。
现阶段,许多运营商都已经意识到这些问题。在综合接入网的维护上,运维体制由原有的分
散维护体制向统一集中网管和大客户 SLA 服务的方向进行调整。因此,有必要建立一种“以
客户为中心、效益为导向”的综合运维机制,面对 NGN 网络设备分层、业务融合的发展趋
势,做好维护体制变换的准备;面对大客户综合业务需求的变化,在有效降低维护成本,确
保网络安全、高效运行的同时,提高对用户、对市场的响应速度,更好地为用户和市场服务。
综合运维体制模型
针对接入网的综合化和融合化趋势,为了提高客户的满意度和降低维护成本、达到减员增效
的目的,应该建立分层的接入网综合维护机制,其核心思想是“设备层统一维护,业务层分
权维护”。
首先是设备层应统一管理。接入网网管中心负责综合接入网的设备层维护,其网络管理系统
可以实现窄带话音接口板、宽带 ADSL、LAN 接口板、数据专线接口板等基本硬件的维测、
硬件故障告警、环境电源监控和线路测试等,即保障接入层物理网络的安全稳定运行。对于
设备层的统一管理,可以根据网络规模的大小,采用不同的网管平台,通过选用不同的服务
器配置(可以是台式机、PC 服务器和工作站)和服务器数量实现全网设备的统一集中网管。
该集中网管系统支持全网的拓扑管理(例如全网 OLT、ONU 的组网拓扑)、环境电源监控
(包括综合接入设备机柜、机房环境的监控)、集中告警等功能,并可以根据行政区域的划
分支持多个客户端的域管理和授权,收集和统计各客户端上报的故障告警、性能统计等信息。
各客户端主要负责本区域设备的管理维护,接受统一网管中心的权限管理,向统一网管中心
上报告警数据等。
其次是业务层应分权管理。数据维护中心负责多业务的发放,其业务管理系统是根据不同业
务网资源情况,进行纵向调配的专业资源管理和用户管理系统。由于各专业业务网络的维护
人员对业务层比较熟悉,他们的精力可以集中在如何更好地开展各种业务和如何使网络增值
上。而对于设备、线路的维护则可以统一交给设备层的接入网网管中心。业务层的分权管理
主要是建立多业务的发放策略,通过业务端口管理功能实现多业务网络(PSTN、DDN 和
ATM/IP 网络)的业务发放。例如,窄带语音业务的开通,就是通过业务端口管理功能中的
PSTN 端口管理模块和 V5 接口管理模块,建立交换机和接入网之间业务发放的渠道,从而
保证交换机侧和接入网侧 V5 接口和 E1 中继接口数据配置的一致性,实现语音业务的安全
发放。同时,各业务的发放渠道在统一网管平台上有相应的权限控制,维护人员可以根据自
身的专业特长维护相应的业务网络。
综上所述,“设备层统一管理,业务层分权管理”的综合运维机制,通过建立统一集中网管平
台和多业务的发放渠道,可以充分保障综合业务的顺利开展和网络的安全、可靠运营,是面
向下一代网络在接入层建设上实现可维护性设计的有力措施。
大客户 SLA 服务以及综合运维“主动维护”方案
深圳电信在全国率先推出 SLA 业务等级服务模式,通过双路由、双节点、双电源、双端口
等方式为大客户提供更加可靠的网络服务(包括网络性能、服务响应时间、业务提供保证
等),不仅降低了企业网络中断造成效益损失的可能性,提高了大客户的潜在效益,而且促
进了其自身宽带网络的增值和盈利。但随着网络规模的扩大,数据配置、告警、统计和检测
手段的不足直接影响了运维效率。据不完全统计,90%以上的故障均发生在 CPE 侧,由于
目前缺乏有效的线路测试和终端管理手段,对故障的不及时处理,影响了大客户的满意度。
为了提升大客户的服务满意度,要建立一种“主动维护”的综合运维机制,对用户的网络进行
定期检测和实时监控,在用户还没有感知的情况下,及时发现网络的故障隐患并将其排除,
从而保障大客户网络的长期安全稳定运行,为大客户提供满意的 SLA 服务。
“主动维护”可以通过例行测试、性能统计分析、网络监控等网管功能来实现。
首先,建立例行测试制度。可以通过网管的内置图形化测试台,设定定时的例行测试任务,
有计划地对用户线路以及终端进行例行测试,提前发现故障;还可以通过一些厂家专有的统
一测试硬件系统(例如华为综合接入网 BTSS 宽窄带统一测试板),完成用户端口内线电路、
用户外线 DMM 测试,用户终端测试,CQT 测试宽带外线质量,CO 仿真测试 ADSLModem
等。
其次,利用网管系统强大的业务运营能力,对全网设备进行综合性能分析和实时性能监控。
网管平台提供丰富的实时性能图形(曲线图、柱状图),可以监控设备的上行与下行流量、
xDSL 端口工作流量、带宽利用率、丢包率和误码率、CPU 占用率和 V5 信令跟踪等,还可
以根据异常指标上报告警系统,支持性能告警功能,特别是可以通过告警转 E-mail 或手机
短信报告通知到用户,该功能可以为 SLA 高服务等级的客户进行定制,提高服务质量。
再次,应用专业的网络监控系统。可以通过环境电源监控系统,提供电源、环境集中监控和
重大告警(电源、环境、通信告警等)集中监视功能。可以采用设备自身的监控单元和通道,
支持多个扩展模拟量和数字量输入监控数据传输通道,支持对远端机房温湿度、门禁、烟、
火、电源设备、蓄电池设备等环境参数的检测,从而实现远端机房的无人值守,大大降低监
控系统成本。
最后,通过报表输出,发现安全隐患。例如流量统计报表、告警统计报表、例行测试报表、
柱状图、曲线图、表格等的打印输出,极大地方便了运营商的管理层及时掌握网络的运行状
态,制订和调整相应的维护策略,为大客户提供更加可靠的网络服务。
综合运维在泉州电信的成功应用
截至 2003 年 8 月,泉州电信共建设综合接入网 40 万线,用 39 台 MD5500 分别覆盖泉州、
德化、晋江、永春四个大区,提供 POTS、ADSL、LAN、DDN、FR 等多种业务接入,充分
满足酒店、金融、写字楼、高校、小区等不同客户群的综合业务需求。
泉州电信目前拥有全国最大的本地网集中网管中心,针对泉州城域网 9 个县市的骨干层、接
入层以及传输进行集中监控和管理。在人员配备上,泉州电信采用“网管中心-设备中心”二
级运维体制,网管中心负责对全网宽窄带、数据专线等业务的发放;设备中心负责对网络不
同层面、不同厂家的设备进行故障排除和定期维护。在设备配置上,泉州电信采用
iManagerN2000 集中网管系统,集中网管中心设在泉州市网管中心,负责收集各区域网管中
心上报的告警、拓扑数据,实现全网的集中监视;在德化、晋江和永春通过分权反拉客户端
的方式分别建立三套区域网管中心,完成对本区网络设备的维护管理。
第 3 章 技术创新提升服务水平 电信运维技术大
比武
【2004-11-05 09:56】 【李浩谦 柳忠】 【人民邮电报】
WAP 天极 IT 新闻资讯,业内动态手中掌握
WAP 天极游戏资讯,精彩内容免费体验
11 月 2 日,经过层层筛选的 9 支代表队的 81 名参赛选手,齐聚湖南长沙,参加中国电
信首届光缆带业务割接的总决赛,进行运维技术大比武。
经过半年的筹划和四个大区的预选赛,脱颖而出的江苏、福建、湖北、广东、四川、贵
州、陕西、甘肃和湖南等 9 支中国电信代表队进入本次总决赛。此次竞赛根据机线一体化的
要求,第一次将机务和线务有机地结合在一起,首次使用真正多厂家传输设备结合网管系统
及光缆线路进行组网模拟现网实际情况,并在网上模拟实际业务运行。此次竞赛的东道主湖
南省电信有限公司是光缆带业务割接技术的首创者。该公司党组书记、总经理文会国指出,
此次竞赛既是对中国电信技术精英的一次大检阅,也是电信员工的一次大练兵。
据中国电信集团公司网运部总监靳东滨介绍,光缆带业务割接技术是中国电信近几年大
力推行的一项重要的技术创新项目,这项技术能有效提高光缆传输网络电路可用率,大幅度
地压缩网络中断时间,进一步提升中国电信对用户服务的水平。目前,中国电信一、二级干
线带业务割接比例分别达到 98%和 95%,因光缆割接引起的业务中断时长完全控制在每系
统 5 分钟以内,有些甚至只中断几十秒,大大压缩了系统中断对用户的影响。骨干网全年割
接总时长从 2001 年的 60000 分钟压缩到了 2003 年的不到 2000 分钟,使用户更为直接地体
验到中国电信网络的可靠性。近两年来,中国电信各级企业围绕网络运行主要运维指标三年
达到世界级水平的集团战略目标,在强化网络运行维护管理和不断创新方面取得了显著成绩。
第 4 章 电信运维管理技术手段发展分析
叶云
摘要:随着中国电信行业体制的变革,以网络为中心的电信运维过程正逐步
向以客户为中心的方向转变。从运维管理技术手段上看,就是逐渐从网元层网管、
网络层故障管理向业务层服务保障转变。对这一发展趋势进行了探讨,并对故障
管理功能、服务保障系统的作用及其实现进行了分析。
关键词:运营支撑系统,故障管理,服务保障
随着中国电信运营市场竞争环境的形成,以及加入WTO后国外电信运营商
的逐步进入,如何增强竞争力、扩大市场份额、实现效益目标已成为中国电信运
营商所面临的巨大挑战,运营支撑系统的建设也就成了运营商关注的焦点。
按照以客户为中心的基本思想,建立面向客户的运维过程,是目前运营支撑
系统建设的难点之一。其基本内容就是改变几十年来以网络为中心、以网管为管
理手段、以故障恢复及检修为主要管理内容的传统运维模式,实现以客户为中心、
以服务保障为手段、以客户业务保障及服务质量(QoS)为主要管理内容的新
的运维模式。而其中技术手段的改变又是实现以上转变的必要条件,其基本趋势
是从传统的网元网管到网络层故障管理,再到业务层服务保障。其中,网络层的
故障管理是目前中国运营支撑系统建设的重点之一;而服务保障是电信运营支撑
系统在国际范围内发展最为迅速的领域之一,目前国际上已经开发了一系列的产
品和解决方案,同时针对不同电信业务提出了不同的服务保障内容,具有广阔的
发展前景。本文对从故障管理到服务保障的技术手段的发展趋势进行了研究,并
对故障管理功能、服务保障系统的作用及其实现进行了分析和探讨。
一、以网络为中心的故障管理技术手段及其缺陷
传统的电信网络运维过程通过一系列的网管及七号信令、光缆/电缆集中监
测系统监测网元的运行状况。这些网管系统实现了电信管理网(TMN)架构中
网元层的故障管理、性能管理等功能,并以故障管理为核心内容。通常情况下,
运行故障事件在孤立的故障网元上进行处理,而不会与其他的网元关联处理。以
上的软件及硬件构成了面向网络的运行维护的基础。
随着电信网络的发展,孤立的网元层网管已无法满足业务发展的需要,网络
层的故障管理系统成为目前运营支撑系统建设的重点之一。与网元层网管相比,
故障管理系统的优势是能够在网络层为不同的网络故障事件提供过滤和关联分
析的功能,以及一定程度的根本原因分析。其主要功能包括网元自动发现、故障
事件采集、故障事件过滤、故障事件关联、故障拓扑管理、故障工单处理、故障
分析统计以及故障知识学习。
除了网络层的故障管理系统外,还可以建立单独的网络层性能管理系统,去
分析不同网元及网络本身的性能趋势。但必须看到,以上网络层的故障管理和性
能管理在根本上仍未能摆脱以网络为中心的基本管理框架。
随着2G/2.5G/3G移动网络和NGN中大量新的数据增值业务的涌
现,以及业务中分组交换对传统电路交换的替代,以网络为中心的电信运维模式
已无法为单独业务在网络中的运行提供有效的监控。而客户最关心的是其付费购
买的电信业务,因此保证客户业务的服务质量是运营商目前应首要关心的问题。
虽然在理想的情况下,网络是业务的载体,如果网络管理能够保证网络零缺陷运
行,监控和管理单独的业务则是不必要的,但在实际情况中网络缺陷是不可避免
的。因此,必须要监控和识别网络缺陷对各种业务的影响,并知道什么样的网络
问题对客户业务的影响最大。
同时,由于网络技术日益复杂,网元的故障对业务可能不会造成任何影响
(如在IP网的多种路由路径存在的情况下)。然而从某种业务来看,虽然网络
未发生任何故障,但业务本身可能已经出现了问题(如客户认证拥塞)。
以上情况表明,电信运营商需要面向客户提供一种有效的业务监控手段,以
实现有力的服务保障。传统的网络管理方法仅能对以客户为中心的服务质量提供
较少的帮助,对客户的服务水平协议(SLA)管理则根本无法实现。更关键的
是,传统的网络管理方法很难判断网络故障对业务收入的影响。因此,依靠目前
网络层的故障管理技术手段仍无法实现以客户为中心的网络运维,必须提供更加
有效的技术手段。
二、服务保障在电信运维中的作用及实现
根据电信管理论坛(TMF)的定义,服务保障系统是运营支撑业务层的应
用系统,该系统通过对网管、故障管理、性能管理、计费系统、CRM系统、网
元日志等多种数据源的监控,以客户为中心、从客户/业务角度提供网络缺陷的
监控和管理功能,同时实现客户业务的SLA管理,如图1所示。
服务保障系统功能的提供,对于迅速发展的移动网络来说显得尤为迫切,其
表现如下:
①对于移动网来说,其基本的移动特性决定了其业务接入点是随时变化的。
同时新的移动增值业务存在多个业务访问点,如对于GPRS网络,不同的业务
能力可以通过多个网关GPRS支持节点(GGSN)接入,而客户终端可以通
过任意服务GPRS支持节点(SGSN)访问业务。因此,通过监控网络告警
来保证客户服务质量很明显是不充分的。
①移动网络的数据传输带宽随着接入地点、基站负荷和接入时间的变化而有
所不同,甚至在一个业务的使用过程中,随着其基站接入用户数量的变化,以及
这些用户正在使用的不同业务应用的变化,带宽也不固定。同时,移动电话在不
同基站之间的漫游也会造成带宽的波动。让用户在使用业务的过程中享受足够和
稳定的带宽是电信运营商服务质量保证的重要内容。因此对于电信运营商来说,
以客户为中心,对其在一个业务使用过程中所获得的实际带宽进行监视是十分必
要的。
①对于移动网络来说,不同的网元如GPRS网络中的SGSN、GGS
N、归属位置寄存器(HLR)及多媒体消息业务中心(MMSC)等业务能力
网元,可能造成不同的时延,对这些时延的监视对于特定业务(如实时性强的互
动游戏和流媒体应用等)的服务质量至关重要,因为某个网元设备网管提供的时
延数据对整个业务提供过程的影响是难以判断的。因此,电信运营商也需要以客
户业务为中心,对端到端业务过程中各环节的时延进行集中监视和管理。
①原始话单记录的数据对于衡量客户业务的使用情况是非常有价值的。原始
话单记录在目前的运营支撑系统中通过计费采集系统进行采集,并提供计费系统
进行批价及账务处理,而移动网管系统并不对以上信息进行监视。
服务保障系统通过对多种影响业务服务质量的数据的汇集,实现以客户为中
心的端到端服务质量监视,并在此基础上识别对服务质量降低起关键作用的业务
元素,帮助运营商采取纠正措施,从而提高客户满意度、业务使用率以及业务收
入。通过服务保障系统的应用,提供以客户为中心的端到端业务监控和管理平台,
可以显著降低服务质量问题从探测、分析、定位到恢复的时间,从而将电信网络
的运维提高到一个新的水平。
对于运营商来说,针对一个新的业务实现服务保障,应根据业务建立起服务
保障的分析模型,首先必须完成以下几个步骤:
·根据该业务的具体特性,定义需要监视的业务资源参数;
·定义对资源参数的监视方法及多种因素的分析模型;
·定义对业务资源参数进行数据采集的途径和方法;
·定义服务质量的显示方法,如不同业务的显示界面、告警及报告。
在此基础上实际搭建服务保障系统,可以实现以上内容。由于各种移动数据
增值业务具有不同的特性,以上四个步骤应根据不同的业务具体分析和定义,并
产生不同的分析内容。因此,要求服务保障系统的设计必须具有强大的灵活性,
针对不同的业务,通过灵活的配置就可以快速实现系统功能,而无需重新开发编
码。
根据以上要求设计的移动服务保障系统的结构框架如图2所示。整个系统可
以分为三个管理层面:
①适配层:通过与其他数据源系统的适配接口,抽取、转换、过滤数据,输
出服务保障所需要的资源数据。其中公共的功能通过接口适配平台实现,同时根
据数据源系统的情况灵活地配置适配接口。
①业务层:接收适配层产生的资源数据,通过数据的关联算法,以客户、业
务为中心,进行数据的关联分析,实现服务品质降低的根本原因分析;通过配置
的算法进行计算,产生关键质量指标(KQI)数据;同时根据预设的SLA阈
值,产生SLA告警和SLA报告。
①用户层:利用业务层产生的KQI数据,根据各业务的特性,采用数据表
格、图形、告警、报告等形式输出服务保障数据,并提供给其他系统使用。根据
业务不同,提供以客户、业务、SLA等为线索的不同的检索查询途径。
三、结语
从故障管理到服务保障技术手段的改变,是电信运维管理实现以网络为中心
向以客户为中心转变的必要条件。其中网络层故障管理系统建设是目前运营支撑
的重点之一,但其在根本上仍未摆脱以网络为中心的管理框架。在移动及NGN
数据增值业务大量涌现的情况下,对服务质量的保证有了更加迫切的要求,因此
对业务层服务保障技术手段的需求愈加明显。在服务保障系统的实现上,考虑划
分为适配层、业务层、用户层三个系统层次,并应提供强大的系统灵活配置扩展
功能。
参考文献
1 叶云,刘晓红,李全江.市场竞争环境下的电信运营支撑发展趋势.世界电
信,2003①1/2①:73~76
2 叶云,张帆.电信运营支撑系统的生产调度流程管理.中兴通讯技术①200
3①3①①25~28
3 Telecom Operations Map .GB910 V
2.1. TMF① 2000
4 Enhanced Telecom Operations Map ①eTO
M① / The Business Process Framework.GB9
21 V3.0. TMF① 2002
5 SLA Management Handbook. GB 917 V
1.5. TMF① 2001
6 Terms and Definitions Related to Qua
lity of Service and Network Performanc
e Including Dependability. ITU-T Recom
mendation E.800①1994
7 Handbook on Quality of Service and Ne
twork Performance. ITU-T① 1984① revise
d 1993
第 5 章 世界电信运维支撑系统(BOSS)3 月要闻综
述
2003-04-17 10:42 风铃 /(中国计费网 )
计费新闻
Intec 与捷克移动运营商 Eurotel 签署合同,为其 GSM、HSCSD 和 MMS
移动服务提供数据采集平台。Eurotel 是 Intec 融合数据采集系统在东欧的第一个
客户。
CSG 系统公司宣布,沃达丰集团旗下的葡萄牙子公司 Vodafone Telecel
Communications Pessoais .已经成功地安装了它的 Kenan®/BP 计费平台。
巴西电信正通过 Amdocs 提供的 ClarifyCRM 软件将其销售合支撑业务
标准化。
美国 XO Communications 公司正在安装 ADC 公司的 动态
传输管理平台,以提供融合计费合客户管理服务。ADC 公司还宣布,德国电信
将要采用 取代其现有的 IP 数据服务计费系统和客户服务系统。
服务保障新闻
TeliaSonera 集团旗下的立陶宛 UAB Omnitel 公司为其 GSM、GPRS 和
IP 网络安装了 Micromuse 公司的 NetCool 套件。
服务支持新闻
今年一月份收购了 Broadjump 公司之后,美国 Motive Communications
公司又为它的宽带服务自动开通产品 SmartService Suite 增添了不少新客户。三
月,继瑞士 Cablecom 公司之后,加拿大第二大电信公司 TELUS 也获得了宽带
解决方案的许可。到目前为止,Motive 公司在欧洲已经有 8 个宽带服务提供商
客户,这些客户的宽带用户占了欧洲总用户数量的 50%还多。此外,Motive 在
北美的宽带用户超过了 70%,早已确立了市场领导者的地位。
资源管理
Cramer Systems 公司宣布,位于西雅图的宽带网络服务提供商 Monet
Mobile Networks 利用 Cramer 产品套件,已经在北美率先推出了首款纯数据化的
高速移动网络服务。
同时,Groupe Cegetel 旗下的移动子公司 SFR 也在全美范围内安装了
Cramer 公司的资源管理解决方案,用于管理其 GSM 网络的开发和扩容。
CTIA 展会新闻
Instat MDR 公司估计 Wi-Fi 热点的数量已经从 2001 年底的 2000 个增
加到 2002 年底的 12000 个。Wi-Fi 是此次 CTIA 展会的重点之一。
和 CIBERNET 公司宣布他们将确定在 IPDR Usage 记录的现
有版本和 CIBERNET 的批发计费和结算协议间的连接计划。此举将简化 IP 使用
量数据采集中的点对点问题和移动及 IP 网络的计费与结算问题。
MetaSolv 软件公司展示的 Wi-Fi 网络解决方案解决了有关服务传输的
一系列问题,其中包括用户验证、对各种网络接入方式融合计费、服务水准协议
管理、虚拟个人主机服务开通和用户文件管理等。
Intec 电信系统公司公布了一套对 Wi-Fi 网络上各种基于 IP 的服务进行
使用量统计、定价、计费和用户验证的解决方案。它同时还能集成 Wi-Fi 的收费
和 3G、GSM、CDMA 及传统网络的漫游批发收费。
合作与联盟
惠普和 SchlumbergerSema 宣布扩展他们于 2002 签署的全球联盟协议,
以同时为两家公司的客户提供统一的服务支持。
Rocket 软件公司以每股 52 美分的价格收购了为全球电信产业提供软件
产品和服务的供应商美国泰思公司(TCSI)。
第 6 章 建设现代运营支撑系统
-- 电信业务的技术支持和保障系统(在中国联通做的技术报告)
北大青鸟集团 电信软件技术总监 Leo Huang (黄志勤)
引 子
今天,能有幸和各位领导、老总、专家们在一起,探讨在中国的国情下,如
何建造现在可用、未来可扩展的电信运营支撑系统(OSS),以此来提高运营商的
竞争力,这是北大青鸟集团和我个人的荣幸。十几年来,我一直在北美从事电信
运营支撑系统的设计和开发工作,接触过不少北美、欧洲的电信运营商和客户,
有能力提供综合业务的电信运营商,确实给客户带来了太多的好处和便利,在竞
争中有优势。
低成本、高效率地开展电信业务,对运营商内部的管理而言,要实现各纵向
业务的横向综合管理。对客户而言,要为他们提供跨业务的端到端(end-to-end)
的服务。因此,必须解决计费(和客户管理)、网络管理和业务流程管理三项主
要管理任务的一体化和自动化处理问题。借鉴国外近 30 年和中国近 10 年来的经
验,解决这一问题的必由之路,就是用现代的理论、方法和工具,建造现在可用、
未来可扩展的电信运营支撑系统(OSS)。近两年来,我在国内从事 OSS 的开
发工作,希望借此机会与各位同仁交流,为建造中国联通的电信运营支撑系统,
提一点建议,做一点贡献。
早期的电信运营支撑系统,如 Bell Lab 1974 推出 COSMOS(Computer
System for Mainframe Operations),以及晚一点出现 FACS(Facilities Assignment
and Control System)和 SOAC(Service Order Analysis and Control),其实已经
在很大程度上保含了现代运营支撑系统的思想。就我所知,这些系统在 90 年代
后期,还在一些美国的 RBOCs 中服役。当时推出这个系统是为了支持电话业务
中对开通、资源和工单的管理,在这段期间,OSS 的市场几乎被美国的 Bell Lab
和后来的 Bell Core 垄断着。
到了 90 年代,随着光纤传输、ATM、IP 路由、无线数字通信等新技术的出
现,导致互联网、移动电话等新业务市场迅速发展,同时,也加速了世界各国对
电信管理体制的改革,从封闭走向开放(如:美国 96 年的电信法规、欧洲 1998
年电信市场开放、中国允许电信业竞争等),从网络、价格竞争走向全业务竞争。
这种改变,推动电信运营商和 OSS 提供商重新定义了新一代的运营支撑系统
(NGOSS)的特性和需求。同时,也结束了 Bell Lab 和 Bell Core 对 OSS 的垄断
地位。
与传统的 OSS 相比较,NGOSS 最突出的特点是:以服务为中心,把商务管
理(计费、客服等)、网络管理(监测、设计、开通等)、内部业务流程管理
(工单管理)紧密地关联,一体化处理,支持综合业务的自动化处理过程,降低
成本提高服务质量。NGOSS 给运营商带来的好处是三个能力的提高:业务提供
能力、价格竞争能力、质量竞争能力。
一、新一代运营支撑系统(NGOSS)模型简介
当我们说到 OSS 时,多数人会立即想到一个计算机系统为运营商提供各种
各样的服务,如计费、工单、资源管理等。但实际上,即使一个很好的计算机系
统,也必须有一个与之相适应的使用环境,所以在运营商制定实施其 OSS 计划
时,还要考虑其机构设置、商业模式、业务流程等最基本最核心的管理问题。
虽然目前对于新一代运营支撑系统的需求、模式、系统架构及其必须的模块
的看法在理论上日趋一致,但还是有很多不同的意见。为了讨论方便,这里以具
有权威的 TeleManagement Forum 的 NGOSS 工程来讨论新一代的运营支撑系统。
NGOSS 的主要目标是提供一个体系架构(Architecture Framework)、系统
解析基础(Analytical Foundation)和实施过程方法(Process Methodology)。现
在正在做的重要工作包括定义商业流程架构(Business Process Framework)及其
详细的流程、定义系统架构(System Framework)和实际的建造方法(Practical
Implementation),以及建造实例。
NGOSS 的核心是 eTOM,即:强化的电信运维图(Enhanced Telecom
Operation Map),它确定了运维操作的定义和基本流程,其它部分都是以此为基
础的。
eTOM 最主要的图解之一如下:
图 1 eTOM 商业流程架构
从这个图和 NGOSS 对它的解译,我们可以看到,它首先定义了电信运营商
的主要功能流程(Functional Processes)。这些功能流程的定义是集世界上几百
家运营商和 OSS 提供商的经验而制定的。
首先,这个图是对功能流程最高一级的表示,而每一个功能将在 eTOM 中
被分层细化,使运营商有章可循;其二,eTOM 是在原 ITU-T TMN 四层结构的
基础上发展出来的,将商务计划与运营变成了既有关系,又相互独立的两部分,
而且强调了 CRM;其三,eTOM 将所有运营商共有的企业管理问题作为单独的
一部分提出来;最后,eTOM 将业务实现,业务保障,计费(FAB)作为其业务核
心。
eTOM 的主要目的,是为电信运营商和运营支撑系统供应商提供一个有共性
的运营模式和功能流程。尽管任何一个电信运营商都不会完全能照搬这个模型,
但每个运营商都应考虑参考这个模型去创建自己的模式,而不是完全靠自己的经
验从头来过。
除了商业和运营模型,NGOSS 还提出了 OSS 系统实现的架构、数据模型和
实现的步骤,以及系统构件如何实现数据共享和数据独立、模块及子系统接口、
在技术中性和技术特性两个层次如何管理异构设备等问题。这些问题正在实践中
不断地被完善。
二、NGOSS 在实用中的效果
OSS 在近十年来有了突飞猛进的发展,系统能帮助运营商减少人工成本,提
高效率,减少误差,甚至能完成一些人工做不到的工作,以保证服务质量。
NGOSS 包括的方面很广,下面从几个近来颇受重视的方面,来看现代 OSS 系
统在实用中达到的效果。
(一)纵向和横向自动化
我们首先从两个很时髦的字眼说起,一个是 flow-through(一条龙),另一
个是 end-to-end (端到端)。这两个词可以说代表当今 OSS 的趋势。一般来说,
flow-through 实现了 eTOM 四层结构的纵向自动化。举一个业务实例,假设一个
客户租用了运营商的虚拟专网的二等服务,他想将其现在的二等服务上升到一等。
客户首先可以从运营商的网站进入自己的帐户,并选择所要的一等服务。 当客
户选定服务后,OSS 系统首先会从系统数据库中调出这个客户的相关数据,核对
其现有的服务,然后通知网络资源管理改动其现在的设置。重新设置成功之后,
系统会更改客户的服务记录,计费系统重新设置对该客户的计费方式。系统最终
会发送 E-mail 给客户,告之新的服务已生效。如果系统在任何一步出了问题,OSS
系统可以自动回复并通知有关人员处理。
端到端是指同一个层面上功能之间的自动衔接。例如电路开通,从与客户设
备连接的一点开始,经过接入网到骨干网,再到接入网,到客户接入设备,由 OSS
系统一次开通。
flow-through 和 end-to-end,集中地反映了现代运营系统的自动化需求特点。
业务流程复杂程度不同,OSS 的贡献就不同。最近我看到一个报道,美国 Covad
电信公司实现了对跨网商的 8 步骤开通的自动化,使其开通成本下降了 70%。
运营商的业务在纵向业务部门之间横向流通,无疑是很重要的,它从运维上
保证了综合业务的实现。
(二)新的人力策略和质量保障体系
人们一般认为,实现服务管理层和资源管理层的接口是最困难的。 现代 OSS
力图自动协调服务层的业务,同时通过对资源管理层的自动处理,将运营商从繁
琐的底层操作中解放出来。
从商业角度看,现代 OSS 系统的核心是业务流程的管理和自动化。由于现
代 OSS 可以灵活地定义业务流程,并通过合理的业务流程管理,自动地处理与
业务相关的客户数据、计费设置、网络配置等烦琐的低层工作,并使部门之间得
到有效的、规范化的协调。将人为的因素和人工的干预降到最低水平,从而使运
营商有可能大幅度地减少技术人员开支,将人力集中于商业运作,诸如:市场调
查与分析、新业务设计、营销和客户服务等。
现代 OSS 给运营商带来的不仅是提高效率,降低成本,更重要的是为提供新的
服务和新的质量保障奠定了基础。
(三)资源管理
当电信业发展到一定阶段,客户量的增长不会再是运营商收入增长的主要来
源时,而且物理网络也不可能过于频繁地更新和提升,那麽,运营商只有充分挖
掘和利用现有的网络资源的潜力,提高服务质量,不断推出新服务,才能在竞争
中取胜。在世界电信业走入低谷的这一年多,很多运营商都在改进他们的运营支
撑系统,力争用现有的资源,高效地推出更多更好的服务。
资源管理已成为 OSS 中的重要一部分, 它能屏蔽掉由多种技术,多种厂家,
多种设备组成的复杂网络的异构特性,全面地监控网络资源(主机、设备、电路
等)的占用情况,进而有效地调整资源,充分利用资源,发挥资源的最大效益。
资源管理系统,一般还为运营商提供网络设计和预留功能。它能大大减少设
计错误,提高效率,为自动(或手动)开通做好准备。
因此,有效的资源管理不仅使运营商可以充分地利用自己的资源提高经济效
益,资源管理还是实现业务自动化和业务保障自动化的基础。
(四)综合业务
现代 OSS 系统具有很好的可扩展性和开放性,它能随着运营商的经营规模
和业务发展而不断扩充。这使它成为现代电信运营商参与全业务竞争,并保持长
久竞争能力的基础条件。
开展电信综合业务服务,要解决网络资源综合监视和调度、纵向业务之间实
现横向"端到端"服务,以及有效、快速地协调几个部门实施业务开通、电路开通、
综合计费、综合帐务等问题。现代 OSS 系统为这些问题提供了有效的支持。
几乎所有的电信运营商都企望从综合业务中获取更多的利润,经营范围包括
移动电话、宽(窄)带上网、固定电话、无线寻呼等多种业务。在北美和欧洲,
多业务"套餐"(固话、手机、上网等)是很有效的竞争手段。例如,将互联网服
务与移动服务组合销售,或甚至再加上其固话服务。客户一旦用上了这份"套餐
",不但享受了价格优惠,又有方便的综合帐单,他就很难更换运营商,这就是
所有运营商渴望的"客户忠诚"。当然,要作到这一点,其运营支撑系统必须支持
各纵向业务之间端到端流程操作。
(五)决策支持
近来,所有的电信运营商都把运营管理的核心,向以客户为中心和服务为中
心转移,使 BSS 成为了时髦的词。eTOM 将商业部分划为 SIP,其主要内容是商
业战略,结构和产品。
现代 OSS 系统把业务层管理、工单管理、网络层管理集中在统一的平台上,而
且统一处理。因此,它可以向运营商提供综合的运营数据和分析报表,为他们推
出新服务,发展和调整业务、网络、人力资源提供依据。
最近一篇文章,题目叫:"you can't measure what you can't capture"(你不能
估量你没有的东西)。OSS 系统很重要的一点是它可以为运营商提供综合数据和
综合分析,使运营商可以对综合业务实施和发展,的进行合理的预测、计划和运
作。如有多少网络资源、被占用了多少、新业务是否可开通;各业务的收益及其
占用的资源成本;员工的工作效率和业绩;等等。与人工系统或分散系统相比,
OSS 提供的报表是综合的、相关的,更接近人的思维过程和决策过程。
三、如何建设现代运营支撑系统
如何建设一个 OSS 系统不是一个简单的题目,它涉及到很多方面。仅在此
提出一些建议,以供参考。
(一)运营商的工作
一个常常遇到的现象,是运营商认为实现 OSS 系统只是选一个好的 OSS 系
统,而整个 OSS 开发过程与运营商的关系不大。其实,运营商在 OSS 实现过程
中应该是主角。只有运营商才知道自己到底需要一个什么样的运营模式和运营支
撑系统。运营商在建造 OSS 系统的过程中投入是很大的,希望新的 OSS 系统能
提升市场竞争力,降低成本,提高利润。因此,运营商不但要清楚自己现在的运
营模式,还必须考虑近期对运营模式的改进。在做决定之前,将现行的运营模式
和 eTOM 蓝图比较,提出今后几年可以预期的发展。
作为主角,运营商最主要的工作是制定一个切实可行的计划,对建造 OSS
的过程做出合理的阶段划分。如果没有一个好的分阶段计划,无论多好的系统都
可能使工程达不到预期的目的。
制定项目的总目标和各阶段目标是最重要的工作。目标的确定会涉及项目的
范围、相关的资源、建设的时间和花费等等。大多数的情况是电信运营商与咨询
公司或者 OSS 开发商合作,以运营商为主,共同制定开发计划。
一般说来,OSS 并不是对运营商原有运营模式的完全复制,而是对原有运营
模式的适当调整和优化。因此,要建立由运营商牵头、开发商参与的领导小组,
对有关问题作决策。这种组织机制的必要性,已被无数成功案例所证明。有了切
实可行的计划和组织机制,是 OSS 系统工程达到预期效果的基本保证。
(二)关于新电信运营商
各国的新电信运营商有很多共同特点,这些特点决定了他们发展和成长的道
路:
其一,他们的成长过程是和老运营商竞争的过程,他们希望在竞争中逐步扩
大和发展自己;
其二,由于在传统业务上占劣势,他们希望在新技术和新业务方面实现突破;
其三,各国的老运营商虽然有经营经验,但机构臃肿,服务意识差,新运营
商希望凭借有效的管理,降低成本,提高效率和质量,在服务竞争中取胜。
由于以上特点,新运营商更愿意采用新的管理方法,采用新技术。如果新运营商
只是照抄老运营商的经营管理方法和模式,就很可能在竞争中失败。从另一个角
度看,老运营商存在机构和人员的过度沉淀,难于采取新的运营管理手段,这是
各国老运营商共同的困惑;而新运营商机构精简、人员精干,只要采用先进的运
营管理手段,就可以达到低成本、高质量、高效益的运营效果,这是新运营商特
有的优势。
(三)如何选择和建造一个可用的 OSS 系统
由于电信运营是一个非常复杂的过程,新的网络技术日新月异,服务内容和
提供的方法总在变化。所以到目前为止,世界上没有任何一家公司能够提供一套
完整(完美)的 OSS 系统。事实上,各国的电信运营商在启动其 OSS 计划时,
并不只是选择产品,而常常是在寻找合适的 OSS 供应商作为合作伙伴(或者再
寻找一个咨询公司),和他一起制定计划,分阶段开发系统。在这个过程中,OSS
供应商将根据电信运营商的计划和具体需求客户化自己的 OSS 产品,并为他提
供持续性的维护和升级服务。
选择一个 OSS 系统并不是一件容易的事,运营商可以提出一大堆系统必备的特
性。首先是一系列必需的功能,再加上稳定性,扩展性等系统特性。我在这不累
述所有的条件和特性,而着重于下面的几个常常没有给与足够重视,而又重要四
个的特性:
1、功能可扩展性。随着电信业务的不断变化(包括:增加新业务、改变计
费模式、增加新的操作功能,等等),OSS 系统必须可以很容易地增加新功能模
块,而不对系统做重大修改。
2、承载可扩展性。随着客户容量的不断增加,OSS 系统必须平滑地支持硬
件(如:计费服务器)升级,而 OSS 系统本身并不做修改。
3、开放的内部接口特性。支持多种传输协议和数据格式,使 OSS 系统内
部的各模块(包括新模块)易于集成,并支持系统的扩展性。
4、开放的外部接口特性。支持与其他运营商的 OSS 系统的接口。
我认为建造一个 OSS 系统,其可扩展性和接口特性是至关重要的条件。否则,
系统持续的可用性会很差,因为它不能适应经常变化和发展的需求。
(1)、关于 OSS 系统的功能可扩展性
OSS 的可扩展性,涉及功能可扩展性和承载可扩展性两个方面。比较而言,
功能可扩展性对 OSS 系统本身的性能、对供应商的维护工作、对运营商的使用
都是更重要的。
在竞争的环境下,电信运营商会不断地更新业务、变化销售手段、优化业务流程、
建设和改造网络,甚至调整机构设置。因此,对 OSS 系统的业务管理层、工单
管理层、机构管理层、网络管理层都有扩展要求。
能扩展性的定义是系统可以很容易地增加功能模块而不对系统做重大修改
或者根本不做修改。运营商应在挑选系统时要着重考察系统的设计结构,以判断
其扩展能力。应特别注意的是,功能强大但扩展性差的产品,往往是危险的陷阱。
从技术角度看,功能可扩展性就是大家常说的"模块化"。但要注意,这和国
内很多软件提供商在他们的各类技术文件中所说的"功能模块"不是一回事。实际
上他们说的往往是"功能",并不是真正意义上的"模块"。真正意义上的模块化,
要有如下特点:
》系统必须有明确的 API 或接口,使新模块可以很容易地加入。
》任何一个模块,只要为其他模块提供服务,必须有明确的 API 或者接口。
》任何一个模块必须是针对一类任务充分逻辑化的,可以动态地配置和加载
具体任务。J2EE 的系统设计结构是这方面一个优秀的例子。
》模块的动态加载虽然不是一个必要的条件,但确使系统的扩展性大大提高。
除了以上这些,系统如何提供与多技术,多设备,多厂家网络的接口是所有 OSS
的一个挑战。不解决这个问题,全面自动化是不可能实现的。
(2)、关于 OSS 系统的承载可扩展性
关于如何应付承载可扩展性,大家都很有经验。举个例子,开展宽带接入业
务初期,可能只有几千用户,OSS(计费/客服系统)可很好地运行。一两年后,
当客户超过一定数量,系统不能支持了,于是采购新的计费系统。这是中国电信
业自 97 工程以来走过的道路。这不仅是一个浪费,而且在资费很低、利润很薄
的情况下,反复更换系统几乎是行不通的。
对于客户量正在发展中的新电信运营商来说,承载容量扩展性最实用的解决
方案,是在 OSS 系统中采用的分布式设计和小型机集群技术。当客户数量增加,
仅添置硬件设备,而 OSS 系统的软件不用改动。这也是近几年来国外新运营商
较多采用的办法。当然,如果运营商有足够的实力,已经有了很大的客户群,选
择大型机(Mainframe)也是很实际的,它有很多用分布式所不具备的优点。
采用分布式系统的好处是,小型机集群提供的处理能力与大型机基本相同,
但后者的成本要低得多。根据客户的增长情况,集群可随之扩大,使投资更加合
理。其缺点是,集群的管理较复杂,目前其稳定性和可管性还稍劣于大型机。
从技术上讲,分布式 OSS 系统能够解决承载能力扩展问题,但解决的程度
严重依赖于分布式系统的设计,一个优秀的 OSS 系统的分布式设计必须解决好
以下问题:
》负载均衡,即每个子系统可以同时有多个实例(Instance),同时处理一 o
个 Instance 能做的事。
》负载均衡的分布式系统的数据共享。虽然第一点已在某种程度上包含了这
一点,由于其重要性和 eTOM 将它强调点出,所以列于此。
》分布式 OSS 系统并不是简单的将系统不同的进程在不同的计算机上执行,
而要满足以上两条才是真正的分布式系统,才能具有真正的承载可扩展性。
(3)、关于 OSS 系统的接口特性
考察和评价 OSS 系统时,系统是否提供良好的接口特性是一个重大问题。
OSS 系统接口能力的强弱,直接影响到系统扩展的难度、费用和系统的长久可用
性。
一个运营商的 OSS 系统与老系统连接、增添新功能、增添新设备,或者与其他
运营商的运营系统相连接,都将遇到软件集成(OSS 集成)问题。在北美和欧洲,
OSS 集成往往给 OSS 系统的实现造成较大困难,有时集成费用超过 OSS 开发费
用。在中国,由于各个主干业务的运营系统相对独立,综合业务尚未开展,这个
问题尚不严重或者尚未完全显露。但真正实施 flow-through 和 end-to-end 全面自
动化的综合业务时,集成问题就会暴露出来。面对这个问题的对策,一是在规
划 OSS 工程时慎重考察和设计系统的接口特性,二是统一规划综合业务和 OSS
工程。
所谓接口通常是指两个问题,一个是传输协议;一个是数据格式。由于计算
机工业的发展,接口技术已经比较成熟。如 HTTP、JMS、RMI、CORBA 等,
数据格式也可以是 object、XML 等。但由于标准化不够成熟,所以不同的 OSS
产品之间没有直接的接口,需要做一定的数据转换。最近出笼的 OSS/J 希望在这
方面有所推近,但还处在初期阶段。所以,一个好的 OSS 系统必须至少提供较
为通用的接口,这将使集成简单化,这是选择 OSS 系统必须注意的。
除了上述系统之间的接口以外,运营商之间的 OSS 接口也是一个值得注意
的问题。我们经常可以看到 Gateway 和 Interconnection 这两个词,而且被看成是
现代 OSS 系统的一个重要部分。其实,这里面有它的历史背景,当 1996 年美国
开放电信市场时,FCC 要求老运营商(ILEC)允许新运营商(CLEC)租用他们
的设备和线路。ILEC 必须提供电子接口,使 CLEC 容易通过电子协议租用 ILEC
的资源。
虽然运营商之间的信息流在中国还不是一个大的问题,但我们已经可以看到
了前景。例如现在各省的联通就和广电有线路租用业务,而联通与广电的合作本
身就很有战略意义。另外,大电信运营商和当地的小运营商、代理商之间合作,
随着电信业务的发展这种需求也会增加。
因此在规划 OSS 系统时,不妨将运营商之间的接口也作为一个将来可能的
需求考虑进去。
以上涉及了系统的两个扩展特性,集成性和外部接口。其它比较通用的特性
如稳定性,可维护性等就不在这里详述。
结 束 语
中国的电信业正在快速发展,竞争也在加剧。所有电信运营商都在制定和实
施新的发展战略和竞争战略。现代化的运营支撑系统将为实施新战略提供有效的
技术保障。
经过几十年的积累,现在已经有了一套较为完整的电信运营模式和运营支撑
系统的架构模型,并在发达国家和地区被广泛应用。总体规划、分步实施、试点
起步,这也是国外电信运营商一般采用的建造过程,我们不妨借鉴,逐步地实现
运营现代化。
第 7 章 中国电信运维管理系统建设之我见
[ 作者:谭立蓉转贴自:神州泰岳软件股份有限公司技术战略研究中心点
击数:76 更新时间:2004-10-27 文章录入:admin ]
运维管理是电信运营商主要的生产和管理活动之一。运维管理系统建设和运
营的好坏直接影响到电信运营的整体成本、管理水平和服务水平。因此,近两年
来,各大电信运营商纷纷对现有的运维系统进行改造。
中国在电信领域的增长速度超过了其 GDP 增长的速度。正是电信快速的增
长,推动了运维系统的发展。如何更有效地利用现有的资源,提高运营维护的工
作效率,提高整体服务质量是目前各大运营商面临的普遍问题。毫无疑问,中国
电信在运营维护方面,也面临相同的问题。建设新一代中国电信运维管理系统,
成为解决目前运维管理问题的唯一方案。
神州泰岳自 1998 年开始涉足电信行业,6 年中积极参与了各大电信运营商
运维管理系统的建设和改造,亲身感受到系统建设实践中的成败得失。中国电信
运维管理系统,如果要做得更好,就必须“站在巨人的肩膀上”。只有吸取其他项
目的经验和教训,才能够使得项目的建设更加成功。
“站在巨人的肩膀上”,我们看到下面的几点问题,值得我们在中国电信运维
系统的建设中更加关注。
一、采用 ITIL 作为运维系统的方法论
IT 基础架构库(ITIL-ITInfrastructureLibrary),被誉为 IT 服务管理的圣经,
其中包含了总结国际大公司在 IT 服务管理中的经验并得到证明的 IT 服务计划
和运营的最佳实践框架。
ITIL 已经为《财富》500 强的一些企业所采用,并取得了预期的效果。加特
纳(Gartner)和国际数据集团(IDC)等世界权威研究机构的调查研究表明,企
业通过在 IT 部门实施最佳服务管理实践,将因重复呼叫、不当的变更等引起的
延误时间减少了 79%,每年每个终端用户平均节约 800 美元的成本,同时每项新
服务推出的时间也缩短一半。
要成为国际一流的企业,就要吸取国际一流企业的成功管理经验,借鉴其管
理手段。因此,中国电信在运维管理系统的建设,也应确立 ITIL 在系统建设过
程中的方法论地位,吸取 ITIL 中的成功经验。
作为众多国际大型企业成功实践的积累,ITIL 使我们找到了解决运维流程
规范的方式和方法。可是,如何更好地运用 ITIL 这一经典的方法论呢?我们认
为应该注意两点:
1)ITIL 是从实践中得来的精髓,不是僵化的教条,应该结合实际情况去运
用 ITIL,建立更加适合中国电信的流程规范,而不是照抄照搬。
2)由于 ITIL 理论博大精深,不可能在短期内在企业中全面实施。应该根据
实际情况,选取实施重点,逐步实施,逐步完善。
在中国电信运维系统建设中,应该深入理解 ITIL 的核心理念,结合电信运
维的现状,解决核心和关键问题,逐步实现对运维的科学管理。
二、ITIL 理论与实际情况相结合,注重工作流程细节的设计和优化,是系
统建设的关键
理顺工作流程、提高服务效率是新运维系统建设的主要内容之一。
在工作流程的制定过程中,容易陷入以下两个极端。
1.盲目照搬流程。作为方法论的 ITIL,本身含有大量的成功实践框架。但
是,正如前面所说的,ITIL 是从实践中得来的精髓,不是僵化的教条,盲目照
搬,只能使得工作流程不切合实际,并流于形式,对系统的贯彻和执行产生不好
的影响。
2.完全遵照现有流程,实现其电子化。虽然这样更符合目前的工作习惯,
可能容易为运维人员所接受,但是,仍然解决不了目前运维所存在的一些问题。
例如,我们在项目实施中曾遇到“工单在部门之间的重派”的问题。在当前手工作
业的工作模式中,各单位将不属于本单位处理范围的工单,或部门需要其他部门
配合的工单,均提交给故障处理的负责人,由该负责人向其他单位进行转派和重
派。这种处理方式,主要便于手工作业条件下负责人及时了解项目处理状况。在
建立运维系统后,负责人可以通过运维系统随时了解到故障的处理状况,每次重
派和转派之前,对负责人的回复变成了一种无效的工作,大大降低了事件的处理
效率。如果仅仅将目前的手工作业电子化,那么故障处理的效率仍然没有得到有
效的提高。
因此,将 ITIL 理论与实际情况相结合,注重工作流程细节的设计和优化,
是系统建设的关键。
三、树立主动服务观念
在现行的运维工作中,我们经常遇到这样的情况:一方面是运维部门疲于应
付各种突发事件,加班加点处理各种重复事件,工作繁重,身心疲惫;一方面是
客户代表不断抱怨和投诉“技术人员服务水平太低”。二者不可调和的矛盾,是新
运维系统要解决的重要问题。
传统的运维方式给人的印象是:故障发生前,维护人员似乎无所事事;故障
发生后,则是手忙脚乱。这就是被动服务给人们留下的印象,运维人员是在被动
地等待故障的发生。在新的运维系统中,我们必须改变原有的运维方式,变被动
服务为主动服务。
在主动服务模式下,运维人员主动地监控系统的变化,对日常工作及故障处
理完成后主动进行问题分析,对系统的变更风险进行评估。在新系统中,可以通
过种种技术措施,使得运维工作从被动服务转移到主动服务,如:增加变更管理
流程以防范变更风险。
在日常运维工作中,变更工作是在所难免的。例如,新的系统安全漏洞被公
布,为了保证系统安全,就需要安全系统补丁,而这种变更给系统带来的风险则
是难以估计的。例如在安装补丁后,有时会产生大量莫名其妙的问题。这么一个
简单的例子已经可以说明,如果没有很好的风险防范手段,系统变更将给我们的
日常运维工作带来大量的问题,后果往往是难以想象的。在新系统中,我们可增
加变更管理流程。在变更管理流程中,变更方案需提交变更经理,由变更经理组
织由专家组成的变更顾问委员会(CAB)对变更进行风险评估,在评估通过后才
能够进入变更的实施过程。变更管理是防范变更风险的最好办法。
当然,主动服务是一种理念,在这种理念下,我们可以定义更多的流程,如
问题管理流程,对系统中存在的隐患问题进行挖掘,防患于未然。总之,我们应
该树立这样一个理念,在各流程的定义中进行运用,主动地提早发现系统存在的
风险和隐患,减少突发事件的发生。
四、从平台到业务的全面管理
网络管理是运维系统的组成部分。对系统的监控也是运维的主要业务之一。
以往网管系统实现了对平台的监控,可是在实际运维工作中,平台往往只有少数
的几个系统管理员负责,大多数业务人员更多地是面对业务系统。对于业务的监
控和管理,是业务人员更加关心的问题。因此,在网管系统中,应加入业务监控
的内容。
需要注意的是,业务是建立在平台的基础之上的,而不是孤立存在的。因此,
监控中,应强调业务监控与平台监控密不可分的联系,从业务的角度出发,建立
平台与业务的关联关系。在故障发生时,应能够即时描述对业务的影响程度,能
够描述故障的影响范围。
例如:采集源的某台交换机产生异常,除了可以看到交换机告警外,我们还
应该能够在业务拓扑图中直观看到,采集系统受到影响,同时采集、预处理、分
拣等相关业务也不同程度受到影响。其影响程度,能够通过不同的颜色直观地展
示出来。
只有这样才能够更加直观而全面地反映系统的运行状态,反映业务的运行情
况。能够帮助运维人员在故障发生时,快速修复关键部件,减少故障带来的损失。
五、建立科学的激励与监督机制
多年来,系统的使用和推广问题成为系统能否得到良好运用的一个重要问题。
假设:我们制定了变更管理流程,但是,变更管理没有被很好地执行,而只
是流于形式,则风险的防范也只能是停留在理论上的空谈。
在运维系统建设过程中,建立了一整套科学的考核制度,以激励运维人员更
有效地提高服务质量和服务水平,是至关重要的。
对运维人员的考核,并不能就管理论管理,应该从客户服务的角度出发,以
客户满意为前提,进行考核。例如,根据每个部门的服务水平,制定了服务时限。
假设,某个用户投诉,需要多个部门协同进行处理。在处理过程中,各部门互相
推托,虽然工单在各部门的停留时间没有超过部门承诺的时限,而整体处理时间
已经超过了运营商对该用户承诺的处理时间。为了杜绝这种现象的出现,我们应
该从用户的角度出发,进行各部门处理时间的分段计算。计算结果将反映在每月
故障处理情况的统计报告中,而这些报告直接与各部门、各单位的绩效考核挂钩。
通过这样的考核机制,形成对员工日常工作的科学评价,既调动了员工积极
性,又提高了工作效率和服务质量。
以上就是我们在多年来参与电信运维管理系统建设所获得的一点经验,希望
能够为中国电信新的运维管理系统提供借鉴。
第 8 章 对电信运维管理体制的研究
2004 年 1 月 14 日 14:37 通信世界网
信息产业部电信研究院 鲁春丛
运行维护是电信运营公司的生产与管理工作职能之一,建立公司运营的长远
战略目标必须与建立现代化的运维管理体制并进,以最大限度发挥网络资源的应
用效率,降低运维管理成本。
一、电信运维管理的体制
电信运维管理体制是根据电信网络运行维护生产管理需求,结合现有网管技
术条件,遵循运营整体要求而建立的运维组织机构、人员配置、职责划分、运作
流程等各方面运营要素的管理方式与管理制度的集合。不同的电信运营公司基于
自身经营业务的定位、网络技术方式、公司治理结构可以采用不同的电信运维管
理体制。对电信运维管理体制的认识和理解可从以下几个方面出发。
1.维护需求
维护需求是制定运维管理体制的基础。电信网络的运行维护管理具有全程全
网性特点,每个层次的运行维护管理部门对应负责不同的运行维护管理行为,由
此形成不同的运行维护生产作业方式和不同的运行维护管理体制。维护作业是确
定维护管理职责的基础,对某一特定层面的网络,其维护管理需求体系如图 1 所
示。
图 1 维护管理需求体系
第一层:区域[现场]作业层
区域[现场]作业层为运维生产作业层次结构中的最低层,直接受网管监控层
部门的领导与指挥,负责所辖区域网络设备及基础设施[动力电源、环境、局房
等]的现场值守、维护、巡检,接受网管监控层的调配指令实施相关故障修复、
资源调配的具体实施与操作,对于移动网络,该作业层还包括现场的 CQT、DT
测试等。该层要求工作人员具备一定的综合维护技能,各区域要保证配备一定数
量高技能的人员指导综合维护人员开展维护工作。该层的技术人员为公司运维部
门的非核心能力层,视实际情况可以采取一定范围内的外包维护形式,如用户线
路的代维、光缆线路与管道的代维、基站主体设备与配套设备等的代维、机房环
境的代维等等,网管监控层的部门对其进行考核。
第二层:网管监控层
网管监控层是电信运营公司运维生产作业环节中唯一实施 7 天①24 小时实
时监视、操作、控制的部门,面对所管理区域内的各种网络设备进行集中操作维
护和网络管理、对网络资源实施配置调度等。全网绝大部分的故障处理基本在这
个层次完成,那些通过网管监控手段不能完成的生产作业,由区域[现场]作业部
门完成。该层次分为网络管理、网络维护两大基本职能。网络管理面向网络业务,
职能是资源管理、运行监视、数据配置、数据管理、性能管理、故障管理,必要
时对网络进行控制,保证业务不可用时间(MTBF—meantimebetween failure)降低
到最低程度,体现“集中维护”原则。
第三层:技术支援层
技术支援层是整个生产作业层中技术层次最高的部门,负责对全网各个专业
网络运维中出现的热点难点问题进行技术支援,还可负责面向客户的系统集成等。
技术支援层内可以按照专业设置交换专业、传输专业、数据专业、备品备件专业
等等。该层的技术人员是公司运维的核心能力层技术人员,也可以是设备供应商
的技术支持人员。
2.运维管理体制的形成与演进
运营公司的网络涉及交换、传输、数据等多个专业,每一专业网络分成省际
层、省内层、本地层。运维组织机构的设置有两种方式:一种是按照专业组织,
即按照网络专业划分若干维护管理部门;一种是按照功能层次(网络管理层、网
络维护层、现场维护层)组织,该方式比较适合通信网络全程全网的特点,从国
内外运维组织建设的历程来看,这种运维组织方式是普遍推崇采用的方式。针对
维护需求在集团、省、地市公司运维部门的不同分配形式,相应产生了不同的运
维管理体制,如图 2 所示。
图 2 运维管理体制的形成
考虑到集团公司、子公司、分公司体现出不同的管理职责,电信企业的运行
维护管理体制主要可以分为三种类型,即:传统型、过渡型、现代型,其主要区
别在于维护作业的集中程度有差异,如图 3 所示,其中,现代型型体制在业务提
供能力、业务保障能力、成本控制能力、综合竞争能力等方面具有明显的优势,
成为国外较先进电信企业所广泛推崇采用的模式。运行维护管理体制既受制于电
信企业的整体管理体制,又受制于网络及网络管理技术条件的发展程度以及主管
领导的战略思想,因此在实际电信企业的管理实践中,不同的电信企业形成了不
同的运行维护管理体制,即使在一个电信企业集团内部,也可能由于各种因素的
影响,而采取不同的维护管理体制。国内电信企业基本以分散型体制为主,这是
由我国电信企业特定的发展历史、网络和网管技术现状以及企业整体上的传统管
理体制决定的。
图 3 电信运维管理体制
近些年来,通信技术、网络管理技术和计算机技术的迅速发展使得对通信网
络进行“集中监控、集中维护、集中管理”成为可能。远程的集中操作维护在逐步
代替绝大部分的现场维护作业方式,网管监控系统已经成为电信生产经营活动中
必不可少的重要的技术手段,是实现现代化网络运维管理的基础。技术手段的进
步极大地改变了人们的思想观念,传统的网络管理模式正面临着激烈的变革。同
生产力与生产关系之间的辨证关系一样,网管技术与运维管理体制是相辅相成、
互为依托的关系,没有先进实用的网管技术,无法建立现代化的运维管理体制;
不改进落后的运维管理体制,再先进的网管技术也难以发挥作用。组织结构、人
员配置、运作流程、考核机制、支撑系统是电信运维管理体制建设的基本要素和
重要环节。
以 AT&T 为例,1976 年~1995 年其运维组织机构的变动情况如表 1 所示,
从中可以看出,随着通信网络数字化程度的提升、网管技术的发展和广泛应用,
电信运营企业的运维组织机构逐渐趋于精简,集中维护作业程度逐步提高,技术、
体制的同步发展促进了企业生产能力、管理能力、竞争能力的迅速提高。通过分
析电信运营企业某些业务的生产管理流程,可以发现需要改善和提高的具体环节,
以及运营企业自身与国际一流的运营企业的运行维护体制的差距。
表 1AT&T 运维体制的演进过程
197619801984 1991 1995 以后
数字化程度(%)0 不详 20 90 100
全国网管中心(个)111 1 1
区域控制中心(个)10107 2 2
传输维护中心(个)30277 2 2
交换维护中心(个)1002710 2 2
现场作业人员管理中心(个)1000300 不详 不详 100-150
二、影响运维管理体制选择的因素
1.技术因素
影响运维管理体制的技术因素中,首先是通信网络技术,它决定着运维管理
体制数字化程度的提升;其次是网管技术,网管技术正与计算机技术、通信技术
同步发展。电信管理网是一个跨多个电信管理部门,管理基础网和多种电信业务
网,并管理多个网络层次和子网,具有多种网管功能的综合的网络。运营网络要
包括多种与网管有关的一系列标准和规范,不同级别的电信管理部门、不同种类
的基础网和业务网(如电话交换网、IP 数据网、移动通信网、SDH 传输网等)、不
同网络层次和子网(如传输网中的一、二级干线网、同一种厂家设备构成的子
网)、不同的网管层次(如网元管理层、网络管理层、业务管理层、事务管理层)都
可以按照 TMN 的概念、原则、标准和规范来设计网管系统或子网管理体制。由
这些网管系统或子网构成电信管理网。
TMN 的演进主要受到以下几个因素影响:用户需求的不断变化;软件技术
和数据通信技术的不断进步;新的分布式管理技术的出现;电路和分组混合网络
的综合管理。根据这些因素在未来的变化,今后 TMN 的演进将重要表现在以下
几个方面:一是基于 CORBA 的网络管理框架和模型及其标准的制订将逐渐成熟,
并得到越来越广泛的应用;二是使用 tML(telecommunicationsMarkupLanguage)
作为电信 OAM&P 的功能实体(如计费、维护和指配)间的消息格式,首先在 X
接口应用,然后逐渐扩大到在其他接口使用;三是电路和分组混合网络(HCP)
的综合管理,主要目标包括:确保端到端的管理信息的及时流动以支持商业流程;
通过支持 HCP 环境下分组和电路交换网络资源、应用和业务的综合视图,在一
点就可以实现端到端的业务管理;实现 HCP 环境下端到端的网络管理。
网络管理方面,比较知名的国际研究组织有 TMF (电信管理论坛)和
ITU-TSG4(包括 TMN 在内的网络管理研究),从目前的研究进展速度来看,
ITU-TSG4 已经落后于实际运营企业的发展要求。TMF 的优势是其立足于企业运
营过程,提出相应的管理框架、管理支撑系统建设标准,其提出的 eTOM、NGOSS
模型在业界产生了较大的影响。2003 年 10 月 27 日~11 月 7 日,ITU-TSG4 在
日内瓦召开会议,邀请了 TMF 组织的成员进行相关的介绍,ITU-T 董事局成员
有意促成 TMF 与 ITU-T SG4 在相关标准制定方面的融合,进一步推动网络运营
管理标准研究制定工作。
2.管理因素
影响运维管理体制的管理因素,涉及公司治理结构、组织结构的变化、流程
的调整等等。电信运维管理组织是电信运营过程的有机组织部分,受制于公司大
环境的发展。领导的意识、公司管理机制、网络实际情况、支撑系统能力都会对
运维管理体制的选择产生重要影响。
三、国内电信运维管理回顾与展望
2000 年,中国电信完成重组,实施政企分开、公司化运作,在运行维护观
念上,逐步从被动维护向主动维护转变,从以前的面向网络设备、网络运行质量
向面向网络服务转变,建立了大客户等级维护的方式,数据网、电话网加强维护
协作,机线联席得到加强,“铁路警察各管一段”的情况得到根本性扭转;在提高
网络运行质量的同时,中国电信致力于降低故障率、故障历时,提高故障修复及
时率,采取了机、线维护承包等一系列措施提高运行维护对市场和客户的反应速
度,人均维护量、维护效率迅速提升;面对激烈的市场竞争,中国电信认识到资
源意味着生存,开始加强网络资源管理,部分本地网开始建设资源管理系统,由
于对资源管理认识上的差异,资源管理系统的建设不尽相同。总体说来,20 世
纪 90 年代,中国电信全国本地网的运行维护及管理方式一直处于“变中求进”的
状态,通过摸索和实践,基本形成了“集中监控、集中维护、集中管理”的运行维
护格局,基本适应了网络设备维护的需求。
中国移动集团在 2000 年以前,网管系统的建设思路与网络管理工作基本沿
袭传统的三级管理模式与“分散、分权、分级”的运作机制,所有通信设备的维护
工作实体集中在地市分公司这一层次上,现业局承担了大量的运行维护工作(设
备维护的第一责任人是地市分公司)。集团公司、省级移动公司对维护工作只是
偏于行政性质的管理,对于网络管理工作,主要是基本的统计分析、报表等工作。
该网络管理模式已经落后于现代化的移动通信网络环境、网络管理技术的发展,
落后于国际上同类的运营公司,网络管理的效率和优势远远没有发挥出来。在
2000 年之前,中国移动的网络管理体制的不完善主要体现在两个方面:一是网
络管理级网管系统的手段还不够健全;另一方面是网络管理模式相对落后。网管
系统是实现网络资源的优化、网络集中监控管理和调度的必要手段,是保证通信
网络高效、可靠、经济和安全运行的支撑系统之一。结合移动网络的自身特点,
2000 年 8 月,在全国网络运行维护工作会议上,中国移动提出了建设集中化的
两级网管建设方案,即集团公司和省公司两级集中化的网管模式,地市公司级不
再另行开发建设相应的网管系统。
2000 年,中国移动集团公司及各省公司开始建设集中化两级话务网管系统,
集中化两级网管系统建设大大推动了网络运维的集中化管理,为快速生产指挥调
度管理提供了保障手段。很多省移动公司将省网管中心与省集中操作维护中心融
合,并赋予省网管中心生产指挥调度职责,提高了网络的应急反应速度,缩短了
故障历时,为全网在紧急情况下快速疏通受阻及拥塞话务打下了良好的基础。
从总体发展形势上看,中国移动集团公司、省公司网管中心的职能在发生变
化,网管中心由传统的辅助行政管理的角色正在转向以生产职能为主的角色转变,
网管中心已经不再局限于话务分析、报表的范围,而逐步向网络运行全过程实时
的维护、监控、管理过渡,摆脱了原有的逐级上报方式所固有的低效率状况,并
且与客户、市场、业务的开展建立起越来越密切不可分割的关系。集团公司、省
网管中心正在逐步对各专业网络进行以集中监控、性能统一分析、数据统一制作、
资源统一调度、网优方案集中制定等为核心内容的网络生产指挥调度管理,使网
络管理机构相对集中,减少管理层次,实现网络快速的生产指挥调度管理。中国
移动两级集中化网管系统建设的提出,符合集团公司的支撑系统集中化战略要求,
为中国移动建设现代化、集中化的运维管理体系奠定了坚实的基础。
第 9 章 北京移动电子运行维护系统(E-OMS)工
程
背景:
北京移动通信有限责任公司主要经营移动电话通信业务(包括语音、数据、多媒体等),IP 电话及互
联网接入服务;开展移动通信、IP 电话和互联网网络设计、投资和建设工作。
在迅速提高网络能力的同时,北京移动还为客户提供清晰的语音服务,提供呼叫转移、来电显示、呼
叫等待、三方通话、17951/17950IP、互联网接入、短信息、彩信、来电畅听、移动随心聊、神州行亲情号
码、彩铃、信息点播、语音信箱、移动秘书、手机银行、手机证券、全球通 WAP、移动梦网等多项服务,
并已实现 GPRS 全面商用,使移动网与数据业务、多媒体业务、IP 电话业务、互联网业务相结合,综合通
信能力达到国内同行业先进水平。
目前,北京移动通信有限责任公司的通信网络实现了与全国各省、市、自治区的国内漫游及世界上五
大洲的 100 多个国家和地区的国际漫游。
应用需求:
为了满足不断变化和发展的客户需求,提高中国移动的服务水平和服务质量,增强对不断出现的新业
务的支撑能力和反应速度,中国移动集团公司提出了建设"中国移动电子运行维护系统"(以下简称 E-OMS)
的需求。北京移动参考中国移动 E-OMS 规范要求,提出建设电子运行维护系统。它是网络维护部门指挥、
调度、管理日常生产任务的主要手段,是电子流程系统的重要组成部分。各级网络维护部门将通过电子运
行维护系统完成日常生产任务的指挥、调度、管理,实现工作的电子化、流程化。
根据集团公司 E-OMS 系统建设的精神,结合北京移动网络运行维护的具体要求和经验教训,北京移动
提出了"在国际先进的运维支持管理平台的基础上二次开发建设北京移动电子运行维护系统"的设想,并于
2003 年 10 月份确定由神州泰岳公司承担建设北京移动 E-OMS 系统的任务。
解决方案:
根据北京移动的现实业务环境,结合《北京移动 E-OMS 技术规范书》中的要求,神州泰岳根据丰富的
实践经验,为该项目量身定制了解决方案。
一、采用最佳实践经验
方案的核心思想是"在融合了最佳运维支持业务经验、久经实践和时间检验的成熟商用运维支持平台软
件的基础上,通过定制和二次开发实现 E-OMS 系统的业务需求"。
众所周知,各种计算机业务系统的建设先后经历了三个时期,这三个时期是与 IT 发展水平相适应的,如下
图所示。
业务系统建设的时期
在最初的原始阶段,业务的流程通过规章制度、业务规范等方式体现,人们在日常工作中遵从这些规
范制度以手工方式展开业务;后来,为了提高工作效率,增强业务处理能力,人们开始采用计算机系统模
拟和取代手工方式处理业务,进入计算机系统应用初级阶段。
为了实现特定业务的需要,底层数据存储、多机通讯、业务逻辑等全部从操作系统底层自行开发;随
着大量同类应用系统的开发和使用,人们逐步认识到,在每个业务系统中重复开发底层业务无关技术细节、
重复实现同类应用的共性需求,不但浪费人力物力、造成项目拖延,增加项目风险,而且无法借鉴和融合
同类业务经验、无法把精力集中于特殊的业务需求上。因此,业界逐步总结出各类业务系统的共性需求,
把他们剥离出来,形成数据库系统、中间件系统以及各种业务处理平台。这样,新的业务系统开发就可以
借鉴恶利用现成的业务处理平台的架构和内含的行业经验,开发工作专注于特定业务的特殊需求,从而更
快地开发出更好的系统。这就是系统建设的高级阶段。
本项目在运维支持平台基础上进行高起点、高标准建设,代表了 E-OMS 系统发展的方向,具备"直接
在底层开发的初级阶段实现"所不可比拟的技术和业务优势。
首先,从业务角度看它融合业界最佳经验,可以优化业务流程。运维支持平台融合了运行维护行业多
年积累的经验,可以借鉴他人经验,扬长避短,不但能够完全实现用户的需求,而且还能优化目前的流程
和任务,避免系统建设过程中走弯路。在同类项目推广过程中,用户会提出许多新的需求和改进意见,这
些新需求绝大部分包含在平台产品的缺省功能中,只需进行配置并培训用户即可。
其次,从技术层面看,成熟商业软件在体系架构、可用性、可靠性、可扩展性以及用户界面方面极具
优势。服务平台软件支持各种操作系统和数据库平台,为不同规模用户提供了灵活的选择;其 CSS 三层架
构的体系架构,可以同时支持 Web、Client、eMail 甚至 PDA 等各种用户界面,可以支持双机容错、多机
负载均衡等各种特性,可以充分保证系统的可用性、可靠性、可扩展性和性能。完全满足规范书中对安全
性、性能、扩展性、可维护性的需求,其中每一种特性都是数年的经验积累,只有成熟的商业软件才能做
到这些方面。
另外,从项目建设来说,开发周期短,项目风险低。由于是基于运维平台实现的,可以借鉴业界运维
经验,降低了需求反复的风险;同时因为是依托于稳定可靠的 IT 平台进行扩展和修正,减少了开发的工作
量和难度,大大缩短了项目开发周期,降低了项目管理风险。经验证明,采用这种方式实现系统可比底层
开发方式及时,并至少减少一半的人力和时间。另外,也可以快速实现用户新的需求,保障系统推广工作
的成功。
二、贴近用户的解决方案
本项目所涉及的业务范围包括:
① 值班管理 排班、交接班、维护作业计划和值班日志管理
① 任务工单管理
① 故障工单管理
① 实物和备品备件管理
① 基站和小区规划数据管理
① 运行资源管理
① 知识经验管理和公告板及论坛
本系统主要供北京移动内部员工使用,共有网优、运维、工建、传输、郊运、网络 6 个二级业务部门
使用该系统。采用两台服务器作为业务和数据库服务器,这些服务器部署在北京移动的业务网络上。系统
部署如下图所示:
系统组织连接图
本系统使用的 SUN 数据库服务器、DELL 应用服务器、WEB 服务器、接口服务器以及数据库服务器
使用的磁盘阵列和磁带库集中部署于北京移动某中心机房的机柜内。
网络连接方面,这四台服务器都统一连接到该机房的核心交换机,保证系统使用人员的计算机于这些
服务器的联通性。要求接口服务器在 IP 层与集团公司 EOMS 接口服务器、网管系统接口服务器、客服 USD
系统服务器、OA 系统中相关服务器保持联通。
本系统四台服务器需要占据以太网交换机的 4 个端口。端口速率可以是 10M、100M 或 1000M,可由
用户根据运行过程中的实际情况调整。
该项目覆盖了网络运行部门的各种业务流程,共实现新建机站、机站割接、天线调整、天线改造等 40
多种业务流程。
用户收益:
电子运行维护系统是网络维护部门指挥、调度、管理日常生产任务的主要手段,是电子流程系统的重
要组成部分。各级网络维护部门将通过电子运行维护系统完成日常生产任务的指挥、调度、管理,实现工
作的电子化、流程化。北京移动电子运行维护系统完成之后,将更加有效地管理工单流用户数大约为 70 个;
备品备件(资产)管理的用户数约 20 个;变更管理的用户数约为 20 个。本系统的主要流程是故障处理等
实时性较强的工作,本系统的建设将能以更快捷的方式直接指挥各生产单位完成工作,加快处理流程,缩
短反应时间。
第 10 章 建立宽带接入综合运维体制
(2004-07-15 08:51:46)
从中国宽带接入市场总体发展情况来看,随着技术条件的成熟,网络的融合,
特别是网络边缘部分的融合正成为电信发展的大趋势。为了顺应接入层融合的发
展趋势、满足大客户综合业务一站式购齐的需求,运营商开始建设综合业务接入
网。综合业务接入网的维护不仅包含了传统的话音业务,还增加了 DDN 数据专
线业务、ADSL/VDSL/LAN 等宽带接入业务,运维体制也由原有的按业务网独立
设置维护部门的分散维护体制向统一集中网管和大客户 SLA 服务的方向发展。
为此,有必要建立一套综合运维的机制,构筑面向市场、面向用户的运行维
护服务平台,打造集中统一的网络维护体系,使运营商的网络资源得以充分利用
和发挥,最大程度地保护现阶段对接入层的投资。从网络运营的角度看,长期支
撑和维持不同类型设备在同一个网中运行是十分复杂和昂贵的。
因此,在接入层投资建设上,面对多元化的接入技术,建立一个模块化结构
的公共接入平台应该是发展趋势,可以简化网络结构、网管和指配,减少重复的
元部件,降低接入网成本,保护投资,缩短业务提供时间,节约网络长期演进和
技术更迭的成本;在接入层管理维护上,面对激烈的市场竞争和日益提高的用户
服务质量的要求,建立一种“以客户为中心,以效益为导向”的综合运维机制是适
应新时期接入层融合的必然趋势,可以有效降低维护成本,加强对网络的维护,
确保其安全、高效运行,从而提高对用户、对市场的响应速度,更好地为用户和
市场服务。
综合运维体制模型的核心思想是“设备层统一维护,业务层分权维护”,从而
实现网络管理系统和业务管理系统的相对独立(统一的网管平台实现多业务网络
的集中维护管理,同时提供多个业务发放渠道满足多业务网络各种业务开展的需
求),组织结构也可以相应地简化为接入网网管中心和数据维护中心,可以明确
各部门的职责划分、简化维护流程,从而有效降低维护成本,提高维护效率。
设备层统一管理
接入网网管中心负责综合业务接入网的设备层维护,其网络管理系统可以实
现窄带话音接口板、宽带 ADSL 和 LAN 接口板、数据专线接口板等基本硬件的
维测,硬件故障告警,环境电源监控和线路测试等,即保障接入层物理网络的安
全稳定运行。
对于设备层的统一管理,可以根据网络规模的大小,采用不同的网管平台,
通过选用不同的服务器配置(可以是台式机、PC 服务器和工作站)和服务器数
量实现全网设备的统一集中网管。该集中网管系统支持全网的拓扑管理(例如全
网 OLT、ONU 的组网拓扑)、环境电源监控(包括综合接入设备机柜、机房环
境的监控)、集中告警等功能,并可以根据行政区域的划分支持多个客户端的域
管理和授权,收集和统计各客户端上报的故障告警、性能统计等信息。各客户端
主要负责本区域设备的管理维护、接受统一网管中心的权限管理、向统一网管中
心上报告警数据等。
业务层分权管理
数据维护中心负责多业务的发放,其业务管理系统是根据不同业务网资源情
况进行纵向调配的专业资源管理和用户管理系统。由于各专业业务网络的维护人
员对业务层比较熟悉,他们的精力可以集中在如何更好地开展各种业务、使网络
增值上。而对于设备本身、线路的维护则可以统一交给设备层的接入网网管中心。
业务层的分权管理主要是建立多业务的发放策略,通过业务端口管理功能实
现多业务网络(PSTN、DDN 和 ATM/IP 网络)的业务发放。例如,窄带语音业
务的开通,就是通过业务端口管理功能中的 PSTN 端口管理模块和 V5 接口管理
模块,建立交换机和接入网之间业务发放的渠道,从而保证交换机侧和接入网
侧 V5 接口和 E1 中继接口数据配置的一致性,实现语音业务的安全发放。同时,
各业务的发放渠道在统一网管平台上有相应的权限控制,维护人员可以根据自身
的专业特长维护相应的业务网络。
(人民邮电报)
第 11 章 企业监控中心解决方案
随着电信、金融、制造业、及政府各部门数据集中的逐步实现,各行业对整体 IT 系统(硬件、软件、
网络通讯……)的可用性要求也越来越高,而当计算机系统的硬件,软件,网络等本身已定型运行后,
良好的运行维护管理系统及标准的管理流程就会成为确保业务系统稳定高效运行的最有力的工具。
由于集中后的 IT 系统内涉及的设备种类繁多、分布地域广阔,因此对全系统运营和维护管理工作水
平要求很高。对于各企业 IT 部门的管理者来说,如何使信息系统安全、稳定、可靠地运行,即如何
管好、用好这庞大的 IT 系统,如何利用这些系统使企业的业务上个台阶,并如何保护在系统建设中
投入的大量宝贵资金,是摆在 CIO 们面前的一个崭新的、具有挑战性的课题。
发展趋势
IT 的日常管理不仅要管理复杂的计算环境,更重要的是从用户业务管理的角度管理应用系统环境。进
行应用系统服务管理,就是将整个企业的应用系统资源按照企业内的特定业务划分开来,企业应用系
统管理员只需要管理影响每一业务处理的那些系统资源,其中可以包括业务所在的主机系统资源、业
务所牵涉的网络设备,业务所使用的数据库系统、打印机,业务应用系统,以及该业务所依赖的其他
应用系统等。
IT 服务管理理念可以为管理者提供统一、共同、开放的方法,通过各级的服务中心可以对系统所有的
资源进行集中统一的管理。在一致的管理平台和管理规范下,各级管理员可以通过系统管理软件完成
对分布式、跨平台、跨系统的网络、服务器/客户机、数据库、应用软件的集中和集成管理。如下图
所示:
IT 服务管理所强调的面向业务的应用系统管理将使被管理的系统具有高度的可扩充性,能随计算机系
统和企业业务的增长而增长,实现系统内的分层次管理、分角色管理等。同时 IT 服务管理所具有分
级的、可共享的、带有主动性的管理特点,使系统及网络管理的复杂性大大减小了。
客户面临的挑战
IT 部门通常被认为是高成本/低质量的部门,这是一个普遍存在的问题,造成这种现象的原因很大程
度上是由于 IT 与业务的脱节,往往是老总说要解决某一个问题,IT 部门再作相应的采购和实施,而
缺乏从企业整体的角度来解决问题。
IT 部门处于被动一方面说明它没有被足够重视,同时也说明 IT 系统并没有发挥出真正的作用。很多
企业的 IT 应用停留在较低的层面上,并非不可或缺,而很多 CIO 是在从技术的角度考虑 IT 的建设,
而不是从业务出发,他可以告诉 CEO 需要什么样的设备,但投入多少,能够产生多少回报;如何去
驱动业务发展等问题考虑得相对较少,所以很难让 CEO 真正感觉到 IT 对业务的推动,那么就只能是
业务的支持部门。
直到现在,企业在购买 IT 设备时,通常只考虑价格和性能,而忽略了业务流程和人员配置。当然 IT
设备运转起来很容易,设备厂商也会提供相应的技术支持,但这些设备是不是运转在最佳状态,为业
务创造了最大的价值就很难保证。比如说 CallCenter,同样的设备在不同的企业运行的效率会大不相
同,因为它不仅涉及技术,还包括操作的流程和方法,以及与其他 IT 设备的配合等很多方面。更关
键的是,突发事件发生时,企业的 IT 能否保证业务关键系统的不间断运行,把对业务的影响降到最
低,这些因素可以反映出一个企业 IT 管理水平的高低。那么有没有一套好的 IT 管理方法和标准可以
作为参照呢?
惠普企业监控中心解决方案
惠普的 ITSM 参考模型源于 CCTA(英国国家电脑局)开发的 ITIL,符合全球第一套 IT 管理标准
BS15000,是一套 IT 组织用来计划,研发,实施,运维高质量 IT 服务的标准方法。它能协助 IT 部门
建立以服务为导向的 IT 运作,在全球已被多于一万家在各行业处于领先地位的商家在自己的 IT 日常
运作中所采用。
惠普的企业监控中心解决方案以惠普的 ITSM 参考模型为流程建设标准,以惠普多年来对各行业顶尖
公司的 IT 部门支持经验为基础、在对客户 IT 系统结构的当前 IT 运维管理流程进行分析和调研后,
为客户设计 IT 运行维护管理系统平台, 并按照标准,根据客户的具体情况规划和设计运行维护管理流
程,最终将所设计的运行维护管理流程客户化于运维管理系统平台, 即在 HP OpenView 相应的软件模
块上实施 ITSM 中的呼叫管理、事件管理和问题管理等集成化支持流程与配置、变更和服务级别管理
等质量管理流程。从而为 IT 部门提供一个工作流管理的系统平台,在将 IT 部门运作从被动式服务向
主动式服务转化的过程中,提供规范化的 IT 流程管理, 为 IT 工作人员和 IT 管理人员提供一个灵活
量化的服务管理平台,从而使已往繁杂的 IT 管理变得标准而有序。
解决方案架构
惠普所提供的服务
IT 服务管理流程咨询服务,按 ITSM 标准规范,为客户设计 IT 运维管理流程(包括配置管理、事件、
问题、变更与服务级别管理等流程)
1. 逻辑工作流程设计
2. 物理工作流程设计
3. IT 运行维护管理系统平台设计及技术咨询, 根据 IT 系统组成结构, 为客户设计运维管理系统
平台,并负责该系统平台实施(包含与第三方产品的集成)
4. 责运维管理系统平台实施及集成(包含与第三方产品的集成)
5. 按 ITSM 标准规范化的 IT 运作流程客户化配置运维管理系统平台
6. 培训,文档交接。
7. 协助客户管理运行维护管理系统平台 (可选)
惠普企业监控中心解决方案给您带来的益处
帮助客户建立规范化的以服务为中心的IT运作工作流程,并将相关的IT运作流程固化在
运维管理系统平台上
分享惠普通过十年多服务管理所积累的最佳案例
帮助您的支持服务部门从提供被动式服务转而提供主动式服务
实现持续性地服务质量改进
知识积累与知识库管理
实现部门间信息沟通与共享
实现量化管理,并与管理决策或绩效考核相联系
降低 IT 运营成本,提高服务质量
为什么要选择惠普
10 年以上的 IT 服务管理专业经验
在服务提供商和企业中 12 年的管理经验
全世界超过 650 个 HP OpenView 咨询顾问
150 个 ITIL 和 ITSM 认证的专业人员 (中国大陆:20 名)
在 ITSM 和 ISM 领域的业界领先地位
成功案例
浙江移动 ITSM 项目
浙江移动是中国移动(香港)公司的全资子公司。目前,其移动电话用户有 500 多万户,网络规模和
用户总数连续 6 年尾随广东移动稳居全国第二。业务支撑中心管理着浙江移动庞杂的 IT 应用系统,
包括计费系统和营业账务系统(有营业、收费、账务等子系统)。其中,直接面对消费者的计费系统
是中心的生产系统,他们采用了集中模式;而营业账务系统则分布在其下属的 11 个市级分公司。这
些系统一旦出现故障或问题,维护支持全部由总部业务支撑中心承担,仅记费系统的维护工作量就占
到他们日常故障处理量的 40%左右。
通过本次浙江移动 ITSM 电子化服务解决方案项目的实施,中国惠普公司为浙江移动业务支撑中心建
立起一套适应业务发展需要及管理需求的较为完备的 IT 服务管理流程,以及支持该流程的 Service
Desk 电子化服务平台。该服务管理流程及电子化平台将为浙江移动业务支撑中心的高效有序运行及
管理提供强大的支撑,保证业务支撑中心对省公司及省内十一家分公司的业务系统及其它相关系统如
网络,数据库和用户申告进行及时、高质量的处理,对重大问题提供快速响应和及时解决,同时实现
业务支撑中心业务处理情况灵活统计和分析,确保业务系统正常运行,满足各业务职能部门对省公司
业务支撑系统的要求。
中国联通综合电信业务支撑网网管项目
中国联通的综合电信业务支撑系统是联通当前的 GSM 和 CDMA 业务的支撑系统,包括计费结算、综
合营帐和客服系统以及目前正在建设的 OA 系统。所有系统都呈现两级应用和三级中心(全国、省分
和地市)的布局方式。整个联通的综合电信业务支撑系统由大量的网络设备、主机系统和各种应用组
成,需要一个中心控制的能管理联通的综合电信业务支撑系统中所有设备和应用的综合管理系统。"
中国联通综合电信业务支撑系统网管系统"项目的目标是在北京联通总部计费结算中心建成一个覆盖
联通当前所有的业务网(G 网、C 网)的支撑系统(计费、营帐、客服)和内部 OA 系统的综合网管
系统,能够对全国所有的业务支撑系统和 OA 系统的资源利用和故障性能等实施统一的监视和管理。
第 12 章 GSM 本地网集中操作维护系统
GSM 本地网集中操作维护系统
一、系统简介
大用软件有限责任公司研制的 GSM 本地网集中操作维护系统是专门针对
移动网络运营商 GSM 网络的实际情况提供的一套整体解决方案。系统提供:
①及时、准确的网络故障定位和处理手段;
①方便、灵活的网络性能统计与分析方法;
①全面、直观的网络配置管理与控制模式;
①严密、周到的系统安全控制策略;
①分布、可维护、可扩展的系统接口等功能。
系统将设备管理和业务管理有机结合,为 GSM 本地网络提供一个综合的管
理平台,不仅可以将不同厂家不同类型的网络设备进行统一的管理,而且将具体
的业务和网络设备、服务结合起来。完成了移动电信运维从有人值守向少人或无
人值守的转变,从事后维护向预防性维护的转变。
二、系统功能
本系统结合数据仓库技术、Web 技术和 GIS 等技术,针对移动电信运维部
门的业务流程,提供了一整套企业网上的移动电信运维业务处理的解决方案,具
有强大的运维业务管理功能。
①集中操作维护
将网络中不同平台上的 OMC 操作集成到一个集中操作界面中,并结合直连
网元的方式,实现对网络内所有设备的集中操作维护,从而快速解决故障,缩短
故障历时,保证全网设备运行正常。
①告警管理
通过告警面板、网元拓扑图、GIS 系统,对网元设备的实时告警进行显示,
实现对告警的监视、预处理和查询等操作。
①配置管理
结合网元拓扑图和地理信息系统,直观地反映网络中各种类型的设备资源配
备和重要参数的设置情况,支持具有特定权限的用户对网元设备的操作指令。
①性能管理
向用户提供了一整套基于 Web 的对性能数据进行查询、分析和处理的图形
化工具。
①安全管理
采用防火墙技术、用户身份确认机制、用户分组权限管理、数据加密机制以
及完备的操作日志等强有力的安全措施,保障用户资源和数据信息的安全性,使
系统管理员对系统的安全状况了如指掌。
①工单管理
工单管理是结合告警的监视功能来完成故障处理的整个流程,其处理流程是
在参照实际业务的基础上实现的,包括从工单派发和接收到故障处理和故障取消
整个流程。
①报表工具
系统除能自动生成数十种符合移动业务处理需求的固定报表,还提供了方便
易用的报表制作工具,操作人员可根据需要制作相关报表,并可定制成模板,供
其他操作人员使用。
①工作流控制
系统提供了对业务流程的灵活定义、重组和监控的功能,同时还具备基于工
具的客户定制和二次开发能力。
三、系统特点
①采用了软件进化论开发思想,解决了软件开发过程中用户需求与开发过程
脱节的问题,保证了系统的实用性,提高了开发效率。 ①运用了图形可视化技
术,实现了对可管理对象的可视化管理。
①利用成熟的 Intranet 技术,实现了一套企业网业务处理机制,为各级网管
人员提供了灵活、方便的个人业务处理桌面平台。
①遵循 TMN 管理结构,采用面向对象的管理技术和数据仓库技术,保证系
统数据的实时性和有效性,实现了对运营数据的复杂分析以及数据挖掘和融合的
功能。
①分布式、对象化数据处理技术,使系统处理服务便于扩展,并提高了系统
健壮性和响应速度。
①系统应用层采用完全基于 Web 的三层应用体系结构,各类应用处理基于
灵活的构件方式开发,可以任意拆装和组装,客户端无须安装任何应用模块。
第 13 章 CNC Connected 商业网运维优势
2001-12-21 15:30:15
CNC Connected 在整体网络结构确定的基础上,建立支撑系统,对人员
的组织结构、定员定岗进行合理的定位,同时配以有效的业务开放流程及故障处
理流程,以保证业务的迅速开通、故障的快速响应和及时处理,创一流的网络服
务质量,不断扩大 CNC Connected 商业网锁定的的目标群体,使 CNC 在竟争激
烈的宽带接入市场中处于主动地位。
一、CNC Connected 先进的网络技术构架
CNC Connected 网络是一个基于 RPR 综合传送平台,利用 MPLS
VPN/V LAN 技术的虚拟 IP 专网。此网络承载于 CNC Net 和 CNC Man 之上,充
分利用了现有的传输以及 IP 网络资源。简单的说,就是通过在 CNC Connected
所覆盖的大楼和区域汇聚节点,利用先进的节点设备,并对骨干网和城域网的通
信资源(如电路、带宽等)作充分预置,组成一个业务专网,利用集中的网管系
统,为高价值用户提供快速的业务开通、故障处理、业务恢复等高等级通信服务。
由于利用 RPR 综合传送平台,可以提供可靠的 QoS 服务及对带宽的
动态管理和拥塞控制机制等,因此增加了对整体网络的控制力度,减少了运维的
压力;
基于 MPLS VPN 技术组网方式的 CNC Connected,在与 CNCnet 骨干
网的 MPLS VPN 互联时采用跨自治域,为实现客户在全国各城市的 VPDN 连接,
采用 INTER-AS 技术。MPLS VPN 组网技术对网络的运行而言,首先是安全性
较高,其中的路由信息分发限制和 MD5 路由认证技术,可使用户所依赖的公网
成为可以信任的网络,MPLS 还同时支持防火墙技术及高层应用加密,和其它网
络技术相比,可进一步增加网络的可靠性,因而增加用户的信任度。其次,具有
可管理性,由于 MPLS VPN 工作机理并不进行协议封装,这样用网管软件即可
进行很好的管理。另外,还具有极好的网扩展性,支持数据流的分类、流量控制、
掉包控制、拥塞控制等,具备完全的保障 QOS 的能力,由此减轻日常运维工作
量,操作简单、快速。
在已使用 MPLS VPN 技术的城域网内构建 CNC-Connected,也可使用
VLAN 技术实现网络构造,利用城域网内三层交换机汇聚业务,采用二层 VLAN
技术将不同的客户化分不同的 VLAN,用 GE Trunk 到骨干网内 PE 路由器,PE
根据不同的 VLAN ID 区分业务,并映射到不同的 MPLS VPN 中。这样,针对用
户的不同接入业务需求,只需在用户接入点的用户交换机上划分不同的 VLAN,
就可以实现不同的接入业务,从而便于业务的开放,提高运维的效率。
总的来看,与其它的网络相比,CNC Connected 网络结构先进、层次简
单、响应快,网络性能较好,障碍率相对较低,日常处理各种情况更加便捷。
当 CNC Connected 的用户通过 VPN 模式,收发企业内部文件、商业资料,实时
信息、商业机密时,用户对网络的可靠、安全非常注重,因此 CNC Connected 先
进的技术构架,最大程度地满足了用户的需求,同时为优质运维打下了良好的基
础。
二、CNC Connected 网络管理架构和运维的关系
作为 CNC Connected 全国性接入网网管系统,采取两级网管组网:网元
级网管 EM 和网络级网管 NM。网管系统采用 MPLS VPN 组网,交换机采用私
有 IP 地址,以防止黑客对交换机网管系统进行非法攻击。整个网管系统按功能
划分为:网络监控、故障处理、业务配置、网络安全、性能分析、网络资源统计
调度,网络基本单元为网元。
由于采用独立网管、独立计费的方式,因此,在硬件方面能提供方便、
快速的维护服务,例如快速的业务受理、优先的故障受理等级,灵活、完备的计
费方式等,以满足用户的各种需求。
此外,CNC Connected 网管系统还配备辅助工具,以便提前发现问题、
及时处理。在各区域中心(分公司)设置网管工作站,同时配置网络协议分析仪、
网络测试仪等,当各区域发生故障时,可及时判断故障点,抓包分析可能出现的
错误配置、物理连接中断等,并进行快速处理。
三、CNC Connected 完备的支撑系统
建立完备的 CNC Connected 资源管理系统、定单处理系统、故障受理系
统平台是为正确和快速提供业务而附加的子网络,可以实现全网资源实时查询、
实时更新;实现快捷的定单受理、业务开放;快速的故障受理和故障自动升级管
理等功能。
四、从网络运行维护组织架构看 CNC Connected 的运维优势
在相对独立的网管系统中,网管中心的网络监控 7×24 小时负责 CNC
Connected 整个网络的正常运转,可进行端到端的网络监控,定期进行日常网络
测试作业,实时处理 CNC Connected 网络出现的一般故障,指导和监督当地驻店
工程师日常运维工作和一般故障处理,保持与客服的联系,受理和处理故障处理
单。技术支持主要负责 CNC Connected 全网重大故障处理技术支持,根据网络运
行报告制定 CNC Connected 网络优化方案并实施,定期向上级运维管理部门汇报
并提供网络状况报告和网络性能指标分析。业务开放过程包括业务受理,主要负
责 CNC Connected 全网业务端到端的按时正常开放,CNC Connected 全网网络资
源库的日常更新、统计和维护,向当地驻店工程师下发业务接入子派工单并督促
实施,向有关部门提供网络资源使用数据,并提出相关分析和建议。
网络监控和技术支持及业务开放的分离,强化了网管中心的职能,各部
门各负其责,主要包括日常例行测试及业务的开通、障碍的及时发现、一般故障
及重大故障的处理、网络优化及性能的分析,层次分明、便于协调,使每个人的
能力得到充分的发挥。网络监控值班人员集中精力专注 CNC Connected 的日常状
况,确保出现问题及时发现,确保做好网络的日常维护;技术支持人员由于免去
了处理日常例行的工作,有精力及时间对网络进行研究,肩负处理重大故障的责
任,并定期进行网络性能指标的分析及对网络的优化,确保网络的服务质量;在
业务开放实施过程中,由于通路已预置,对常规的业务受理流程进行简化,保证
实现端到端的按时开放业务。
各分公司区域维护中心负责 CNC Connected 各地网络及设备的日常维
护,保证辖区内网络及网络设备 7×24 小时运转,网络故障 7×24 小时现场快速
处理,受理日常用户业务,制定用户业务接入方案,按照时限实施网管中心下发
的用户业务派工单并向网管中心反馈完工信息,按照网管中心要求完成其他作业。
同时,考虑到 CNC Connected 所面对的特定客户群特性,即主要是 5X8 小时工
作制,所以,区域维护中心的驻店工程师也是 5X8 小时工作制,在非正常企业
上班时间内发生的故障的紧急业务开放,都由 7X24 小时的全国网管中心和区域
维护中心值班人员完成,大大提高了总体的工作效率。
五、面向业务,合理的定员定岗、严格的考核制度体现 CNC Connected 的高
质量的运维
1、 网管中心人员岗位的设定
2、 区域服务中心人员岗位的设定
其中,CNC Connected 最具特色的是配备驻店工程师,其具体职责如下:
① 日间定时巡查辖区内所有网络设备,并纪录状况。
① 日间配合网管中心进行故障处理。
① 根据网络设备资源情况,实时更新资源情况,驻店工程师必须对楼宇内
的各种情况非常熟悉(包括环境、客户、设备、布线、资源等)。
① 根据用户情况和网络状况提供用户接入方案。
① 根据销售签订的业务合同向总部业务受理发送业务受理单。
① 根据网管中心下发的派工单按时完成用户接入,并向网管中心发送业务
完工单。
六、按照运行规范,制定严格的考核制度是高质量运维的保证
1、 网络运行规范
●传输产品指标
误码率≤10-9e
●VPN 业务
时延≤60ms
丢包率≤1%
●IAD 业务 时延≤100ms 丢包率≤2%
●业务响应 30 分钟
●业务开放 24 小时
●故障反应 30 分钟(反馈时间)
2、为保障网络运行的各项指标,制定严格的考核制度,各项指标都要分解
到每个人,对运维人员进行定期与不定期的培训、考核,培养一支高素质的运维
队伍。
七、CNC Connected 网络质量 SLA、QoS 保障体系
根据现有网络 MPLS VPN、VLAN 技术实现对业务的服务级别划分。
一类提供最高质量的服务,能保证严格的带宽、时延、抖动和丢包率指标,及其
它增值服务;二类提供较高质量的服务,能保证比较严格的带宽、时延和丢包率
指标;三类提供可接受质量的服务,不保证具体的性能指标。
八、高效、简洁、流畅的运作
流程是 CNC Connected 的运维突出优势
业务开放流程:区别于一般业务的开放流程,简洁、快速、正确是根本,由
于路由已预置,所有的定单只在驻店工程师和网管中心的业务开放工程师之间来
回操作。
业务开放准则: 一个工作日完成业务受理/开放(指 CNC Connected 内部资
源)、响应快速、接入质量优良。
故障处理流程:扁平化的管理,生产完全流程化、标准化,在网管中心的统
一协调、指导下,现场维护人员密切配合排除故障。
故障处理准则:以恢复业务为第一,全网 30 分钟响应。
总之,CNC Connected 运维有许多的优势:先进的专网、充分的资源预
置、统一的调度指挥、专业化的本地维护队伍、专注贴身的服务等。