IT 服务应急响应预案模板
预案编号:IT-ERP-【年份】-【部门】-【序号】
适用范围:公司核心业务系统(ERP/CRM/OA)、基础设施(服务器 / 网络 / 存储)、数据安全等突发
故障
预案版本:
编制日期:年__月__日
审批人:________________
一、 总则
编制目的建立标准化的 IT 服务应急响应机制,明确故障分级标准、责任分工和处置流程,快速响应各类
突发 IT 故障,最大限度降低故障对业务的影响,保障公司业务连续性。
编制依据依据《IT 服务管理规范》《业务连续性管理计划》《数据安全管理办法》及相关法律法规制定。
应急原则
生命至上、数据优先:优先保障人员安全(如涉及机房物理安全),核心业务数据备份与恢复优先于系统
修复。
分级响应、协同处置:按故障影响程度分级,明确不同级别响应流程和责任人,跨部门协同配合。
预防为主、平战结合:定期开展应急演练,优化预案,提升团队应急处置能力。
二、 组织架构与职责分工
应急小
组
组长 成员 核心职责
应急指
挥组
IT 部门负
责人
运维经理、业务部门负
责人
决策故障定级、资源调配、对外沟通、审批重大
处置方案
技术处
置组
IT 系统服
务经理
运维工程师、数据库工
程师、网络工程师
故障排查、技术修复、数据恢复、系统验证;记
录处置过程,输出故障分析报告
业务协
调组
业务部门对
接人
各业务线负责人
反馈业务影响范围、提供业务验证标准;协调业
务部门配合故障处置(如暂停非核心操作)
后勤保
障组
行政 / 财
务负责人
行政专员、采购专员
提供应急物资(如备用硬件)、协调供应商到场、
保障应急处置所需资金和资源
三、 故障分级标准
故障等级 判定标准(满足任一即可) 影响程度 响应时效要求
Ⅰ 级(特
别重大)
1. 核心业务系统全公司范围内瘫痪≥2 小
时 2. 核心数据库数据丢失 / 泄露 3. 全公司
网络中断≥4 小时
业务全面停摆,可能
造成重大经济损失或声誉
风险
10 分钟内启动应急
响应,指挥组组长到场指
挥
Ⅰ 级(重
大)
1. 核心业务系统局部区域 / 部门瘫痪≥4
小时 2. 非核心系统全公司瘫痪≥8 小时 3. 重
要数据备份失效
部分业务中断,影响
关键业务流程
30 分钟内启动应急
响应,技术处置组组长到
场
Ⅰ 级(较
大)
1. 核心系统单一功能模块故障≥2 小时 2.
局部网络中断≥2 小时 3. 单部门非核心系统
瘫痪
局部业务受影响,可
通过替代方案缓解
1 小时内启动应急
响应,指定工程师负责处
置
故障等级 判定标准(满足任一即可) 影响程度 响应时效要求
Ⅰ 级(一
般)
1. 个别用户终端故障 2. 非核心系统轻微
功能异常 3. 不影响业务运行的小范围问题
影响极小,可快速修
复
2 小时内响应并处
置,服务台工单跟踪
四、 应急响应流程
1. 故障发现与上报
发现渠道:服务台工单、用户反馈、系统监控告警、巡检发现。
上报要求:发现人需立即记录故障现象、发生时间、影响范围,通过电话 / 企业微信同步至技术处置组,
重大故障需同步至应急指挥组。
2. 故障定级与启动预案
技术处置组 10 分钟内初步判定故障等级,填写《故障定级申请表》提交应急指挥组审批。
Ⅰ/Ⅰ 级故障:立即启动本预案,通知所有应急小组成员到位;Ⅰ/Ⅰ 级故障:按常规工单流程处置,技术
处置组跟踪。
3. 应急处置核心步骤
处置
阶段
具体操作
责任
主体
注意事项
故障
排查
1. 收集故障现象、系统日志、监控数据 2. 采用 “排除
法” 定位故障点(硬件 / 软件 / 网络 / 数据)3. 输出《故
障排查报告》
技术
处置组
避免盲目操作导致故障
扩大,严禁在未备份数据的情
况下执行修复操作
技术
修复
1. Ⅰ/Ⅰ 级故障:优先启动备用系统 / 容灾方案,恢复
核心业务 2. 按方案执行修复(如重启服务、替换硬件、回滚
数据、封堵漏洞)3. 实时向指挥组汇报处置进度
技术
处置组
备用系统启动后需同步
验证业务功能,确保可用
数据
恢复
1. 针对数据丢失故障:从最新备份介质(本地 / 异地)
恢复数据 2. 数据恢复后需校验数据完整性和一致性
技术
处置组
异地备份优先于本地备
份,恢复前需确认备份数据未
被污染
业务
验证
1. 系统修复后,由业务协调组组织业务部门进行功能测
试 2. 验证通过后填写《业务恢复确认单》
业务
协调组
需覆盖核心业务场景,确
保无隐性问题
4. 故障解除与复盘
故障解除条件:系统功能完全恢复、业务验证通过、监控指标正常运行≥1 小时。
故障解除审批:Ⅰ/Ⅰ 级故障需应急指挥组签字确认,Ⅰ/Ⅰ 级故障由技术处置组确认。
复盘要求:故障解除后 24 小时内召开复盘会,输出《故障根因分析报告》和改进措施。
五、 应急保障措施
资源保障
硬件保障:配备备用服务器、交换机、存储设备,定期检查可用性;机房配备 UPS 电源,保障断电后核
心设备运行≥2 小时。
数据保障:核心数据执行 “321 备份策略”(3 份数据副本、2 种存储介质、1 份异地备份),每日自动
备份,每周人工校验。
供应商保障:建立核心供应商应急联络清单,明确 7×24 小时技术支持响应要求,签订应急服务协议。
人员保障
应急小组成员需熟悉本预案流程,定期参加应急技能培训(如故障排查、数据恢复)。
建立轮值制度,确保 7×24 小时有技术人员在岗,联系方式保持畅通。
演练保障
每季度组织 1 次应急演练,模拟 Ⅰ/Ⅰ 级故障场景(如核心数据库崩溃、全公司网络中断),检验预案
有效性。
演练后输出《应急演练评估报告》,优化预案流程和资源配置。
六、 附则
本预案由 IT 部门负责解释和修订,每年至少修订 1 次,重大故障处置后及时更新。
应急响应过程中,相关人员未履行职责导致故障扩大的,按公司制度追究责任。
本预案自发布之日起生效。