
3.4.5 IT事件后果评估
在IT事件先期处置完成之后,需要对IT事件的后果进行评估,以便确定企业各条线下一步采取的IT事件恢复行动。
IT事件会造成IT损害和IT事件影响两方面的后果,IT损害包括IT人员伤害和IT资源损害,IT事件影响包括IT服务影响、业务运营影响、企业影响、社会影响。所以,IT事件后果评估应包括:①评估IT资源损害;②评估IT服务影响;③评估业务运营影响;④评估社会影响;⑤评估人员伤害。
IT事件后果评估需要企业各条线的合理分工协作,IT事件后果评估行动框架如图3-22所示。

图3-22 IT事件后果评估行动框架
下面,详细说明IT条线、业务条线、企业层面的IT事件后果评估任务。
1.IT损害评估
对于不需要IT损害控制的大部分IT事件,在IT事件预警之后直接执行IT损害评估行动。对于需要IT损害控制的一小部分IT事件,在紧急事态得到缓解后执行IT损害评估行动。
1)IT损害评估的目的包括以下几点。
(1)评估IT资源损害情况,为下一步确定恢复对象和恢复方法提供输入。
(2)评估IT服务影响,为业务运营影响评估提供输入。
2)IT损害评估的职责包括以下几点。
(1)IT运维值班经理负责组织IT损害评估行动,负责将较大IT事件、重大IT事件损害评估结果上报IT应急领导小组,负责在事后填写IT损害评估表,如表3-3所示。
表3-3 IT损害评估表

(2)机房环境一线值班人员负责对所辖机房环境系统进行初步的IT损害评估。如果机房环境一线值班人员无法评估事件或预计事件无法解决,则即刻通知机房环境二线技术支持人员(由机房环境系统技术专家担任)和机房环境三线技术支持人员(通常由机房环境系统厂商方的技术人员担任)。如果发现事件符合较大IT事件或重大IT事件特征,则即刻通知IT运维值班经理,以便及时上报。
(3)IT系统一线值班人员负责对所辖IT系统进行初步的IT损害评估。如果IT系统一线值班人员无法评估事件或预计事件无法解决,则即刻通知二线IT技术支持人员(通常由各专业技术专家担任)和三线IT技术支持人员(通常由厂商技术人员担任)。如果发现事件符合较大IT事件或重大IT事件特征,则即刻通知IT运维值班经理,以便及时上报。
(4)IT系统二、三线IT技术支持人员负责支持IT系统一线值班人员完成所辖IT系统的损害评估。
(5)机房环境系统二、三线技术支持人员负责支持机房环境一线值班人员完成所辖机房环境系统的损害评估。
(6)IT应急领导小组负责将重大IT事件损害评估结果向企业应急领导小组汇报(IT条线通常可自行处置较大IT事件或一般IT事件,一般不需要向企业应急领导小组汇报较大IT事件或一般IT事件的损害评估结果)。
3)IT损害评估的步骤包括以下几点。
(1)评估IT资源损害。评估内容参考“2.4.1 IT损害”。
(2)评估IT服务影响。在确定哪些IT资源遭到损害之后,参照图3-23提供的IT服务影响评估方法,推导出受影响的IT服务范围和影响类型,同时对照帮助台收集的来自业务部门的IT服务报障信息,确定IT服务影响。

图3-23 IT服务影响评估方法
①——机房环境系统设备与IT系统设备支撑关系表 ②——网络系统设备与网络基础服务系统设备支撑关系表③——网络系统设备与应用系统设备支撑关系表 ④——网络系统设备与信息安全系统设备支撑关系表 ⑤——网络基础服务系统设备与应用系统设备支撑关系表 ⑥——网络基础服务系统设备与信息安全系统设备支撑关系表⑦——信息安全系统设备与应用系统设备支撑关系表 ⑧——应用系统设备与应用系统支撑关系表 ⑨——应用系统与IT服务支撑关系表
(3)确定受损IT资源的恢复方法,如表3-4所示,确定启用的恢复预案或操作手册(可能是本地故障紧急维修手册、高可用恢复操作手册、灾难恢复预案)。
表3-4 IT资源的恢复方法

(4)逐级通告评估结果。IT运维值班经理向IT应急领导小组通告评估结果,IT应急领导小组向企业应急领导小组和业务条线应急领导小组通告重大IT事件评估结果。
IT损害评估借助的工具包括故障快速定位系统、配置管理系统、专门的分析软件等。
在IT事件发生后,往往存在多层面的软硬件报警。例如,在交换机光端口出现故障后,交换机、服务器和应用软件等都可能产生报警信息。故障快速定位系统作为辅助工具,可帮助技术人员快速定位故障点。快速故障定位是一个很大的课题,请读者查阅相关资料,本书不展开阐述。
在规模较大的数据中心,IT服务、应用系统和IT基础设施等生产要素之间存在大量的逻辑访问关系或物理关联关系。在IT事件发生后,仅仅依靠人工方式在短时间内评估IT服务影响不是一件容易的事情。配置管理系统或专门的分析软件能够基于IT服务、应用系统和IT基础设施等生产要素之间的依赖关系快速评估IT事件造成的IT服务影响。关于配置管理系统,请读者查阅公开资料,本书不再赘述。
2.业务运营影响评估
业务运营影响评估的作用是帮助业务条线应急领导小组确定需要介入业务运营中断恢复行动的业务部门、确定需要启动的业务恢复预案。
业务运营影响评估的内容如表3-5所示。
表3-5 业务运营中断事件业务运营影响评估表

1)业务运营影响评估的角色职责包括以下几点。
(1)每个业务部门值班经理负责组织协调所辖业务流程的业务运营影响评估工作,负责汇总业务运营影响评估结果并上报业务条线应急领导小组。
(2)每个业务流程负责人执行具体的评估过程。
2)业务运营影响评估的步骤包括以下几点。
(1)获取IT条线的IT损害评估结果,确定已经停止运行的IT服务。
(2)根据图3-24所示方法,确定业务运营影响的对象范围。首先,基于“IT服务与业务支撑关系表”,确定已停止运行的IT服务所直接支撑的业务流程和业务运营管理流程。然后,基于“业务流程之间的依赖关系表”,确定存在依赖关系的业务流程。最后,对照一线业务人员汇报的业务运营中断情况,确定在本业务部门中受影响的业务流程。

图3-24 确定业务运营影响对象的方法
①——IT服务与业务支撑关系表 ②——业务流程之间的依赖关系表 ③——业务流程与产品及顾客的映射关系表
(3)评估事件对业务运营的具体影响。
(4)基于“业务流程与产品及顾客的映射关系表”,评估事件对顾客的具体影响。
(5)评估停止运行的IT服务对业务运营管理功能的影响。
(6)确定需要启用的业务恢复预案及启用次序。确定业务恢复预案的启用次序可确保按照正确的顺序恢复各业务流程。例如,银行需要特别考虑日结的恢复顺序。
(7)汇报评估结果。业务部门负责人汇总各业务流程负责人的业务运营影响评估结果,并向业务条线应急领导小组汇报业务运营影响评估结果,业务条线应急领导小组向企业应急领导小组汇报业务运营影响评估结果。
3.重大IT事件企业影响及社会影响评估
重大IT事件企业影响及社会影响评估的目的是为企业应急领导小组决策危机攻关事项提供信息。危机攻关事项包括投资者会议、主要客户沟通、监管层报告、行业协会沟通、内外媒体信息发布、员工安抚等事项。
企业应急领导小组成员负责评估重大IT事件的企业影响和社会影响。一方面因为评估企业影响和社会影响、执行企业危机攻关行动都是企业层面的事情,一方面因为只有企业应急领导小组具备相应的资源和权威。
1)重大IT事件企业影响评估包括以下几点。
(1)评估企业财务影响。企业财务部门基于业务运营影响评估企业收入减少、运营费用增加、资源利用率降低、客户索赔及罚金等,并向企业应急领导小组汇报。
(2)评估企业形象和信誉影响。企业公共关系管理部门或品牌管理部门评估媒体的负面报道、社会谣言、口碑诋毁等对企业形象和信誉的影响,并向企业应急领导小组汇报。
(3)评估企业合规性影响。企业合规部门评估企业因业务运营中断可能遭受的顾客法律诉讼、企业风险管理部门评估可能遭受的监管层处罚,并向企业应急领导小组汇报。
(4)评估企业员工福祉影响。企业HR部门评估员工的薪资、福利、健康、安全等所受到的侵害,并向企业应急领导小组汇报。
(5)评估可能衍生的企业风险,例如,银行挤兑等,由企业风险管理部门负责。
2)重大IT事件社会影响评估包括以下几点。
(1)评估大众利益影响。企业公共关系管理部门负责评估产品或服务问题给普通顾客、大客户、中间商等带来的损失,并向企业应急领导小组汇报。该损失可能会非常巨大,因为顾客无法及时得到产品及服务时可能遭受财产损失、遭遇人身安全威胁、产生极大的情绪等。
(2)评估股东或投资者收益影响。企业投资关系管理部门负责评估投资者或股东因业务运营中断遭受的损失,并向企业应急领导小组汇报。
4.汇总重大IT事件评估结果
企业应急领导小组负责汇总重大IT事件评估结果。
在企业应急领导小组召开的紧急会商会议上,企业应急领导小组听取IT事件评估结果汇报,用于下一步决策IT事件恢复事项。
IT事件评估结果包括以下几点。
(1)IT资源损害与IT服务影响评估结果。
(2)业务运营影响评估结果。
(3)企业影响和社会影响评估结果。
(4)人员伤害评估结果。