BCM小百科目录
- 企业与个人认证对BCM体系建设的重要性
- 10年期间,BCM在哪些方面有了提升
- 全身而退 or 脱胎换骨
- BC已重新定义,DR不曾改变,你的BCM做到位了吗?
- 三位一体在企业BCM建设过程中的新应用场景
- 人工智能,大数据,NLP等在未来如何与BCM相结合
- 数字韧性、云原生对BCM的影响
- 在未来,如何帮助企业在BCM领域获得先机
BC已重新定义,DR不曾改变,你的BCM做到位了吗?
1. 业务连续性管理与灾难恢复
业务连续性管理(BCM)与灾难恢复(DR)是两个密切相关的做法,是指企业为了保持业务持续运行,为防范不可预见的风险所做的准备。
业务连续性管理(BCM)是一个全面的管理过程,预先定义了各种对组织运作能力有干扰的潜在影响,使组织能够容忍部分或全部业务能力的丧失所带来的影响。
BCM是一个建立合适策略和运营框架的面向业务和驱动业务的过程:
1、改善组织对于干扰或中断其供应产品或服务的恢复能力;
2、提供恢复组织以商定的水准供应其关键的产品和服务能力的可靠的方法;
3、提供管理业务中断(事件)并保护组织声誉和品牌的能力证明。
BCM包括了提供和改善的恢复力的整个管理系统的内容。BCM将创建一个或多个业务连续性计划。小型组织可能只有一个覆盖其全部运营的业务连续性计划。大型组织可能有多个业务连续性计划,其中每项都规定了详细的特定业务恢复。BCM在组织中的实施程度将和组织规模和范围相匹配,并可能会受到例如组织预算和成本效益分析这样的影响。
BCM关键要素包括:
1、理解组织运作的全部内容;
2、理解组织必须交付(其目标)的关键产品和服务;
3、理解在交付关键产品和服务的过程中可能遇到的障碍或中断;
4、理解组织如何在中断发生时,继续达成目标;
5、理解在控制和其他缓解策略的实施过程中可能出现的各种结果;
6、理解执行事件处理和应急响应,以及业务恢复程序的标准或触发机制;
7、保证在发生重大中断时,所有成员能够识别其角色与职责;
8、达成业务连续性的实施、部署和演练的共识与承诺;
9、整合业务连续性,使它成为日常工作的组成部分。
灾难恢复(DR)是在发生自然或人为灾害后,重新启用信息系统的数据、硬件及软件设备,恢复正常商业运作的过程。灾难恢复是的业务连续性管理的一部分,其核心是对企业的灾难性风险做出评估、防范,特别是对关键性业务数据、流程予以及时记录、备份和保护。
2. 优化灾难恢复建设的必要性
业务连续性管理更加宽泛,关注企业的战略,以保障业务运营为目标,解决全生命周期的问题,而灾难恢复更加注重具体操作,以系统为目标,着重解决事中的问题,同步处理事后的问题。
业务连续性管理是一个危机应急的框架,涵盖了灾难恢复管理,灾难恢复管理是业务连续性管理的组成部分。
业务连续性计划的制定主要任务包括定义详细的灾难恢复流程,明确所需的环境和资源,以及相应的容灾团队建设。业务连续性计划是一套高级管理和规章流程,使一个组织在突发性事件面前能够迅速作出反应,以确保关键业务功能可以持续,而不造成业务中断或业务流程本质的改变。
常说的容灾系统就属于灾难恢复管理的技术范畴,这是一个完整的业务连续性大框架内的一个极为重要的部分。一般而言,建设灾备系统,需要根据业务的要求和投入规模,确定业务连续性管理的范围和程度,然后,针对IT容灾和恢复提出切实可行的方案。缺少任何一个环节,整个灾备体系的建设都是不完整的。没有IT容灾和恢复的技术实现,整个灾备体系的规划和计划就是无源之水和空中楼阁,根本没有根基。而没有一个完善的业务连续性体系,则使得整个业务的灾难后的连续运行无法有效进行,整个组织无法形成联动机制,做到危机响应和危机应急。
业务连续性计划是基于企业战略的、处理长期的、面向中断后维持业务连续性的规划,核心是业务连续;灾难恢复计划是面向重大的、灾难性的系统故障,在异地恢复业务暂时性正常运转的计划。
当业务连续性管理和灾难恢复结合到一个单一的项目中时,不能孤立地制订业务连续性计划或灾难恢复计划,要求企业管理人员和技术人员密切协作,制定切实可行的业务连续性和灾难恢复的计划和策略,保证业务连续性管理和灾难恢复有效联动。
根据监管要求,每年需对企业的业务连续性管理做持续更新,包括风险分析、业务影响分析、业务连续性管理策略或灾难恢复策略等。其次,随着企业业务需求不断增加,IT系统也需要经常更新升级。
当我们对企业的业务连续性管理进行了更新,例如更新了一个或多个业务系统的RTO、RPO等,如果还沿用之前的灾难恢复策略及灾备建设方案,势必会对业务系统的灾难恢复造成偏差,进而影响到系统的业务连续性,因此需要优化灾备系统的灾难恢复策略及灾难恢复建设方案,从而保证企业整个业务连续性管理的有效性、可用性。
3. 灾难恢复建设内容
参照国家标准和行业监管要求,采用先进的灾难备份服务体系和方法论,制定灾难恢复体系建设的指标需求,提供灾难恢复技术、资源和运行管理经验,建立全面的业务连续性计划,使企业可以发挥自身业务的最大优势,加强其业务系统的安全运行和风险防范能力。内容主要包括:
● 现状分析
对信息系统运行环境现状进行整理、分类和分析,为之后的风险分析、业务影响分析、可恢复性分析及灾难恢复策略的制定提供基础和依据。
● 风险分析
针对生产中心机房基础环境进行分析,识别信息系统的脆弱性及发生突发事件的可能性。评估现有风险管控措施的有效性,并提出适当的风险防范和控制措施建议。
● 业务影响分析
当完成了风险分析之后,进一步通过业务影响分析的手段,对这些存在风险的业务系统功能和流程,及当功能失效时所造成的损失和受到影响的程度进行分析。从而确认关键业务功能与流程,并对业务系统进行关键性等级分类。
● 恢复性分析
在明确灾难恢复策略之前,首先要了解目前系统响应灾难的能力。依据信息系统容灾体系建设的总体目标及相关监管要求为参照,评估目前系统可恢复能力与实际业务需求的系统可恢复能力之间的差距,审核应急响应能力和水平,以及当前具备的恢复能力,明确实际情况与目标之间的差距,为下一步制定灾难恢复策略提供依据。
● 容灾策略制定
根据风险分析和业务影响分析的结果,结合信息系统环境条件的具体情况,在综合评估各种解决方案的投资成本与效益的前提下,完成灾难恢复建设策略规划的编制工作,同时完成各种灾难恢复配套资源和服务的支持与部署规划。
● 灾难备份系统技术方案制定
根据前期制定的灾难恢复策略和信息系统业务持续规划,结合生产系统的现状,对比分析各种可选择的灾备技术方案,为企业量身定制合理完备的,切实可行的,风险成本相宜的灾难备份系统技术方案。
● 应急响应及灾难恢复预案开发
结合各方面的应急管理要求,开发或提升客户的信息系统应急管理流程和应急响应预案。
确定应急响应和灾难恢复的组织架构及岗位职责。制定在特定灾难场景下的业务恢复流程、信息系统故障诊断和处置流程,协助客户及相关厂商编写信息系统灾难恢复手册。
● 组织实施灾备演练
实施必要的桌面演练、模拟演练、实战演练完成对相关IT和业务人员进行意识教育并完成对预案初稿的审核工作。
实施必要的专项演练和验证测试工作以重点检验关键灾备系统的可用性性。
对演练工作进行评估和总结。
未完待续~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。