2024年,我们为行业客户提供灾备切换演练支持服务超200次,成功率均为100%。此外,每年客户自行使用同创灾备管理平台进行灾备切换演练数百次,受到业界广泛认可与信赖。
2024年11月17日,同天支持了6家大型金融客户的真实切换演练工作,并取得圆满成功,这是同创灾备演练单日支持规模的历史新高,凸显了交付团队在面对复杂金融场景时的高效协同与卓越执行力!
截至2024年,同创永益累计服务客户已超过400家,包括:中国建设银行股份有限公司、交通银行股份有限公司、中国国际金融股份有限公司、中信证券股份有限公司、招商证券股份有限公司、东风汽车集团股份有限公司、万华化学集团股份有限公司等。
面对切换业务困难 存在的问题及解决方案
XX客户2020年开始灾备切换管理平台建设,涉及切换系统覆盖度广(生产70余套,灾备40余套)且未做过真实切换,切换手册经十数轮评审与测试,从切换时间4h+逐步优化至20分钟以内,大幅满足监管与年度演练要求。
涉及的其他难点:
问题:测试环境不全,与生产差异性较大
解决:生产上线前做好大量的生产与测试的差异化比对工作,如:ip、配置文件、脚本路径、环境变量等,并准备批量的预检与复核流程,人工+自动化结合,大幅提高生产切换的准确率;
问题:受控设备种类繁多,无统一调度渠道,已有调度渠道需尽量延用
解决:梳理分析所有受控设备,通过详细分类与方案验证,为不同类型设备选择符合行内安全要求的纳管方式。如:F5采用API;应用引用行内salt;数据库则通过堡垒机使用标准脚本进行切换等;
问题:演练涉及多中心技术人员与业务人员参与,分工与指挥难度大
解决:根据不同中心的的不同角色,分角色筹备与组织3个批次的预演培训即相关指导手册:包含指挥人员;参演技术团队;参演业务团队。大幅提升演练当天的效率与秩序。
总结
同创永益灾备切换系统是稳敏双态下专业的一体化灾备管理解决方案。满足容灾演练过程流程化管理,实现切换过程自动化,结合全局视角的可视化指挥视图,形成统一的灾备管理工作支撑平台,协助客户不断增强数字韧性能力;交付团队经验丰富,在灾备切换演练支持中,他们通过高效协同、卓越执行力、定制化解决方案、技术支持与保障以及风险管理与控制等方面的努力,确保项目能够顺利交付并满足客户的实际需求。
经典的灾备切换支持案例经验分享
今年规模最大的一次年度演练,由某行长亲临现场指挥,科技部及业务部门约1400人参与,共涉及24套系统的切换演练,全部操作都在同创永益灾备切换平台中进行,创造了该行演练规模历史。面对如此大规模切换演练,同创永益依旧能保证成功率100%,是依靠:
1、客户支持度高,本次演练所涉及到的20多套系统,均在演练前在生产环境的停机窗口中经过测试验证。
2、平台功能强,使用平台的一致性比对功能,详细的进行了20多套生产环境、灾备环境的比对工作,避免了主中心和灾备中心因为环境版本不一致带来的演练失败风险。
3、平台能力强,生产中和灾备中心部署的灾备切换平台高可用架构,也保证了平台在演练过程中的稳定性和安全性;演练前期,在测试环境及准生产环境进行了详细演练测试验证、压力测试验证、多用户多线程多并发的操作验证,平台均能承受测试演练。
4、人员能力强,资深的系统工程师在现场进行平台、切换流程、切换脚本的检查和复核工作,确保平台切换带来的风险。
5、标准版实施,严格按照公司内部的灾备切换演练流程指引,进行本次的灾备切换演练工作。
此次灾备切换演练的创新点:
1、全流程自动化切换:整个切换流程采用灾备切换工具,自动触发灾备切换流程,大大缩短了切换时间,提高了切换的准确性和可靠性。
2、结合BCP的全流程演练:将灾备切换演练与业务连续性计划紧密结合,不仅关注 IT 系统的恢复,还包括业务流程的恢复和人员的应急响应措施,模拟从灾难发生到业务完全恢复正常运营的全过程,涉及业务部门、技术团队、管理层以及外部合作伙伴之间的协同配合。
3、跨部门协作平台:依托于灾备切换平台的应急组织架构模块,建立专门的跨部门协作机制,打破部门之间的信息壁垒,提高协同效率。
其中,在支持某股份制银行切换演练,耗时最快的单系统切换时间仅花费1分31秒,这一速度不仅刷新了行业记录,更充分展示了同创永益在提升灾备响应效率与恢复速度方面的卓越能力。如此迅速的切换,意味着在真实灾难发生时,客户的业务能够在最短时间内恢复正常运行,最大限度减少损失,保障业务的连续性与稳定性。
该行的A类系统的关基切换是一项复杂而关键的任务。采用传统的灾备切换手段,灾难时无法保证RPO=0、切换时间可能无法满足客户需求。因此我们基于XX系统单元化的系统架构加上分布式数据库,以及网络端极速的流量调配,再科学的优化切换流程,最终实现了快速切换。从 2:30 的正切到 4:00 的回切,单系统最快切换时间达到惊人的 1 分 31 秒,这背后是先进的技术架构和高效的切换流程在发挥作用,同时保证了RPO=0。而最慢的切换在5分多钟完成,这切换时间也处于业界前茅,整体切换工作的成功,为我们提供了宝贵的经验教训,促使我们不断优化系统,提高切换速度和稳定性,以应对未来更加复杂的挑战。
此次灾备切换演练的创新点:
1、一键式灾难恢复:在收到切换决策进行灾难恢复。通过灾难恢复功能快速创建对应的灾难切换场景实例启动切换,并对切换进行一系列控制操作,包括灾难切换和切换报告功能。
2、全方位演练管理:灾备平台提供了演练过程的全方位管理,包括:制定演练计划、编制演练方案、审核演练方案、执行演练活动、总结演练活动、评估演练活动和实施演练整改等过程。
同创永益简介
北京同创永益科技发展有限公司成立于2009年,是国家高新技术企业、工信部专精特新“小巨人”企业、信创工委会技术活动单位、中国信通院混沌工程实验室副理事长单位。公司深耕企业用户数字韧性服务,业务覆盖灾难恢复、业务连续性、IT应急管理、容量管理、混沌工程等产品和解决方案,拥有自主知识产权和全栈服务能力,致力于帮助客户建设数字化系统的全领域韧性体系。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。