两地三中心容灾体系下的同步机制及手段 | 运维进阶

陈明福
两地三中心架构下,能够实现自动同步的内容相对局限,大部分需要人工手动同步校验,这时就需要制定严格的同步制度,规范的同步步骤,细致的同步流程,以有效杜绝多个数据中心间参数配置的不一致风险。

本文来自微信公众号“twt企业IT社区”,作者/陈明福,银行技术经理。

●需求分析

在进行两地三中心容灾体系建设过程中,要保障灾难发生后灾备中心的信息系统能够正常运行,业务能够连续运行,一般情况下,需要多个数据中心之间的保持同步的数据主要包括:数据库、中间件、操作系统、应用版本、crontab等其他配置信息等,不仅涉及到使用技术或者工具/软件来实现同步,还需要制定相关的同步规范制度来实现多个数据中心之间数据同步管理。

两地三中心配置同步是一个建设难点,最主要的是灾备端经常处于standby或者停止状态,难以验证当前的配置是否完全一致。

●同步机制及手段

基于存储复制容灾架构可以较好地实现数据库的复制保护,但对于配置及参数文件等不存放在存储设备中的配置层文件,存储复制技术就显得无能为力,只能增加其他辅助工具手段进行同步,可依据灾备管理系统、应用、数据库、中间件、OS的配置和CMDB,尝试建设了一个两地三中心一致性比对工具,确定关键配置,逐个建立检查和比对机制,逐步完善比对项,随时进行比对并生成报表,尤其是生产环境变更之后和灾备演练前,及时进行检查。另外,应用发布和基础软硬件变更工单中依据CMDB自动关联灾备环境,确保灾备端完成变更,不至于遗漏。具体可采用如下方法:

●操作系统、数据库和中间件参数配置

操作系统、数据库和中间件参数一般在系统集成部署后很少会发生变更,变更频率较低,且该类型配置文件具备很多个性化参数,故该类型参数配置建议采用“手工更新”的方式实现同步,即:通过变更流程制度来严格控制该类型参数的手工更新同步,当生产中心发生参数变更时,手工对灾备中心参数进行同步变更。

如若操作系统、数据库和中间件参数发生变更的频率较高,可考虑采用“自动化同步工具”保持灾备中心应用版本及参数与生产中心的一致性,如若具备条件,可考虑采购商业版同步工具,否则可采用Rsync等开源同步工具实现应用版本及参数同步。

●应用版本及参数配置

为适应业务的快速发展,应用版本及参数发生变更的频率较高,几乎每周都会发生变更,故针对该类型的可考虑采用“自动化同步工具”保持灾备中心应用版本及参数与生产中心的一致性,如若具备条件,可考虑采购商业版同步工具,否则可采用Rsync等开源同步工具实现应用版本及参数同步;另外,当前一些应用系统已经实现了较为完善的分布式架构及多数据中心下分布式应用版本快速部署工具,针对该类型的应用程序,建议使用厂商自带版本发布工具进行灾备中心应用版本及参数同步。应用的共享数据文件,可以采用随存储复制技术保持同步。

其次,灾备中心的应用版本及参数需要定期进行测试验证,以确保同步后的版本及参数是可用状态,当出现灾难后,灾备中心可立刻启动应用接管业务。

●定时任务配置

定时任务一般在系统集成部署后很少会发生变更,变更频率较低,故该类型参数配置建议采用“手工更新”的方式实现同步,即:通过变更流程制度来严格控制该类型参数的手工更新同步,当生产中心发生参数变更时,手工对灾备中心参数进行同步变更。

如若发生变更的频率较高,可考虑采用“自动化同步工具”保持灾备中心应用版本及参数与生产中心的一致性,如若具备条件,可考虑采购商业版同步工具,否则可采用Rsync等开源同步工具实现应用版本及参数同步。

●网络策略权限配置

网络策略权限涉及信息安全防护且影响面较广,建议采用“手工更新”的方式实现配置同步,即:通过变更流程制度来严格控制网络策略的手工更新同步,当生产中心发生网络策略权限变更时,评估后手工对灾备中心网络策略权限进行同步变更。

总结

结合最佳实践,两地三中心架构下,能够实现自动同步的内容相对局限,大部分需要人工手动同步校验,这时就需要制定严格的同步制度,规范的同步步骤,细致的同步流程,以有效杜绝多个数据中心间参数配置的不一致风险。必要时,需要梳理所有需同步的配置项,通过统一的同步软件或者工具,来实现自动化比对和变更投产,比如自动化投产工具,在流程审批过后,自动化投产工具,将按照自定义的脚本,自动在所有节点运行相同的命令,保持所有配置项的一致性。最重要的是多开展灾备中心业务接管切换演练,把演练过程中碰到的问题积累起来,经过解决之后再进行推广,经过多轮切换演练后,数据中心间配置一致性的问题基本上能解决。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论