“+智能”,让灾备“可见”

任何人都不希望看到灾难或故障发生,更不想因为处置不及时或不妥当,而造成经济、企业声誉等方面的损失。但是现实中,来自自然界的灾难,以及企业内外部遭受的攻击,真可谓无处不在,无孔不入。因此,对于那些看重数据安全、业务连续性的企业来说,灾备系统建设不可或缺,有备才能无患。

本文来自微信公众号“云数智观察”,作者/涛哥。

几年前,笔者有幸亲身参与了某商业银行的远程灾备切换现场演练。记得那是一个下午,参与演练的几十人集中在一个偌大的礼堂,按照业务流程分成若干个小组就座,银行的领导、灾备方案提供商的技术专家都参与其中。两点整,演练正式开始,从发现故障发出告警,到各个业务部门如何响应、流转,再到系统切换命令的下达、执行,直至最后灾备系统的启动、业务恢复正常,一套完整的流程得到了全面演练。现场氛围十分严肃、紧张,作为旁观者的笔者本人甚至连大气也不敢喘。

任何人都不希望看到灾难或故障发生,更不想因为处置不及时或不妥当,而造成经济、企业声誉等方面的损失。但是现实中,来自自然界的灾难,以及企业内外部遭受的攻击,真可谓无处不在,无孔不入。因此,对于那些看重数据安全、业务连续性的企业来说,灾备系统建设不可或缺,有备才能无患。

虽然大家都知道灾备的重要性,但是真的遇到自己上灾备系统,很多企业还是会犹豫甚至会打退堂鼓。为什么?因为灾备不仅仅是“钱堆出来的”,也不仅仅是一项有难度的技术活儿,更因为它与业务流程相关、与人相关,牵一发而动全局,一旦出现失误,很可能造成不可逆的损失。所以,建设了灾备系统却形同虚设,当灾难或故障发生时,不敢切换、不能切换或不会切换的情况并不鲜见。

1.png

究其原因,灾备系统的建设、管理与切换,不可见、不可控、不智能、不自动化,在很大程度上需要仰仗人力,这就增加了不确定性和人为失误的几率。过去,很多企业可能重在灾备系统的投资建设,认为只要有了灾备系统就能在需要时派上用场。但实际上,有了灾备系统和在关键时刻能够发挥应有的作用,这中间还是有Gap的。

怎么办?必须在灾备管理上下功夫!随着技术的进步、客户需求的变化,灾备也要与时俱进,由以前的重建设到现在的重管理,由人力监控管理到实现自动化、智能化和可视化。

别让灾备沦为摆设

工信部发布的《“十四五”软件和信息技术服务业发展规划》中就提出,丰富数据备份、灾难恢复等安全软件产品和服务。随着国家、行业和企业对数据安全与业务连续的重视程度不断提升,灾备行业也实现了高速发展。Gartner预测,2023年,全球灾备市场支出将达到330亿美元,其中云灾备即服务(DRaaS)市场将呈现快速增长态势,在中国市场上趋势亦是如此。

从大的背景来看,由于数字化转型的驱动,灾备作为一项保障业务连续性的关键措施,将为企业的数字化转型守护好安全底线;从技术和应用的发展来看,混合多云环境下,在不同的云上部署应用和数据,并保证其安全可用,就需要很好地解决多云环境下数据的备份和恢复问题,而大数据与AI的引入,也为灾备的发展和应用开辟了新路,灾备智能化成了大势所趋;从企业的实践来看,为了保证业务7×24小时连续运行,高可用性、实时性等成了基本要求,这就要求灾备不断提升技术能力,为用户提供更快捷、更可靠的灾备服务。

在数字化、多云、大数据、AI等综合因素的共同影响和作用下,灾备正朝着自动化、智能化、可视化、高可用、全面保护的方向发展。自动化的灾备流程、智能化的监控与管理,将进一步提高灾备的效率与可靠性,有效消除用户在数据和业务安全方面的后顾之忧。

“+智能”灾备更可控

地震、洪水等自然灾害是最常见的可能引发业务中断事故的原因。还记得今年夏天的那场台风“杜苏芮”吗,受它影响,我国北方多地持续暴雨,北京西部地区就遭受了严重的洪水灾害,不仅出现了断水断电断网的情况,而且一些数据中心也遭遇到不同程度的损毁。

如果因为地震、洪水等自然灾害,致使电视台的节目播出中断,有可能给媒体传播平台的传播力、引导力、影响力、公信力造成负面影响。《广播电视安全播出管理规定》中有这样的明确要求:省级以上广播电台、电视台、卫星地球站应当配置完整、有效的容灾系统,保证特殊情况下主要节目安全播出。

广西广电新媒体的核心系统众多,每天都产生海量的数据,由于媒体行业的特殊性,这些系统和数据对性能和安全性的要求都非常高。一旦发生自然灾害或者逻辑错误、硬件故障、勒索病毒攻击等,导致播出事故,将给其公众形象造成不可挽回的损失。广西虽然没有处于大地震带上,但距云南大地震带较近,如果云南发生大地震,有可能引发南宁附近的余震,这些都是必须考虑的“意外”因素。

作为省级电视台,广西广电新媒体按照《广播电视安全播出管理规定》,应达到一级保障要求。因此,广西广电新媒体亟需一套适用于其新一代系统架构的灾备解决方案。

1.png

在英方的助力下,广西广电新媒体在灾备建设上实现了“三步走”:第一,针对媒体中心每日产生的数据,采用i2COOPY数据实时复制软件,将数据实时迁移至广西广电云,确保生产端和灾备端的数据一致性;第二,通过英方i2Active+i2Availability+i2CDP的“组合拳”,对广西广电新媒体的关键业务进行容灾接管和实时备份,达到了秒级的RPO与分钟级的RTO指标要求;第三,采用英方i2DRM容灾管理平台进行容灾的统一管理,建立完善的业务连续性管理系统,并通过完善的资源管理,结合可视化的流程编排,实现不同场景下的容灾预案的电子化管理。

众所周知,电视台的系统庞杂,包括广播电视节目制作、播出、媒体运营、广告投放等。复杂的业务系统涉及众多资源,如各种应用软件、数据库,以及网络资源、存储资源、切换脚本资源等。在建设灾备系统时,对这些纷繁复杂的资源进行统一、有效的管理是一个棘手的问题。但是对于i2DRM来说则是“小菜一碟”。在实践中,i2DRM可以轻松地将业务系统涉及的各种资源纳入通过一管理,在容灾演练和切换时,对所有资源进行统一调度,确保了容灾演练和切换的顺利进行。

对于媒体来说,其关注点还是在于保证节目和内容的正常、安全播出。而传统的灾备系统在运维和管理上不透明,对于电视台的运维人员来说是一项极大的负担。广西广电新媒体之所以青睐i2DRM,很重要的一个原因是,平台提供了指挥界面、大屏显示等可视化的方式,而大屏展示正是容灾管理平台的核心功能之一。在灾备演练切换执行的全过程中,管理和运维人员可以通过大屏显示信息,实时掌握执行进度和所有相关资源的状态信息,并能在任意时刻通过大屏快速进行决策。不仅如此,在每次的演练执行完成后,容灾管理平台还能自动生成执行报告,使得管理者可以根据报告对此前的预案进行持续化的改进,从而大幅提升容灾管理的智能化水平。

灾备智能化是云和大数据环境下灾备的新发展需求。灾备的智能化是在传统存储灾备、定时备份的基础上,通过一系列技术创新,实现灾备的自动化接管和演练。作为国内灾备行业的领军企业,英方正是将智能化作为灾备演进的新突破口,通过全流程化的指挥管理、资源管理、预案管理及平台管理,并结合平台可视化的容灾流程编排和灾难恢复国家标准,对整个应急切换、容灾演练进行全程实时监控,利用决策级的大屏界面展示容灾的关联资源,科学把握和推进容灾切换进度,让管理员可以准确、快速地指挥决策。

总结来说,i2DRM容灾管理平台通过决策级的大屏指挥视图功能,可以从容应对容灾切换或演练的突发状况,整体过程相比传统容灾流程更加透明可控,因此特别适合那些对业务连续性有较高要求的客户,特别是在大型灾备系统的演练及灾备切换中表现尤为突出。

全流程的可视化、智能化

2021年11月23日上午,东南亚地区最大的银行新加坡星展银行的网上银行服务出现大规模中断,遭数千名客户投诉后,11月24日在恢复服务几小时后再次中断。2023年5月,尼日利亚市值最大的银行Zenith Bank主数据中心的一套备用电源系统起火,导致数据中心基础设施全面宕机。2023年6月,加拿大皇家银行(RBC)的在线和移动系统遇到问题,致使大量客户不能转账。

为了保证业务的连续性,更好地支撑业务创新,金融行业亟待提升数据中心的容灾能力,尤其是要将灾备切换演练落到实处。目前,国内很多商业银行正在积极推进“三大银行”(责任银行、合规银行、智慧银行)的建设,加速数字化转型,致力于打造智慧银行。业务的智慧化,当然需要智慧化的灾备作为支撑。

面对行业的强监管要求和不断增长的数据,银行亟需建立高效、合规、智能的灾备方案,以确保数据零丢失和业务连续性。在实践中,由于银行的系统架构十分复杂,而灾备设备和资源又比较分散,因此对所有资源进行统一管理,以确保恢复的可行性就显得十分重要。随着新一代信息技术的持续更迭,特别是大数据、人工智能等技术的快速发展,银行也开始努力寻求智能化的灾备管理,利用云计算、大数据、人工智能等技术手段,实现更快、更智能的响应。正是在这一背景下,i2DRM容灾管理平台越来越快地走进了银行。

一个完整的灾备流程通常包括容灾准备、预案和流程管理、演练/切换执行、评估报告等环节,如果仅仅依靠人力进行监控与管理,显然很难做到面面俱到。i2DRM正是一个覆盖容灾全流程的智能化管理体系,旨在让容灾建设、运维管理和切换/演练变得更加轻松。

i2DRM能够实现全流程自动化,主要因为其预案的电子化与流程化能力。具体来看,通过预案管理功能,它能够实现流程化、可视化的任务编排,将预案进行统一电子化管理,并以任务为单元,进行串行或并行编排,根据不同场景组成预案,最终可对预案发起应急切换或演练。强大的执行管理能力也是i2DRM能够实现灾备管理智能化的一个重要原因。通过资源锁定、人员签到、执行任务、执行完成/资源释放等一系列步骤,i2DRM能够对已完成编排设计的预案发起切换或演练,在执行任务的过程中还可通过流程化的调度引擎,实现整个切换过程的自动执行。

贵阳银行就是通过i2DRM完成了核心业务系统的容灾业务流程指引工作,当前置应用系统、核心应用系统、数据库应用系统、数仓转换系统发生异常时,能够助力客户根据对应的容灾业务流程指引完成相关容灾切换工作并形成容灾报告,从而降低风险发生的概率以及灾难可能造成的损失。

i2DRM在容灾管理上的诸多创新,进一步提升了行业客户应对各类风险的能力,改善了容灾备份的管理和使用体验,让容灾更加智能,在确保安全的同时,实现了业务价值的最大化。这正是英方打造新一代容灾管理平台的初衷。

从灾备走向数据管理

由于在灾备体系统一管理、常态化演练、自动应急切换、灾难切换大屏指挥等场景中游刃有余,i2DRM已经在金融、企业中有了很多成功的落地应用,而政务、公检法和交通等行业的客户同样对于灾备的可视化和智能化管理有着迫切的需求。

灾备智能化是一个不断演进、完善的过程。i2DRM在实现传统灾备的产品界面展示向集中式、智能化的大屏展示过渡方面实现了重要突破,让灾备可见、智能接管,并且实现了灾备管理预编排和智能管理,引领了灾备未来的发展趋势。

据了解,当前i2DRM还是主要支持英方自己的软件产品,不过其资源中心近期也新增了Oracle ADG集成功能,可自动获取ADG规则,并对ADG进行纳管和状态监控,支持单独对ADG或切换流程中对ADG进行切换操作,同时内置ADG启动、停止、切换操作,无需编写脚本。未来,随着研发的持续投入,i2DRM将更加开放,支持更多的产品接入。

有业内专家指出,灾备未来将向数据管理进一步延伸。数据是企业的重要资产,在不影响数据安全性的前提下,将数据用于开发测试、容灾演练、数据分析甚至进行更深入的价值挖掘,这些都是灾备系统需要去持续探索的。英方也在突破灾备的“舒适圈”,在更广阔的数据复制行业开拓创新。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论