阿里云刘伟光:核心系统转型之路

刘伟光
随着银行以消费互联网、产业互联网、开放银行生态为核心的数字化业务快速增长,银行核心对敏捷交付、高并发、弹性伸缩等不确定性问题的应对,成为新一代银行核心建设必须面对的“底线要求”。

“既然未来已来,不如直接进入那个未来!”

核心系统转型,相当于给正在跳动的心脏,做一场不停摆的换心手术。

不少核心系统采用的传统集中式架构,已经不止是一种技术架构模式,而是成为了一种根深蒂固的思维习惯和设计理念。当它成为潜规则而影响了创新时,我们往往因身在此山中而难以察觉。

2345截图20211028093243.png

阿里巴巴集团副总裁

阿里云新金融&互联网事业部总经理刘伟光

在阿里巴巴集团副总裁、阿里云新金融&互联网事业部总经理刘伟光看来,不少机构在做核心系统转型时,极易陷入窘境:

选择应用平迁、不做架构大变化,最简单和快捷。有的银行正因如此,开发力量80%以上的时间是在做代码的性能优化,难以承接新功能、新业务的开发。

先从简单系统着手进行架构转型,再推导到核心转型。结果非核心领域的转型实践对于核心领域的参考借鉴意义有限。

核心系统按照功能模块切分,再众包给不同的开发商来完成,避免被一家绑定。

选择各个领域的最佳“供应商”,完成各自擅长的工作任务(咨询建模、架构、设计、应用、基础软硬件),大家只熟悉自己这部分的“最佳实践”。

追求技术架构完成解耦,碎片化供应商。实际上项目实施过程中IaaS/PaaS层适配虽然功能大体能够适配,但在非功能性领域的磨合总出现莫名其妙的问题,产生大量沟通与适配成本。

业务应用是业务应用开发商的事情,技术平台是技术平台供应商的事情,两者没有关系。

……

针对现状看到的问题,刘伟光希望能全面分享阿里云对核心系统转型的实践与思考。从酝酿到成文历经四年,期间他与团队拜访过近千家金融机构,沉淀出3.5万字长文(本推文仅为核心摘要),全面探讨金融行业,尤其是银行业,在进行核心系统转型、升级过程中遇到的方方面面的问题与挑战。

序言

创作这篇文章的想法已经酝酿了四年多时间,时光如白驹过隙,我们仍初心不改。在这期间,我和我的团队跨越大江南北,拜访了近千家金融机构,见证了数字金融这几年在中国的高速跃迁,在拥抱移动互联网和金融科技新技术的大潮中,中国金融的服务能力有了大幅度提升,开启了技术驱动数字金融的新时代。

2345截图20211028093243.png

回顾技术在金融行业的发展,金融科技的变革与时代共舞,国外的基础技术平台和最佳实践支撑了过去几十年金融行业的发展,直到今天我们也必须承认,这些国外的基础技术平台在很多单项技术能力方面仍然具备非常强的竞争力。

但是今天我们面临的时代,是一个高速发展,具备一定的业务发展不确定性和互联网特征,并且需要与移动互联网和音视频能力高度结合,同时让数据变成资产且无处不在的数智时代。

不是过去的技术不先进,而是它们限制了我们对未来全面数字化金融的想象力,我们需要的是一套新的技术体系以实现金融机构真正的业务和技术转型。

以银行为例,核心系统就是IT建设中皇冠上的明珠,是一家银行的心脏,在我们与诸多银行沟通交流的过程中,从那些无数次碰撞的火花中,脑海中关于未来核心系统建设的影子已经从一个模糊的亮光逐渐变得清晰。

它不再是银行科技部门按部就班按照周期建设的系统,它不再是一个固化的标准存贷汇功能堆积的能力集合,它不应该是不断修修补补加外挂的平台,它不再是和数据平台和数据服务能力割裂的系统,它不再是一个牵一发动全身的架构体系。

首先它必须是银行数字化转型中最重要的一把手工程,是一个能够让内部员工和外部客户都能感受到数字化能力无处不在的平台;

它是一个能够快速生成新流程,快速创建和发布新业务新产品,能力单元高度复用的平台;

它是一个能够具备移动化数据化智能化特征的平台;

它是一个分布式基础架构技术支撑的平台,能够以弹性能力应对互联网类业务的峰值;

它是一个融合云计算中的先进技术能力去应对开放银行和生态银行时代所有业务的一栈式平台;

这就是我们脑海中那个未来的样子。

今天我们看到有些银行已经在这个路上去积极的探索,这些探索的背后我相信就是未来引领行业的、全新的最佳实践。

我们在内部和外部不断的探索与实践中,逐渐提炼和总结了一些系统性的思考,也就是如何构造具备核心竞争力的核心系统,打造真正“硬核的内核”,逐渐优化和改变目前建设的工程化体系,同时在基础技术平台和应用系统的耦合度上深入地进行研究探索,对于系统物理和逻辑部署形态上做了创新的实践,同时融合了云计算体系当中最先进的云原生技术理念。

希望此文能够给从业者带来一些新的思考,从更大的视角去构建智能化内核能力无处不在的新平台,重塑数字金融时代的商业价值。

此刻我和团队就在某银行数据中心现场参与主机应用迁移到分布式云原生架构平台的过程,能亲身见证这些推动金融行业发展变革的历程,是我们这一代从业者的荣耀,也是我们的责任!

引言

本书分为五个章节,比较完整涵盖了金融行业,尤其是银行行业的核心领域在进行转型、升级过程中遇到的问题与挑战。可以说,在数字化成为现代企业转型发展的标配下,金融行业、尤其是银行行业,其问题、思考与实践具有相当的代表意义。作为这个过程的亲身观察者,参与者,直到推动者的过程当中,我们如实记录下了从业者的艰难实践,结合我们内部和外部的实践总结,希望能够为这一伟大历程做出自己的一些贡献,为从业者提供一些中肯的建议,少走一些弯路,多一些从容与信心。

第一章综合介绍了目前核心领域分布式架构转型,云原生分布式转型的21个问题与困惑,这是历经两年多的实地走访与调研收集的100%真实的问题。同时不光有问题,也有我们总结归纳并交叉验证过的核心转型成功的三大标志,这是本文一切努力服务的三大目标。同时根据一些有代表性的实践,我们列举了核心从业者的实际窘境,综合这些问题,总结归纳出六个新的思路方向来解决这个世纪的难题。

第二章从不确定性时代的金融业务挑战出发,主要从业务方向分析了当下相对较新的金融业务形态对于传统金融核心的挑战与要求,比如开放金融体系对于标准构件的要求,普惠金融体系对于灵活组装核心的需求,绿色金融体系对于核心可泛化性的要求。

第三章从银行核心系统的转型能力需求的方面,主要从技术方向分析了转型的能力要求,回答了不少第一章行业和核心从业者的困惑。提炼了五层十二大能力体系,这些是新一代云原生分布式核心建设的最佳参考模型。涵盖业务建模领域,应用架构集成领域,应用系统开发建设领域,基础软件设施领域,以及基础资源设施领域。

第四章在第二章业务角度和第三章技术角度的基础之上,分析了不同细分银行行业的大致模式,经过提炼总结成为实施与建设的四阶段五层的实施路径。同时介绍了三种不同的建设模式,重构模式,平行迁移模式以及SaaS化批量模式。供不同规模的银行机构参考。并且按照相关的国家指引,给银行提供了双核心并行与在线迁移的大致方案。

第五章进行了全篇的总结,从实际的数据出发,给出了核心云原生分布式转型的价值,给出了第三代核心也就是云原生分布式核心的一些建议标准与定义,同时总结了一些建设过程中的经验教训,帮助金融企业,银行机构早日实现核心转型的重要价值。

金融核心分布式转型的行业变革

曾几何时,银行业务系统、特别是银行核心系统都与“云技术”没有任何联系,云原生的种种技术和架构优势(微服务解耦、敏捷开发、自动化测试与发布、不可变基础设施、去中心化的服务治理、声明式API、Serverless无服务器化等)对银行核心而言都是“别人家的孩子”。

但随着银行以消费互联网、产业互联网、开放银行生态为核心的数字化业务快速增长,银行核心对敏捷交付、高并发、弹性伸缩等不确定性问题的应对,成为新一代银行核心建设必须面对的“底线要求”。从云计算技术发展中铸就的云原生和分布式技术在这样的“时代要求”下必然成为银行的主流技术,银行核心也成为“云原生分布式架构”攻克的“最后的堡垒”。

在银行信息系统中,核心系统承载了银行存款、贷款、银行卡、清算核算等核心业务,被称为“银行业跳动的心脏”、“银行IT皇冠上的明珠”,其重要性不言而喻。回顾银行信息化30多年历程,核心系统经历了从“胖核心”到“瘦核心”的演变过程。“胖核心”以IBM大型机为代表,而“瘦核心”则以典型的IOE技术架构为代表。然而,全方位数字化金融时代的到来使得集中式架构的问题日益凸显,比如:系统部署无法及时响应业务需求;系统弹性能力差,导致资源过度规划和冗余浪费;使用成本高等。虽然集中式架构仍然具备很强的竞争力和高度的稳定性,但是在拥抱中国数字金融高速迭代的浪潮中,业务驱动架构变革已成为今天的主题。

随着集中式架构的六边形能力(高并发、线性扩展、敏捷开发、按需弹性、精细化治理、多活可靠)已经达到极限,我们认为银行核心系统的云原生重塑也来到了“时代拐点”。

金融业务新方向呼唤技术的“供给侧改革”

迪士尼有一句话反复被提及:“艺术挑战技术,技术启发艺术”。

新时代是一个数字时代,数字时代的金融是以数据为关键生产要素、以场景和用户价值为中心的服务模式,主要服务手段依靠对各类数字化技术的综合运用,其重要载体便是通过网络送达的软件服务,是以线上便捷服务为主、线下人工服务为辅,融合数据智能和人类温情,注重用户体验和风控原则的服务模式。金融服务将是开放、普惠、绿色的,嵌入式且灵活多变。而这样的“泛在化”金融服务必然对账户、交易、结算等核心能力提出了“泛在化”、“全时在线”的要求。

2345截图20211028093243.png

金融核心转型的能力要求与建设体系

“重大问题的解决方案,永远不可能在产生这个问题的维度上出现。”

——爱因斯坦

数字韧性被越来越多的金融机构所提及,什么是数字化韧性?当应对外界环境变化,或者客户需求变更时,软件产品需要有弹性和韧性,要有反应足够快的数字化体系。当集中式架构在面临“数字韧性”而“力不从心”的时候,我们认为很难用“旧时代的方法”去解决新时代的问题。云原生似乎成为一个数字化企业的“标准答案”了。

实施路径与建设模式

经过对国内一些金融机构的核心下移与改造的实施路径和建设模式分析,可以基本上分为两种建设模式:

1.核心自主重构模式

路线特点:

自主研发新核心系统,非采购ISV(独立软件开发供应商)核心系统产品,强调自研可控

大多数原有核心采用AS400或大机的银行希望采用重构的方式完成核心下移

建设目标包括业务建模、领域架构重构

绝大多数银行构建了全新的核心应用技术平台

部分银行选择基于云平台进行核心系统重构

部分银行在核心重构过程中包含自研可控规划

核心开发实施过程会采购ISV(独立软件开发供应商)的人力资源

采用该路线的银行范围:国有大行、股份制、大农信、部分中大城商/农商

2.采购核心产品套件模式

路线特点:

采购ISV的核心系统产品,并主要基于ISV的人力资源完成核心实施交付

主要诉求为替代原有第一代的老旧核心

基于ISV核心产品的业务模型和架构建设

基于ISV核心产品自带的应用技术平台

部分银行要求ISV产品简单部署在云平台上

自研可控方面,部分银行仅能够要求ISV产品集成国产数据库

采用该路线的银行范围:部分中小城商/农商、民营银行、外资银行

核心云原生分布式转型的价值与经验

经过上述的探讨,我们归结出来核心转型的一些价值,一些共识和通用的标准,结论如下,可以作为行业机构设计和实施的参考。

1.第三代云原生分布式核心的价值体现

2345截图20211028093243.png

核心的云原生分布式转型,成为第三代云原生分布式核心,有如下的一些价值方向:

自研可控,100%满足相关的国家要求

运维成本降低400%

云原生架构基于相对廉价的PC服务器构建,在同等处理能力下,分布式架构的单位运行成本大幅度降低,分布式架构的年均运行维护成本是大型机的17%

业务敏捷,缩短40%以上的落地时间

云原生,中台化的模式降低业务模块间的强耦合性,业务交付更加敏捷,平均需求交付周期可以缩短40%左右,在进一步提升效率之后,可以达到数量级的效率提升

弹性扩展,完全线性

云原生架构具备良好的横向弹性扩展能力,较好的满足中国特有的“春节高峰”时段的特殊要求以及每年超过20%以上的业务增长量的需求,同时在底层资源充足的情况下,能够做到即时的线性扩容。

下一代的异地多活架构,RPO=0,RTO<1分钟

基于云原生的单元化异地多活架构,以及分布式中间件,分布式数据库,云原生分布式框架,可以构建超过三地五中心全活多活架构,具备城市级别灾备能力,城市级别RPO=0,RTO分钟级别RTO<1分钟。

2.第三代云原生分布式核心的关键标准

通过全篇的介绍,我们最后尝试提出云原生第三代核心的一些关键标准,这也是行业从业者的一些共识。而为了达成这些标准,我们必须转换思路,打造能实现这些标准的自动化流水线工厂。

2345截图20211028093243.png

云原生

云原生是应用架构演进,整体降本增效的必然趋势和要求

异地多活单元化

单元化是架构灰度,进行架构在线升级的关键企业级架构设计

中台化

中台化是实现业务敏捷,业务弹性,应对未知挑战的关键要素

数字化

数字化是实现面向未来金融基础设施的关键设计

自研可控

自研可控是实现金融安全的必要保障

而云原生工场模式,是将这些标准与规范融入至整个的标准化制造与加工流水线以及实施工艺的端到端体系化模式,助力金融机构的核心云原生分布式转型。

3.核心相关系统建设的经验教训总结

分离采购与建设模式的折扣

核心的下移不简单是从主机等集中式环境换一个云原生和分布式的平台,传统的应用是应用开发商去建设,技术平台是技术平台供应商去建设的分离模式从最终预期要达到的效果和价值来说,并不会很好。因为应用开发商对于云原生底层技术平台并没有很深的了解,很多特性和优势用不上,只能当虚拟机或者普通的数据库来使用,基本上无法发挥出云原生的真正的价值。

承上启下的困难与挑战

核心等关键业务系统的云原生分布式转型,需要对于核心业务以及对于底层云原生平台都非常了解,才能够真正实现高价值的核心云原生分布式转型。应用架构和数据架构,数据模型等关键要素需要匹配分布式的环境做适应性的改造和优化设计才能保证最终的效果。

性能等非功能性的忽视

从集中式架构的CA取向向云原生平台的扩展性取向进行下移和建设的时候,由于增加了很多的网络,RPC,分布式存储等传统集中式架构没有的底层开销,性能层面通常在早期的设计中没有很好的考量和设计,而到最后的整体端到端性能压力测试等时候才会爆发出来,无法满足基本的并发与时延标准,达不到上线标准,然后重新进行各种调整,这个时候大的体系基本上已经建设完毕,无法做整体性优化,无法达到最优的效果。

技术风险与运营的挑战

传统集中式架构的运维保障通常由厂商和传统的服务生态来保障,而到了云原生分布式体系下,整体需要运维的技术栈和平台的数量,整体架构的复杂程度远超以前,此时需要更多的将运维保障的任务交给自动化的,体系化的技术风险防控体系来处理,这部分的设计和建设的经验传统厂商基本上比较难以具备,也没有实际落地的经验。这对于整体系统的可用性,稳定性等带来很大的隐患和风险,这部分的提前的考量,设计与建设也需要在早期同步开展。

系统建设实施的巴别塔

系统架构即组织架构,这里的组织架构从传统意义上大家理解是系统建设成之后,整体的内部开发,运维,管控的组织结构,权责边界以及沟通交流等体系。但是从实际情况来看,新一代核心的建设周期往往都比较长,通常比较大型的金融机构建设周期都会在20个月以上,参与方众多,大家往往会忽视这个长周期项目建设团队自身的组织形式与管理模式。

从金融行业的角度而言,要实现核心的云原生分布式转型的关键在于打造一套新的云原生数字化流水生产线、配套设计工艺以及稳固的云原生分布式基础设施,尝试用综合的视角去改变那些最难改变的部分。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论