近几年,无论是在国内还是国外,混合云都迎来了长足的发展。不但环境构成随着云计算概念而大幅拓展,技术能力和解决方案也得到了极大的丰富。企业越来越多地采用混合云模式构建IT环境,借助混合云的独特优势满足在特殊场景下的差异化需求。
(一)混合云定义与概念
关于混合云的概念,业界一直没有统一的定论。一方面,公有云和私有云混合的模式自混合云出现开始便一直占据主流,应用范围也最为广泛;而另一方面,随着云计算概念的扩大和混合云自身的发展,专有云、行业云、边缘云、容器云、本地数据中心等云上和云下环境都逐步被纳入当中,成为企业混合云及IT架构的重要组成部分。
无论是狭义上公有云+私有云还是广义上更多样化的部署模式,本质上都是通过专线、VPN等网络来连接各个相关云和本地环境,实现资源之间的互联,以便应用能够相互通信。因此,本白皮书将混合云定义为通过网络连接等方式将两个或更多IT环境中的各种服务集中在一起,以支持并行、集成或互补的任务为目的而构建的一种云架构。实际部署中,混合云也以满足用户的应用需求为基准,不必拘泥于某一种特定的组成方式。
(二)混合云主流产品及方案
混合云的广阔前景,吸引了包括公、私有云服务商、电信运营商、传统IT服务商在内的多类厂商。而不同的技术和资源基础也使企业各自的混合云方案不尽相同:
阿里混合云在技术架构上一直采用与阿里公有云同宗同源的技术栈,满足了政府部委、金融客户到能源、电力、新零售、制造、文化传媒等行业大客户多种上云需求。除了支持阿里公有云、混合云企业版、敏捷版和一体机之外,针对客户VMware和线下私有云、K8s集群和混合IT等异构场景需求,阿里云提供了VMware on阿里云和原生智能混合云解决方案(政府、金融、能源电力、高速、传媒等)满足客户构建的企业混合云基础设施诉求。
腾讯云容器服务TKE,为了解决混合云场景下,用户环境不一致可能导致的相同应用在不同环境下性能、稳定性不一致的问题,推出了TKE发行版,TKEStack,结合腾讯已经开源的TencentOS,从操2作系统、K8S版本、集群生命周期管理工具全维度开源,帮助用户在混合云场景下,构建一致的运行环境。此外,在集群能力层面,针对常见的利旧、云突发场景,提供了构建跨云集群的能力和对应调度策略,可有效的降低单云用户向混合云转变的改造成本。
UCloud优刻得混合云解决方案有效地整合了公有云和客户自有环境或者私有云资源,通过同构“公有云+私优云+托管云+行业云等,多元化架构的方式为用户提供全栈式混合云行业解决方案,可有效满足不同行业用户类型的特定需求。特别针对金融、政府等行业监管及合规要求特殊的机构,UCloud能够提供定制化混合云方案,保障用户的业务稳定,架构平滑过渡。互联科技基于自身基础设施资源,为客户提供一站式“交钥匙”托管混合云解决方案。在充分理解客户需求后,互联科技可设计并提供“数据中心+网络传输+混合云平台+云原生技术支持”的个性化混合云,致力于交付给客户一个满足业务需求的IT环境。同时,通过专业的运维和技术支持服务,互联科技技术团队能够支持全方位云平台运维托管,让客户更专注于其业务本身。
戴尔科技混合多云平台(DTCP),由资源平台、数据平台、创新平台三大平台组合而成,通过一致性架构、一致性管理和一致性服务,并基于机器学习的端到端监控管理,实现自动化管理和运维,实现在公有云和私有云之间的关键业务双向无缝迁移,并提供从边缘计算到数据中心再到云计算的一站式、端到端的解决方案和服务。全面集成Tanzu和vSphere 7,支持原生虚拟机和Kubernetes容器,降低IT架构的运维难度,同时更好满足云原生应用的开发和管理。“Flex on Demand”借助弹性收费模式,可让客户降低IT预算、应对业务快速增长和激增的工作负载,让私有云和数据中心拥有公有云的消费模式和弹性。
混合云五大应用场景
(一)应用负载调度
1.场景简介
以电商、游戏、直播为代表的对外服务行业,特别是其中经营2C业务的企业,其业务和工作负载需求很大程度上受到外部用户流量的影响。平时此类业务的流量基本稳定,依靠私有云或日常配置的服务器就可以较好地满足服务需求。但是特殊时间,比如“双11”大促销,新游戏开服、国庆直播活动等,会有大量外部用户涌入,形成以日常业务规模为基准的私有云难以应对的高并发,导致排队严重,降低用户体验,丢失了用户和商业机会。而从成本角度来说,由于业务高峰和低谷流量差距巨大,以满载容量部署本地服务器的话,成本则过于高昂。因此,越来越多的用户开始借助混合云负载调度设计实现成本和业务需求之间的平衡。
2.基础架构及方案
负载调度场景下采用混合云架构的根本目的是在满足快速变化的业务需求的基础上实现成本的优化。因此,通常会将应用部署在私有云里,仅维持满足日常服务需求的算力。当遇到某一特定时期应用访问或使用突然增加,而企业无法快速添置硬件扩展私有云容量去适应这变化时,混合云平台可以通过公有云来弥补暂时的容量不足,达到调峰目的。
要实现混合云的负载调度,在通过专线打通公有云和私有云的基础上,还需要具备弹性伸缩和业务流量分配两方面能力。
弹性伸缩方面,需要能够根据用户的需求和策略,自动调整计算资源的大小。混合云平台的监控模块将实时监控伸缩组内实例的性能和健康状况,一旦业务量上升,实例性能达到某一阈值,便按照预先配置的伸缩任务和规则在公有云上创建和部署新的实例。规则的内容将包括实例的数量、类型以及配置等。之后随着业务量下降,伸缩组也可以根据监控信息,弹性的减少实例。
业务流量分配方面,需要在业务上升时将流量调度到不同的入口。这一过程主要由智能DNS解析和负载均衡(SLB)配合完成。其中,智能DNS将应用服务的访问请求按照流量和地域等信息分配到公有云或私有云当中;SLB则负责平衡多个实例之间的负载,并配合弹性伸缩任务灵活增加后端实例,以应对业务峰值。
(二)容灾备份
1.场景简介
在传统IT建设过程中,灾备建设是一个复杂的内容,包括了灾备环境搭建、网络配置、数据同步、应用恢复验证、切换演练等工作。是一个集合技术、运营、管理等多方位能力的综合工程。一个企业通常会将灾备建设纳入某一时期的重点IT工作,但由于灾备建设范围广、内容多、要求高等一系列因素,往往导致灾备建设时投入巨大,但后续效果不明显的问题。而云计算技术能够帮助企业快速启动灾备环境,大幅减少RTO时间中的环境准备时间,同时,即开即用的特点也避免了前期的大幅投入,并且在资源复用能力上也会比传统IT架构有很大优势。因此,将传统设施与云计算相结合以实现可靠、快捷容灾的混合云灾备设计逐渐成为了主流。
2.基本架构及方案
使用混合云架构进行容灾备份的核心诉求是通过多个云环境代替原有传统灾备模式,在达成业务系统快速、平滑切换的目的,最大程度保障业务连续性,并提升灾备切换的实操性和性价比。
混合云在生产端,需要能够利用私有云或公有云建设灵活、稳定的云平台保障业务稳定运行,在灾备端,通过异地的云环境,对生产端数据进行同步/异步的数据传输,同时,利用云平台资源即开即用的特点,能够在灾难发生后快速按需启动相关资源,达成灾备环境平滑切换,提升RTO和RPO。
要达成容灾备份场景在混合云架构下的平滑切换,除了需要在生产和灾备的云平台之间建立专线进行打通之外,还需要有能都进行多云资源调动的能力以及快速业务切换的能力。主要体现在以下几个方面:
其一,多云资源管理能力。面对混合云环境,用户需要能够通过多云管理平台,准确掌握所有云平台相关的已用和可用资源,来统计并评估当前资源池是否满足业务发展及潜在的灾备恢复要求。对于灾备端,如果以私有云作为支持平台,则通常需要能够在日常期间复用灾备端资源进行开发测试环境部署,因此更需要多云资源管理的能力,以满足在灾难发生时,快速、准确的识别可释放的资源,来满足生产系统恢复的资源要求。
其二,业务系统资源抽象及交付能力。在多云资源管理能力之上,还需要能够对业务系统进行适当的资源抽象,将业务系统的资源需求形成一个标准化模板,能够通过半自动/自动化方式进行标准化交付,这样能够有效避免在业务系统部署时的人为因素风险,并提高整体资源交付效率。
其三,业务快速切换能力。这需要在资源调动能力之上,与业务部门进行协调,并利用如智能DNS,全局负载均衡GSLB,CDN等手段,在灾难发生时,通过云平台将业务系统快速拉起,并通过上述互联网出口服务组件将灾备环境平滑对外提供服务,以降低最终用户的感知,有效控制由于灾备切换导致的业务风险。
(三)混合部署
1.场景简介
对于金融、医疗等受到多方面限制的行业来说,依靠单一环境往往不能满足复杂的业务需求:一方面,由于合规或安全性要求,以用户隐私为代表的敏感数据必须存储在本地环境中,存储、服务发现、网关等依赖服务也需要在本地IDC机房提供;而另一方面,企业其他业务在并发、响应、开发/部署模式等方面的特点也决定了其离不开云上丰富的资源和服务。这两种需求之间存在一定矛盾,而业务本身又不可完全割裂,因此通过混合云同时满足多种需求慢慢成为了解决问题的重要方式。
2.基本架构及方案
混合部署是通过对用户应用的适当拆分和改造,以实现在不同环境内满足多样化业务需求的一种场景。混合部署既有别于应用在单一环境内的统一部署,也不同于多个应用之间的完全隔离,需要应用组件在拆分的同时,还要依靠混合云内IT环境之间的网络实现互联互通,实现业务、数据以及功能上的协同。
常见的混合部署形态为,将敏感数据层和对数据延时有高要求的业务模块放在IDC,将应用接入层、应用逻辑层放在公有云就近地域。与此同时,应用的一些依赖服务、或者上下游服务可以部署在另一个云厂商公有云。多个数据中心通过专线连接,内网访问,以保障安全性和网络稳定性。
这种架构下,需要注意的是云的地域需要和IDC尽量在同一个区域,并且在专线层面需要有QOS分配或者将业务流量和管理流量分离,以确保业务的异常流量不会将全部专线带宽占满,从而造成数据中心级别的故障。另外,由于专线本身存在一定概率的故障,因此需要在服务降级策略方面有所储备,可通过备用公网服务、数据缓存策略等形式建设一定的容灾策略。
混合部署的另一种形式是边缘业务,边缘业务是典型的弱网络场景,业务逻辑运行在边缘设备,并将边端数据上报到公有云的中心管控,特征是业务逻辑相对闭环,且本身具备较强的容错能力,因此边端和中心管控之前可以无需专线。用户通过智能DNS解析接入到就近的边端设备,中心管控负责管控边缘设备,分发指令、汇总数据,IDC的数据服务负责数据价值挖掘。
(四)混合云DevOps
1.场景简介
为应对快速的市场变化和业务创新发展需求,提升用户服务意识及服务能力已成为各企业的刚需和挑战。随着越来越多的企业通过数字化转型及应用上云等方式改善业务能力,研发效能跟不上业务发展速度的问题日渐突出。交付效率低、软件质量差等研发痛点在传统企业历史技术债带来的双模(瀑布&敏捷)双态(稳态&敏态)效能挑战面前尤为明显。而传统应用开发和运维模式的发版周期长、故障多、部门之间割裂问题也随着企业IT环境的复杂化而进一步加剧。因此,构建统一的研发运营流程和方法,降低企业IT研发和部署成本,赋能业务发展已成为企业数字化转型的重点。
2.基本架构及方案
混合云DevOps是通过构建混合云下一致的开发流程与工具,帮助企业高效、快速、高质量地交付应用程序和服务。企业的开发阶段和部署阶段逻辑上相互独立,实际流程中则应用一套集组织文化、团队协作、工程实践和工具为一身的工作方式,支持跨混合云内环境完成开发测试和生产部署,从而更好地实现客户价值,帮助企业跨越业务高速发展和研发低效交付的鸿沟。
实际部署中,可以将业务的开发测试环境及开发云资源池部署在公共云上,利用公有云按需使用和快速部署能力满足开发测试过程中不断变化的需求;与此同时,用户的核心业务和关键系统生产环境及生产云资源池则可以部署在私有云上,保障业务的稳定的运行。
(五)数据分析
1.场景简介
随着企业信息化和数字化程度的加深,各业务都积累了海量的数据资产,如何处理好这些数据也成为很多企业面临的一个问题。一方面,企业IT环境的分散使各业务系统和数据分布在不同地点;另一方面,对海量历史数据进行分析和挖掘也需要强大的资源和技术能力。因此,企业急需一个稳定可靠的环境,来保障业务后续的数据积累能够顺畅的完成,并且为之后可能的数据分析、机器学习等场景提供一个IT底座。
2.基本架构及方案
通过围绕混合云建设一个可控的数据集散中心,能够将各个系统的业务数据进行归拢和存储,并且能够将这些数据进行自由流动,彻底解决原先数据孤岛、无法进行全景数据分析的问题。混合云数据分析主要使用了云主机、云硬盘、云存储、虚拟网络、混合云连接等云平台组件。主要架构如下图所示:
在整体架构中,通过不同云平台的业务数据可通过主动抽取和汇聚导入的方式,集合到一个可控的数据云平台,此平台可以在公有云或私有云环境中,但鉴于企业对于数据安全和合规的要求,建议使用私有云环境作为数据云平台。
数据云平台可以通过分布式存储建立一个海量数据湖,存放各种类型的数据,包括结构化数据,文件、图片、音视频等非结构化数据,既能够解决各个应用之间的数据流动,也能够在一定程度上降低存储成本。
通过将所有数据汇聚在一个统一的平台,后续可以利用各类数据分析和机器学习的工具,将企业的全景业务数据建设成为一个数据集,用来进行各类企业级场景下的数据挖掘和分析。