本文来自开源云中文社区。
传统的内部数据中心还在,但曾经主宰它们的工作流正迅速过时。在基础设施即服务(IaaS)平台出现以与数据中心竞争之前,组织习惯于静态基础设施。资源通常是一次性调配、长期持有的,并且是中央IT团队负责,该团队使用票务工作流控制资源。
时代变了。现在,企业将其数据和应用程序部署到云上,利用按需资源的强大功能。但是,在多云环境中调配和维护基础设施(每个环境都有自己的工作流)带来了一系列新的挑战,从管理不同的工作流和基础设施扩展,到应对被分割成孤岛的团队和关键技能的差距。有鉴于此,基础设施自动化的采用通常分为三个不同的阶段:
——采用并建立资源调配工作流。
——标准化工作流。
——大规模运行和优化。
生活在多云世界中
组织和团队继续在各种各样的公共和私有云中发现巨大的业务好处,使用最适合其独特情况和手头任务的云,并利用根据使用需求上下旋转资源所带来的高效率。根据2021 HashiCorp云战略状态调查,76%的组织已经使用多云,86%的组织有望在2023年前使用多云,多云环境的主导地位才刚刚开始。
这对IT团队来说是个好消息,因为他们现在在云基础设施方面有了更大的灵活性,可以增强业务运营并帮助实现目标。但缺点是,多个用户和多个云可能会创建一个复杂的生态系统,并增加风险,因为没有对合规性和安全性的集中实施,也没有对资源使用和成本的深入了解。
多工作流、多云环境中的基础设施问题
事实是,旧的资源调配和工作流规则不再适用于今天的多云环境。组织必须考虑为多个云提供资源,而云的动态特性意味着基础设施可以不断修改。云还为更多用户开放了基础设施的创建。
在这种日益复杂的环境中构建、维护和保护基础设施带来了四个主要挑战:
不同的工作流:在一个组织中,一些用户选择特定于云的工作流,而另一些用户选择与云无关的工作流。一些人希望继续使用私有数据中心基于GUI的工作流。这可能会导致同一组织内出现多个工作流。
基础设施蔓延:由于多个团队和最终用户在整个组织中调配基础设施(有时不通知较大的组织他们正在做什么),很容易最终得到重复或未使用的资源,因为没有简单的方法可以获得其所有基础设施的统一、集中视图。蔓延的、不受控制和未知的基础设施可能会造成组织甚至可能都不知道的安全漏洞。
孤立的团队:不同的工作流和基础设施的蔓延通常会导致团队使用不同的工具来处理不同的工作流和流程。这限制了协作。团队甚至可能不知道其他团队在做什么,因此他们不必要地重复工作,并与已经解决的问题进行斗争。
技能差距:使用多个云需要多个工作流方面的专业知识。然后,个人可以专注于特定的技能,这些技能不会跨越所有工作流。因此,团队可能不具备提供和管理其所有基础设施所需的所有技能,或者由于团队可能不共享共同的参考点,因此可能难以协作。
基础设施自动化的三个阶段
采用多云战略只是第一步,成功管理和优化它是下一步。这意味着依靠基础设施自动化和通用的资源调配工作流程。
组织通常在其基础设施工作流和自动化过程中经历三个阶段:
阶段1:采用并建立资源调配工作流
在各种云或内部数据中心中,每天从不同的来源多次手动调配和更新基础设施,使用大量工作流会导致混乱。团队将难以协作,甚至难以共享组织基础设施的视图。为了解决这个问题,组织必须采用基础设施调配工作流,该工作流对于任何云、服务或私有数据中心都保持一致。该工作流还需要通过API进行扩展,以连接到该工作流中的基础设施和开发人员工具,以及跨多个提供商查看和搜索基础设施的可见性。
基础设施即代码(IaC)提供了一种跨所有基础设施一致调配基础设施的方法。这提供了基础设施的记录和可作为团队协作的资源调配工作流。
阶段2:标准化工作流
接下来,你希望在整个组织中标准化资源调配工作流,确保它提供足够的安全性并最大限度地提高效率。传统的、基于票证的基础设施资源调配方法使其成为一个守门员,他们在那里充当基础设施的管理者,但也会造成瓶颈,限制开发人员的生产力。但是,允许任何人在不进行检查或跟踪的情况下调配基础设施,都会使组织容易受到安全风险、不合规性和代价高昂的运营效率低下的影响。
为了避免这些问题,组织需要标准化工作流,以最大限度地减少冗余工作,并为安全性、合规性和操作一致性提供适当的防护。关键要素包括:能够将基础设施的可重用组件发布为已由中央IT部门验证和批准的代码;能够将策略和防护栏定义为代码;策略和防护栏的验证和实施;与中央IT和ops工具集成以实现SSO、审核日志记录、通知,以及使用基于角色的访问控制(RBAC)管理用户和团队的能力。
阶段3:大规模运维和优化
然而,即使是标准化的工作流也不够。要获得基础设施自动化的全部好处,组织必须能够不断优化其基础设施,并大规模管理和运维基础设施和资源。这意味着向开发人员扩展自动化的自助式基础设施配置,并提供适当的策略和防护措施,以及纠正违反策略行为的方法。这意味着在基础设施发生变化时,根据预先确定的参数自动发出警报和通知。而且它需要能够使用数据收集见解以优化基础设施,例如查看整个组织的云支出以避免过度调配,快速取消未使用或未充分利用的资源的调配,并创建策略以强制实施最佳做法以避免未来的过度调配。
这一单一的真相来源可以帮助组织更好地理解云支出、查看基础设施变化并提供持续的管理和治理。
基础设施自动化过程的最后一个阶段允许组织以一种他们无法做到的方式进行扩展,当票证批准的速度决定了团队成员可以从事的项目、工作经常是冗余的并且工作流是不同的时。所有这些都减少了跨平台的麻烦,同时收获了利用多个云的好处。
一个工作流来管理所有
最大化基础设施自动化的好处不仅仅是创建和标准化工作流。它是关于精简工作、降低成本和确保组织能够实现云的承诺,从更高级别的灵活性和创新,到提高开发人员的生产力和更快的新数字产品和服务上市时间。
HashiCorp Terraform为基础设施自动化提供了内置功能,并提供了构建、组合、协作和将基础设施作为代码重用的工作流。Terraform具有可扩展性,可以与组织的所有基础架构和工具一起工作,并在调配后提供基础架构生命周期管理功能。
原文链接:
https://thenewstack.io/the-3-phases-of-infrastructure-automation/