可观察性平台能否超越传统APM?

云原生架构实现了更快的软件开发生命周期。价值可以更快、更增量地实现。但是,一旦组织大规模部署,就必须看到更小的、分布式的、相互依赖的部分。移动部件太多,太多可能会出错,无法对此类环境进行透明和控制。

本文来自开源云中文社区。

451 Research最近的一份市场洞察报告介绍了Chronosphere可观察性平台和功能,并承认在当今云原生世界中对它们的需求越来越多。

这份名为《Chronosphere旨在控制失控的可观测性数据和成本》的报告也提出了一个问题:市场上是否存在独立、可扩展和盈利的可观察能力玩家的长期空间?或者,遗留应用程序性能监控(APM)供应商最终会介入并夺取控制权吗?

451项调查显示,36%的企业已经在生产中部署了可观察性工具。另外18%的人目前正在调研概念验证。

我们认为前者是自然而然的。Chronosphere的创始人,首席执行官Martin Mao和首席技术官Rob Skillington在Uber领导了可观察性团队,创建了M3,一个开源、可扩展的远程存储时间序列数据库。

Chronosphere的解决方案是从一开始就设计出来的,可以在容器上运行的大规模、基于微服务的应用程序中工作,也可以监视在非容器化环境中运行的单体,这意味着许多企业中普遍存在的混合环境可以通过这样的一个工具进行监控。鉴于451 Research的分析发现,组织正在寻求减少而不是扩大其可观察性工具集,这一点尤为重要。

为什么要可观察性?

由于速度、规模和效率,世界正在走向云原生。云原生架构实现了更快的软件开发生命周期。价值可以更快、更增量地实现。但是,一旦组织大规模部署,就必须看到更小的、分布式的、相互依赖的部分。移动部件太多,太多可能会出错,无法对此类环境进行透明和控制。

451 Research将可观察性定义为“结构化事件数据的摄取、存储和分析,用于问题检测和解决”。可观测性平台允许工程师快速集中于背景数据,以诊断云原生环境中的问题。

可以说,传统的APM解决方案根本无法在云原生世界中实现可观测性。这些遗留解决方案会遇到三个基本问题:

——可扩展性:云原生环境广播大量数据,比传统的基于虚拟机(VM)的环境多10到100倍。

——灵活性:云原生应用程序及其运行的基于容器的基础设施是短暂的。它们只在部署的整个生命周期内生存。考虑到今天的实践,这些生命周期往往很短。

——可靠性:如果测量工具本身的可用性超过99.9%,则无法保证99.9%的正常运行时间服务级别协议(SLA)。今天的大多数APM都无法达到“三个九”级别的可用性。

这些可伸缩性、灵活性和可靠性的挑战是笔者称之为可观察性工具“期望差距”问题的主要驱动因素。公司希望他们的可观察性工具能够更快地发现问题(平均检测时间)、更快地解决问题(平均恢复时间),并提高响应能力。但是,对于正在使用APM或IT基础设施监控解决方案的公司来说,解决方案可能会落空。

根据451 Research的数据,可观察性工具的期望差距相当大:更快的问题检测速度为20个百分点,更快的问题解决速度为15个百分点,提高响应速度为16个百分点。

2345截图20220826142420.png

为什么选择Chronosphere?

在报告中,451 Research简明扼要地阐述了Chronosphere的价值主张:

“该公司的SaaS平台将开源云监控的好处与客户输入相结合,以消除无差别度量和跟踪的噪音。”

451研究指出,基于Prometheus或OpenTelemetry的自我管理OSS解决方案在从容器化环境中捕获度量和跟踪时可以很好地工作。但它们有许多局限性。首先,随着应用程序的增长,需要更多的工人来支持它们,导致成本上升。

随着组织试图扩大规模,可用性和弹性也是“重大问题”。大量的相互依赖关系导致数据的数据基数更高,并且更迫切地需要基于业务度量将基础设施连接到应用程序。451 Research总结道,这就是为什么,即使在与基于VM的部署规模相同的情况下运行,云原生应用程序的监控费用也会大大增加。

Chronosphere的目标是使用控制平面来缓解处理加速数据增长的痛苦,以及可观察性数据的成本,该控制平面依赖于聚合和其他技术来制定保留和解决策略,使客户只需为他们绝对需要保留的数据付费。

此外,正如451 Research所写,“Chronosphere认为,其差异化在于解决面向客户的问题的根本原因,而不是过分关注指标、日志和跟踪(这是数据)-主要活动是反省应用程序,以了解发生了什么。”可以说,Chronosphere关注的是结果,而不是数字本身。

在实践中,这意味着使用Chronosphere工具,让工程师专注于解决三个关键问题:

——当出现问题时,在负面客户或员工体验之前或之后,能以多快的速度得到通知?

——能多容易、多快地分类问题并了解其影响?

——如何找到根本原因以便解决问题?

通过关注结果,可以以多快的速度纠正这种有问题的客户或员工体验,而不是输入(指标、日志和跟踪),Chronosphere平台以能够显著缩短解决问题的时间而闻名。这对于越来越依赖云原生应用程序的企业来说非常重要。

为云原生设计并构建了可观察性平台

云原生可观察性已被证明是传统APM领域的一股颠覆性力量。451指出,“在企业应对复杂的云原生应用程序所带来的挑战时,人们对专门针对云原生技术设计的工具也很感兴趣。”由于云原生环境的要求,它在架构上和独特性上有很大的不同。传统的APM供应商无法现实地重新设计他们的解决方案,使其在这个新世界中工作。

APM可能是企业基于VM的应用程序所需的工具,但可观察性将为拥有云原生环境的企业带来竞争优势。另一种思考方式是,尽管今天的APM工具是为云设计的,但可观察性平台是为云原生设计的。这是一个很大的区别。随着组织越来越多地转向云原生架构,像Chronosphere平台这样的可观察性平台将在使用和交付业务成果的效率方面超越APM解决方案。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论