管理可观察性成本以最大限度提高投资回报
目前,大多数人可能都意识到了可观察性成本增长快于基础设施成本的问题。
我们在行业内看到了许多报告,这些报告强调了公司在采用新工具帮助监控其复杂环境以实现正投资回报(ROI)方面面临的挑战。
这无疑给组织带来了负担,因为它们在一般市场不确定性的背景下,努力平衡创新速度和维持可持续商业模式。能做些什么让情况变得更好吗?
事实上,我们可以做很多事情来更好地控制可观察性成本相对于基础设施的增长速度。如果你希望解决这个问题,第一步是提高对可观察性成本的了解。
云经济性和可观察性
让我们从一个场景开始:是时候进行年度预算了,老板要求你根据过去一年中每个季度经营业务的主要服务进行细分,生成一份关于基础设施支出的报告。
这可能不难。如果你适当地标记云提供商中的资源,通常可以直接从主要云提供商包括的成本/计费工具中提取这些信息,还有一些第三方工具、服务和咨询组可以帮助你访问这些详细信息,并了解/优化支出。

现在,如果老板问你,是否可以得到观察性支出同样的成本分解?即使可能,这很不容易,为什么会这样呢?
不幸的是,遗留监控解决方案只会提供对使用情况的高级别、时间点评估,而没有任何灵活性来按服务或团队进行细分,或者提供对随时间变化趋势的洞察。在这种情况下,开源系统并没有太大的不同。
即使使用Prometheus等开源解决方案,我们也会遇到类似的限制。测量摄入了多少数据很容易,但可用的数据同样粗糙,使得任何详细的分析都难以实现。

这是Prometheus仪表板,显示每秒传入的数据点和时间序列数据库中的许多活动序列。此信息在较高级别上可用,但不支持按服务或工作等标签进行细分。
当谈到管理云成本/投资回报率时,你可能已经看到了“云经济”一词,但当谈到可观察性时,在帮助我们管理成本和最大化投资回报率的指导方针和工具方面要少得多。如果可观察性成本增长失控,我们是否可以吸取一些在控制云成本方面学到的经验教训?如果看一下可观察性成本的增长率,那么现在肯定是开始讨论整体经济并验证投资回报的好时机。
了解可观察性ROI
我们需要能够理解在可观察性方面的投资回报。你可能已经有了一些衡量收益的概念/框架,因此首先,让我们关注如何更详细地衡量成本。我们可以再次从如何考虑管理云支出中得出一些相似之处。首先要了解的是,粒度是获得洞察的关键,这意味着要有适当的标记,使我们能够将收集的数据与运行的服务或管理这些服务的团队相关联。对于收集的每种类型的数据(指标、跟踪、日志等),我们都应该能够回答一些问题:
——每个服务/团队在支出中占多大比例?
——总的来说,支出的主要来源是什么?例如,收集的前20个最昂贵的指标是什么?
——收集的数据量每天/每周/每月如何变化?例如,一天中是否有显著变化?如果是这样的话,是什么服务/团队在生成它们?
——数据增长率与基础设施增长率相比是多少?不同的团队如何对此做出贡献?
我们还希望确保我们正在利用收集的数据。这是你希望授权给各个团队/服务所有者的事情,以便他们能够自主收集什么(前提是不超过预算),但能够回答一些与数据使用方式相关的问题通常很有用。例如:
——对于最昂贵的指标,它们在哪些仪表板/警报中使用?
——我们是在利用收集的所有基数,还是有维度在查询时被一致地聚合?
当追踪这些问题的答案时,我们可以开始批判性地查看收集的数据,并将其映射回它提供的价值。例如,可以消除或聚合很少/从未使用的高基数指标,以降低所收集数据的总体成本。随着时间的推移,随着优化收集的数据,使其与我们从消费中获得的价值更加匹配,这将导致更合理的可观察性成本。此外,团队/服务所有者可以更有信心在合理的情况下添加更多工具/收集更多数据,因为他们将有数据证明这样做是否是一项良好的投资。
围绕可观察性数据做出战略决策
以前在云基础设施方面已经有过这种模式:在采取必要措施了解支出来源和不足之处之前,成本高企。
如果可观察性成本是公司当前关注的焦点,那么先看看现在可以衡量什么。从那里,你可以制定一个计划来提高成本的可视性,无论是通过构建自定义报告,还是通过采用提供所需见解的新工具。并非每个服务/团队都会在收集的数据量和从中获得的价值之间存在巨大差异,但了解当前状态是围绕可观察性数据做出更具战略性决策的第一步。
这个问题已经变得非常严重,因此在选择任何监控/可观察性解决方案时,它都需要成为头等大事。
原文链接:
https://thenewstack.io/manage-observability-costs-to-maximize-roi/


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
