如何监控微服务调用？- 大数跨境

二进制跳动

2024-06-01

导读：如何监控微服务调用？

与单体应用相比，微服务架构下的一次用户调用会拆分成多个不同服务之间的相互调用，因此需要对每个拆分后的服务进行监控。在讲述如何监控微服务调用前，我们需要先弄清楚三个问题：监控的对象是什么？具体要监控哪些指标？从哪些维度进行监控？接下来，我们就从这三个问题开始，探讨如何监控微服务调用。

要监控微服务系统，需要关注哪些对象呢？根据我的经验，监控对象可以分为四个层次：

用户端监控：指对直接提供给用户的功能的监控。例如，微博首页 Feed 提供用户关注的微博浏览功能，监控此功能属于用户端监控。
接口监控：指对业务功能所依赖的具体 RPC 接口的监控。例如，微博首页 Feed 功能依赖于关系服务、微博列表服务和内容服务，监控这些服务的调用情况属于接口监控。
资源监控：指对接口所依赖的资源的监控。例如，关系服务使用 Redis 存储关注列表，对 Redis 的监控属于资源监控。
基础监控：指对服务器本身健康状况的监控，包括 CPU 利用率、内存使用量、I/O 读写量和网卡带宽等。服务器健康状况是影响服务的重要因素，如网络交换机带宽满载会影响所有业务。

确定监控对象后，需要监控哪些具体指标呢？通常有以下几个重要业务指标：

请求量：分为实时请求量（QPS，Queries Per Second）和统计请求量（PV，Page View）。QPS 反映服务调用的实时变化，PV 反映一段时间内的请求总量。
响应时间：用平均耗时和慢请求数量来衡量。将响应时间划分为多个区间（如 0～10ms、10ms～50ms、50ms～100ms、100ms～500ms、500ms 以上），监控每个区间内的请求数。还可以用 P90、P95、P99、P999 等指标，如 P99 = 500ms，表示 99% 的请求在 500ms 内完成。
错误率：用调用失败的次数占总调用次数的比率衡量，例如接口返回错误码 503 的比率。

需要从多个维度对业务进行监控：

搭建监控系统需要完成以下四个环节：数据采集、数据传输、数据处理和数据展示。

在微服务改造过程中，服务监控至关重要。没有强大的监控能力，无法掌控各个服务的运行情况，出现调用失败时不能快速发现问题，会对业务造成严重影响。搭建监控系统涉及数据采集、数据传输、数据处理和数据展示等多个环节，每个环节都需根据业务特点选择合适的解决方案。

请思考，你所在技术团队目前采用的监控系统监控了哪些业务数据？包含哪些业务指标？有哪些监控维度？你认为这些设置是否合理？

我们的监控系统目前主要监控了以下业务数据：

我们重点监控以下业务指标：

我们从以下多个维度进行监控：

通过这些监控措施，我们可以全面了解系统的运行状态，及时发现和处理问题，保障服务的稳定性和高可用性。我认为这些设置是合理的，因为它们确保了我们能够快速响应问题，并有效地保障系统的整体性能和用户。

【声明】内容源于网络

二进制跳动

15 年 + 技术老兵架构师｜技术总监｜科技创业技术合伙人曾任职苏宁科技、电讯盈科、联想云专注架构设计与技术落地

内容 739

粉丝 0

二进制跳动 15 年 + 技术老兵架构师｜技术总监｜科技创业技术合伙人曾任职苏宁科技、电讯盈科、联想云专注架构设计与技术落地

总阅读44

粉丝0

内容739