评估系统性能,吞吐量、响应时间和完成时间是关键指标,从不同维度反映系统运行效率与处理能力。
吞吐量:系统处理能力量化标准
吞吐量指系统在一定时间内处理任务的数量。常见指标如下:
- QPS(Queries Per Second):每秒查询数,用于衡量系统读操作处理能力,数值越高,读操作支持越强。
- TPS(Transactions Per Second):每秒事务数,用于衡量系统写操作处理能力,数值越高,写操作支持越好。
- BPS(Bits Per Second):每秒比特数,用于衡量系统处理的数据量,在请求数据量差异大的系统中,能更客观反映吞吐量。
响应时间:影响用户体验的关键
响应时间是系统对请求做出响应的时长,直接影响用户体验,对时延敏感业务至关重要,如驾车导航搜索。
完成时间:任务处理效率体现
完成时间是系统完成请求或任务的耗时,在处理海量数据或大规模任务时,用户感知明显,任务并行模式可有效缩短完成时间。
资源占用
可用性是分布式系统的重要指标,体现系统在异常下持续服务的能力,衡量方式有两种:一是按系统停服时间占比计算,如网站 24 小时故障 4 小时,可用比例为 0.833;二是依据功能失败请求占比衡量,如 1000 次请求 10 次失败,可用性达 99%。宣传中的 “3 个 9”“5 个 9”,分别代表 99.9%、99.999% 的无故障服务时间占比。
与可用性相近的可靠性,常用于表示系统完全无故障的概率,在硬件领域应用居多。而可用性关注部分组件失效时,系统仍能对外正常服务的概率。在基于通用计算机的分布式系统中,因硬件故障频发,难以实现绝对可靠,这使得可靠性和可用性在部分场合会被交替使用 。
- 电商系统:看重吞吐量,愿投入硬件成本处理大量用户访问与订单业务。
- IoT 系统:关注资源占用,因设备资源有限。
- 电信业务:重视响应时间、完成时间与可用性,保障通信即时性和稳定性。
- HPC 系统:聚焦水平扩展带来的加速比,应对长时任务。
- 大数据系统:首要考虑扩展性,解决任务处理时间长的问题。
- 云计算系统:致力于减少操作完成时间、降低资源开销,提升用户体验与效益。
- 区块链系统:以提高吞吐量、缩短完成时间为主要目标 。

