想成为架构师，你必须掌握的CAP细节- 大数跨境

二进制跳动

2024-04-20

导读：想成为架构师，你必须掌握的CAP细节

理论的主要优势在于其简明扼要且易于理解的性质，但其缺点则在于高度概括性，往往忽略了众多细节，这在将理论应用于实践时可能导致误解和实施上的偏差。CAP 理论也是这样，若我们不关注到那些关键的细节，实际应用中可能会遇到诸多困难，使得理论难以有效执行。

此外，当讨论到数据一致性问题时，经常会涉及到CAP、ACID、和BASE这三种理论，它们都与数据一致性紧密相关。如果不深入了解这三者的区别，就可能陷入困惑，不清楚应选择哪种理论更适合自己的需求。

接下来，我将详细解释CAP理论，并简要比较ACID与BASE的关键区别，帮助大家更清楚地理解这些概念。

原文中这句话关键地阐述了理解和应用CAP理论的一个重要方面。CAP理论在定义和解释时，通常使用如系统（system）和节点（node）这样的系统级概念，这容易使许多人误以为在进行架构设计时必须全系统统一选择CP或AP。然而，在实际的设计过程中，一个系统往往处理多种类型的数据，这些数据的要求可能不同，有些需要优先保证一致性（CP），而有些则更注重可用性（AP）。如果从整个系统的角度一概而论选择CP或AP，往往会导致方案执行时出现问题，无法完全满足所有数据的需求。

例如，在一个基本的用户管理系统中，包括了用户账号数据（如用户ID、密码）和用户信息数据（如昵称、兴趣、爱好、性别、自我介绍等）。在常规操作中，用户账号数据更适合采用CP策略，而用户信息数据则可能更适合采用AP策略。如果将整个系统定为CP，则可能不适合用户信息数据的实际应用；同理，如果设定为AP，则可能不适合处理用户账号数据。

因此，在实际应用CAP理论时，我们需要针对系统内的不同数据类型和具体的应用场景进行详细分类，为每种数据选择最合适的策略（CP或AP），而不是将整个系统的所有数据统一采用同一种策略。这种方法有助于更加精准地满足不同数据需求，避免一刀切的策略带来的局限。

CAP 是忽略网络延迟的。

布鲁尔在定义CAP理论中的一致性时，并没有考虑到延迟因素。理论假设是，数据可以在事务提交后立即被复制到所有节点。然而，在现实中，数据从一个节点复制到另一个节点总是需要时间。例如，同一数据中心内的复制可能需要几毫秒，而跨地域，如从北京到广州的复制可能需要几十毫秒。这意味着在实际应用中，CAP理论中的一致性是难以完美实现的，因为在数据复制过程中，节点A和节点B的数据可能会不一致。

这种短暂的数据不一致，尽管只有几毫秒或几十毫秒，对于一些高标准的业务场景来说是不能接受的，如涉及金钱的用户余额或抢购活动的商品库存。技术上无法在分布式系统中实现这种高度的一致性。因此，虽然理论上可能倾向于选择CP（一致性和分区容忍性），但实际上很难实现CP，而只能选择CA（一致性和可用性）。这意味着系统可能只能在单一节点上进行写操作，而其他节点则充当备份。

需要指出的是，这并不意味着不能采用分布式架构。例如，可以采用一种常见的分布式架构，将不同用户ID范围的数据存储在不同的节点上。例如，用户ID为0至100的数据存储在节点1，用户ID为101至200的数据存储在节点2，客户端根据用户ID决定访问哪个节点。这种设计允许对每个用户的读写操作只在一个指定节点上进行，而对所有用户来说，读写操作则分布在多个节点上。

这种分区设计虽然在单个节点故障时会导致该节点上用户的服务中断，但从整体上看，可以降低单个故障节点影响的用户范围和数量，比影响全部用户的情况要好得多。这也解释了为什么当地面设施损坏导致某些服务中断时，像支付宝这样的服务只有部分用户受到影响，而不是所有用户都遭受业务中断。

正常运行情况下，不存在 CP 和 AP 的选择，可以同时满足 CA。

CAP理论指出，在分布式系统中，当系统经历网络分区（P）时，只能在一致性（C）和可用性（A）之间选择其一，即系统必须选择CP（一致性和分区容忍）或AP（可用性和分区容忍）。然而，这种选择的前提是系统确实遇到了分区现象。如果没有网络分区，即所有节点间的网络连接正常运作，则系统无需牺牲一致性或可用性，理论上可以同时保证C和A。这就要求在架构设计时，不仅要考虑在分区发生时是否选择CP或AP，还需规划在无分区状态下如何确保CA。

以用户管理系统为例，即使目标是实现CA，不同类型的数据可能需要不同的实现策略：例如，用户账号数据可能通过使用消息队列来实现CA，因为消息队列能有效控制数据的实时性，尽管技术实现相对复杂；另一方面，用户信息数据则可以通过数据库同步的方式来实现CA，因为虽然数据库同步在某些情况下可能存在一定的延迟，但其实施相对简单。这样的策略允许系统在不同场景下灵活应对，从而在分区和非分区状态下均优化系统性能和数据准确性。

放弃并不等于什么都不做，需要为分区恢复后做准备。

CAP 理论经常被解释为需要在三个元素中选择两个，牺牲第三个。但是，这种说法有些误导，因为“牺牲”并不意味着在发生分区时完全不处理被牺牲的元素。事实上，大多数系统在运行的大部分时间里都是正常运行的，分区发生的时间相对较短。例如，一个具有99.99%（四个九）可用性的系统，在一年中只有不到50分钟的不可用时间；而一个99.999%（五个九）可用性的系统，不可用时间只有大约5分钟。因此，即使在分区期间临时无法保证一致性（C）或可用性（A），也并不代表系统永久放弃这些属性。我们可以采取一些措施，以便在分区问题解决后迅速恢复到CA状态。

一个常见的做法是在分区期间记录日志。例如，在用户管理系统中，如果我们选择了CP策略，当分区发生时，假设节点1可以继续注册新用户，而节点2则因为无法更新数据而不能注册新用户（这里牺牲了A，因为节点2会返回错误）。此时，节点1可以将这段时间内注册的新用户信息记录在日志中。当网络分区问题解决后，可以利用这些日志数据来更新节点2，从而使系统恢复到既有一致性又有可用性的状态（CA）。

对于选择了AP策略的用户信息数据，假设在分区期间，节点1和节点2都允许修改用户信息，但修改的内容可能不同。例如，一个用户在节点1上将兴趣改为“旅游、美食、跑步”，而在节点2上将兴趣改为“美食、游戏”。这时，两个节点都记录了各自的修改，但未能同步。分区恢复后，系统可以根据一定的规则合并这些数据，如“最后修改优先”规则可能会选择“美食、游戏”，而“内容最丰富优先”规则可能会选择“旅游、美食、跑步”。也可以将这些冲突的修改展示给用户，由用户决定最终数据。这种方法虽然牺牲了一致性，但保证了在任何节点上的操作都能够继续，从而维护了可用性。

ACID

ACID是数据库管理系统为确保事务处理的正确性而提出的概念，它包含四个主要属性，下面详细解释每一个属性：

原子性（Atomicity）事务包含的所有操作要么全部执行，要么完全不执行。如果事务在执行过程中遇到错误，它将回滚到事务开始前的状态，就好像这个事务未曾执行过一样。

一致性（Consistency）事务执行的结果必须确保数据库从一个一致的状态转移到另一个一致的状态，事务前后数据库的完整性没有被破坏。

隔离性（Isolation）数据库应该能够同时处理多个并发事务的读写和修改操作。隔离性确保并发事务的执行不会由于交叉执行而导致数据不一致。隔离性有不同的级别，如读未提交（Read uncommitted）、读提交（Read committed）、可重复读（Repeatable read）和串行化（Serializable）。

持久性（Durability）一旦事务被提交，它对数据库的修改就是永久的，即使发生系统故障，修改也不会丢失。

值得注意的是，ACID中的A（原子性）与CAP中的A（可用性）意义截然不同，而ACID中的C（一致性）与CAP中的C（一致性）虽然名称相同，但含义亦有所不同。ACID中的一致性指的是数据库数据的完整性，而CAP中的一致性则指分布式系统中数据的一致性。结合ACID主要应用于数据库事务，而CAP关注分布式系统的数据操作，可以看出，尽管二者名字相似，实则两者关注的领域和应用背景大有区别。

BASE

BASE理论为了解决分布式系统中无法实现强一致性（如CAP理论中的一致性）的情况下，如何通过适当的方式实现最终一致性，其核心概念包括基本可用、软状态和最终一致性。

基本可用（Basically Available）分布式系统在遇到故障时，允许牺牲部分可用性，确保核心功能的可用。这里的“部分”和“核心”非常关键，决定哪些功能是核心，哪些可以暂时牺牲，是一个挑战。比如，在一个用户管理系统中，“登录”是核心功能，“注册”则可能被视为非核心。未注册用户如果暂时无法注册，影响相对较小；但如果已注册用户不能登录，将影响到他们使用已支付服务，如游戏或云存储，这对用户的影响更大。

软状态（Soft State）系统可以存在临时的中间状态，这种状态下的数据不一致不会影响到系统的整体可用性。这种状态是CAP理论中提到的数据不一致性的一种表现。

最终一致性（Eventual Consistency）所有数据副本在一定时间后，将会达到一致的状态。这里的“一定时间”和数据特性紧密相关，不同的数据有不同的一致性容忍时间。例如，在一个社交媒体平台上，用户账号信息的一致性可能需要在1分钟内实现，因为用户不太可能在短时间内频繁切换节点；而对于用户发布的内容，如微博，可能容忍30分钟的一致性延迟，因为用户对这种延迟通常无感知。

BASE理论实质上是对CAP理论中选择AP（可用性和分区容忍性）时的一种补充和延伸。在分析CAP理论时，我们注意到两个关键点：

CAP理论假设忽视了延迟，然而在实际应用中，延迟是不可避免的，这意味着即使是在CP方案中，理想的一致性也是无法完全保证的，实际上这种情况下最终一致性的达成可能仅仅在几毫秒内。

在CAP的AP方案中，牺牲的是分区期间的一致性，而非永久性的一致性。这与BASE理论的核心——分区恢复后实现最终一致性——是相吻合的。

总的来说，ACID关注的是数据库事务的完整性，CAP专注于分布式系统设计的基本理论，而BASE则是对CAP理论中AP选择的一种具体实践指导。

【声明】内容源于网络

二进制跳动

15 年 + 技术老兵架构师｜技术总监｜科技创业技术合伙人曾任职苏宁科技、电讯盈科、联想云专注架构设计与技术落地

内容 739

粉丝 0

二进制跳动 15 年 + 技术老兵架构师｜技术总监｜科技创业技术合伙人曾任职苏宁科技、电讯盈科、联想云专注架构设计与技术落地

总阅读448

粉丝0

内容739