[[397422]]
发现之前写的什问什需 Raft 文章并没有分析过 Figure 8 的问题,而这张图比较容易让人产生歧义,什问什需群里讨论过不止一次。什问什需在这里谈谈我的什问什需理解。
Figure 8 用来说明为什么 Leader 不能提交之前任期的什问什需日志,只能通过提交自己任期的什问什需日志,从而间接提交之前任期的什问什需日志。
先按错误的什问什需情况,也就是什问什需 Leader 可以提交之前任期的日志。那么上述的什问什需流程:
这里主要通过 (c) 和 (d) 来说明问题所在。其实这张图用 Raft 大论文的图会比较好理解。(d) 和 (e) 分别对应 term=4 有没有复制到多数派的情况。
所以,我们要增加提交的约束,不让 (d) 这种情况发生。这个约束就是,Leader 只能提交自己任期的日志。
我们再来看看,加了约束后会变成什么样?前面 (a) 和 (b) 没有任何改变,我们从 (c) 开始。
答案是不能。因为 S5 在 S1(term=4) 选举出来后 currentTerm 至少是 5,也可能是 6、7、8……我们假设就是 5,但这条日志 term = 3,Leader 不能提交之前任期的日志,所以这条日志是不能提交的。只有等到新的请求进来,超过半数节点复制了 1-3-5 后,term=3 的日志才能跟着 term=5 的一起提交。
虽然加了这个约束不会重复提交了,但如果一直没新的请求进来,index=2 & term=3 岂不是就一直不能提交?那这里不就阻塞了吗?如果这里是 kv 数据库,问题就很明显了。假设 (c) 或 (d) 中 index=2 那条日志里的 Command 是 Set("k", "1"),S5 当选 Leader 后,客户端来查询 Get("k"),Leader 查到日志有记录但又不能回复 1 给客户端(因为按照约束这条日志未提交),线性一致性要求不能返回陈旧的数据,Leader 迫切地需要知道这条日志到底能不能提交。
所以 raft 论文提到了引入 no-op 日志来解决这个问题。这个在 etcd 中有实现。
no-op 日志即只有 index 和 term 信息,command 信息为空。也是要写到磁盘存储的。
具体流程是在 Leader 刚选举成功的时候,立即追加一条 no-op 日志,并立即复制到其它节点,no-op 日志一经提交,Leader 前面那些未提交的日志全部间接提交,问题就解决了。像上面的 kv 数据库,有了 no-op 日志之后,Leader 就能快速响应客户端查询了。
本质上,no-op 日志使 Leader 隐式地快速提交之前任期未提交的日志,确认当前 commitIndex,这样系统才会快速对外正常工作。
另外说一句,6.824 的实验不需要实现 no-op 日志。
这个问题之前阿里巴巴团队称之为“幽灵复现”,参见《如何解决分布式系统中的“幽灵复现”?》,里面讨论了 Paxos、Raft 和 Zab 的解决方案。
本文转载自微信公众号「多颗糖」,可以通过以下二维码关注。转载本文请联系多颗糖公众号。
责任编辑:武晓燕 来源: 多颗糖 MySQLFigure 8Raft
(责任编辑:知识)
文投控股(600715.SH):北京文创定增基金已减持17.89万股 占公司总股份的0.0096%
2023东京电玩展门票7月8日开售 国内参展厂商包括米哈游网易等
街机休闲《PixelJunk Eden 2》年内发售 前作屡获殊荣
比iPhone 14还窄!Redmi Note12 Turbo拿掉了塑料支架