分布式一致性协议通俗讲就是多机状态的一致性保障协议,即如果同一份状态存储在多台机器上,如何保证在多台机器上的状态彼此是一致的。一致是指读到的结果和写入的预期是一致的。
raft的做法是:
- 节点分为三种角色leader、fellower、cancidator。leader接受client的读写请求,fellower接受leader的状态同步消息。cancidator是当fellower在timeout超时后也没有的收到leader的消息时,就自动成为cancidator。
- leader定期会向fellower发送heartbeat消息。leader收到client的状态修改消息后,生成log entry信息,同步给fellower。fellower回复ack给leader。当leader收到超过半数的fellower的ack后,就将状态进行实际修改,并返回client成功,同时通知fellower可以落盘。
- 如果出现网络分割,leader无法和多数fellower通信。不能和旧leader通信的fellower在timeout超时没有收到新的heartbeat消息后,就会广播选举自己为leader。其它fellower收到选举消息后,会确认。这样新的leader就出来了。
- 如果同时有两个cancidator选举自己为leader。这时可能都不能得到多数票。就各自sleep 100-150ms后重新尝试选举自己。
几点疑问:
- leader回复给client ack成功,回复给fellower ack失败,这时状态的状态不一致是如何处理的? 等待下一个heartbeat ack到达时,将上一个message ack掉?
- 从流程上看性能会比较低,如何承担类似消息队列系统的高吞吐?
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。