Cloud 学习笔记 11.Multicast 组播

Multicast 组播

组播是指从某一地址把信息同时传递给一组目的地址。

地址在IP层语境下，一般是指IP地址。在分布式系统里，一般指进程.

相对于广播，组播(也叫多播)的传输更受限制。组播只在一组地址(进程)中传播

云计算环境下，组播协议需要满足两个条件：容错(fault-tolerance)和可拓展性(scalability)

centralized是最简单的解决方案。sender通过for/while loop向所有receiver发送信息。

但是会导致两个问题：

为了解决上述两个问题，于是有了tree-based方案
(e.g. IP组播, SRM, RMTP, TRAM, TMTP)

如果树足够平衡，那么树的高度应该是O(log n), 并且子节点为常数。
对于云来说，故障是常态，所以树需要额外的固定开销来持续维护/修复树。

通常会在多播组之间生成树，并使用生成树算法来传播组播消息。随后再用ACK(acknowledgments)或NAK(negative acknowledgments)来修复失败的组播

使用NAK：
- 如果一个节点一段时间没有收到组播消息，那么它会向root方向(父节点)发送修复请求。当另一个节点收到修复请求，它会重发所需的组播消息
NAK/ACK风暴: 当网络不稳定时，整个网络中可能瞬间充满大量的NAK/ACK信息。为了避免NAK风暴
- 随机延迟一段时间发送请求
- 使用exponential backoff：每次请求的间隔为上一次时长的两倍

使用ACK
recevier定期向sender发送一个信息摘要(digest)。如果sender发现recevier缺少信息，就会重新发送一份数据
为了避免ACK风暴，只有一部分节点会被指定(designated receiver)。这部分节点会负责转发缺失的组播消息

然而，这些协议依然会造成O(n)的ACK/NAK开销