7牛V2版本中的可靠性问题。

在7牛V2版本功能介绍之《存储系统那些事》里提到,

我们的EC采用的是28+4,也就是把文件切分为28份,然后根据这28份数据计算出4份冗余数据,最后把这32份数据存储在32台机器中。
。。。
从可靠性方面,以前3副本只能允许同时损坏2个盘,现在能同时损坏4块盘,直观来说这大大改善了可靠性。

我想请问,以前3个盘发生2个以上损毁的话才会有数据丢失,现在32个盘有4个以上的盘损毁就会发生数据丢失。
32块盘发生4块以上损毁的概率远远大于3块盘发生2块以上的损坏。这哪里体现了EC的可靠性呢??

Bn(k) = C(k, n)p^k * (1-p)^(n-k),其中p为每个盘的损毁概率。
则32块盘发生4块以上损毁的概率(即数据丢失的概率)是:1 - B32(0) - B32(1) - B32(2) - B32(3) - B32(4),3块盘发生2块以上损毁的概率是:p^3。二者的曲线如下:
图片描述

阅读 2.3k
1 个回答
新手上路,请多包涵

计算一下吧,“32块盘发生4块损坏的概率远远大于3块盘发生2块损坏”:
C(4, 32)/ C(4, X) > C(2, 3)/ C(2, X)

logo
七牛云问答
子站问答
访问
宣传栏