主要观点:
- 认为“云”“物联网”“大数据”这三个流行词应从世界消失,它们虽试图概括复杂概念但都失败了,重点讨论“大数据”。
- “大数据”表面上与存储大量数据有关,但不仅仅如此,是收集、存储大量数据后应用大量计算能力和先进算法以发现趋势和关联。
- 计算机对大量数据的分析并不新鲜,“大数据”一词流行是近 10 到 15 年硬件和软件数据处理能力提升使整体分析大量数据成为可能。
- 大数据有四个重要方面:数据收集、数据存储、计算能力和软件。
关键信息:
- “云”无固定定义,“物联网”用词糟糕,“大数据”常指收集、存储大量数据后进行处理以发现趋势。
- 谷歌搜索是“大数据”的简单例子,通过索引快速搜索,曾用 MapReduce 框架,现在 Hadoop 框架被广泛使用。
- 大规模制造业可利用大数据追踪问题,如通用电气在慕尼黑的研究中心案例。
- T-Mobile 利用大数据分析客户取消模式,提前帮助高影响力客户以防止流失。
重要细节:
- 大数据通常指处理至少数百GB数据,大企业或科研机构处理的数据可达TB或PB级别。
- 数据存储可使用分布式文件系统、云存储或存储区域网络等。
- 软件如 Hadoop 是大数据的关键,合适算法能大幅提升数据处理效率。
- 谷歌数据中心是硬件方面“大数据”的体现,T-Mobile 案例展示了大数据在商业中的应用。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。