关于“大数据”的重要之处——你对它实际上到底意味着什么的指南

主要观点:

  • 认为“云”“物联网”“大数据”这三个流行词应从世界消失,它们虽试图概括复杂概念但都失败了,重点讨论“大数据”。
  • “大数据”表面上与存储大量数据有关,但不仅仅如此,是收集、存储大量数据后应用大量计算能力和先进算法以发现趋势和关联。
  • 计算机对大量数据的分析并不新鲜,“大数据”一词流行是近 10 到 15 年硬件和软件数据处理能力提升使整体分析大量数据成为可能。
  • 大数据有四个重要方面:数据收集、数据存储、计算能力和软件。

关键信息:

  • “云”无固定定义,“物联网”用词糟糕,“大数据”常指收集、存储大量数据后进行处理以发现趋势。
  • 谷歌搜索是“大数据”的简单例子,通过索引快速搜索,曾用 MapReduce 框架,现在 Hadoop 框架被广泛使用。
  • 大规模制造业可利用大数据追踪问题,如通用电气在慕尼黑的研究中心案例。
  • T-Mobile 利用大数据分析客户取消模式,提前帮助高影响力客户以防止流失。

重要细节:

  • 大数据通常指处理至少数百GB数据,大企业或科研机构处理的数据可达TB或PB级别。
  • 数据存储可使用分布式文件系统、云存储或存储区域网络等。
  • 软件如 Hadoop 是大数据的关键,合适算法能大幅提升数据处理效率。
  • 谷歌数据中心是硬件方面“大数据”的体现,T-Mobile 案例展示了大数据在商业中的应用。
阅读 3
0 条评论