3

数据挖掘又称从数据中挖掘知识知识提取数据/模式分析、数据考古和数据捕捞

1. 为什么进行数据挖掘?

日益增长的数据同其中能得到的知识量的矛盾。数据越来越多,就迫切需要从数据中提取信息的工具。简单讲就是从数据中挖掘知识

2. 什么是数据挖掘?

数据挖掘就是从数据中发现知识的过程。
知识发现过程由以下步骤的迭代序列组成:

  • 1.数据清理(消除噪声和删除不一致数据)
  • 2.数据集成(多种数据源可以组合在一起)
  • 3.数据选择(从数据库中提取和分析任务相关的数据)
  • 4.数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式)
  • 5.数据挖掘(基本步骤,使用智能化方法提取数据模式)
  • 6.模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式)
  • 7.知识表示(使用可视化和知识表示技术,向用户提供数据挖掘的知识)

广义的数据挖掘的观点:
数据挖掘是从大量数据中挖掘有趣模式和知识的过程。

3. 可以挖掘什么类型的模式?

数据挖掘任务可以分为两类:
1.描述性:描述性挖掘任务刻画目标数据中数据的一般性质
2.预测性:预测性挖掘任务在当前数据上进行归纳,以便做出预测

clipboard.png

4. 使用什么技术?

clipboard.png

5. 数据挖掘的主要问题

  • 挖掘方法
  • 用户交互
  • 有效性与伸缩性
  • 数据类型的多样性
  • 数据挖掘与社会

橙茗
26 声望5 粉丝

python c