数据挖掘
又称从数据中挖掘知识
、知识提取
、数据/模式分析
、数据考古和数据捕捞
1. 为什么进行数据挖掘?
日益增长的数据同其中能得到的知识量的矛盾。数据越来越多,就迫切需要从数据中提取信息的工具。简单讲就是从数据中挖掘知识
。
2. 什么是数据挖掘?
数据挖掘就是从数据中发现知识的过程。
知识发现过程由以下步骤的迭代序列组成:
- 1.
数据清理
(消除噪声和删除不一致数据) - 2.
数据集成
(多种数据源可以组合在一起) - 3.
数据选择
(从数据库中提取和分析任务相关的数据) - 4.
数据变换
(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式) - 5.
数据挖掘
(基本步骤,使用智能化方法提取数据模式) - 6.
模式评估
(根据某种兴趣度度量,识别代表知识的真正有趣的模式) - 7.
知识表示
(使用可视化和知识表示技术,向用户提供数据挖掘的知识)
广义的数据挖掘的观点:数据挖掘是从大量数据中挖掘有趣模式和知识的过程。
3. 可以挖掘什么类型的模式?
数据挖掘任务可以分为两类:
1.描述性
:描述性挖掘任务刻画目标数据中数据的一般性质
2.预测性
:预测性挖掘任务在当前数据上进行归纳,以便做出预测
4. 使用什么技术?
5. 数据挖掘的主要问题
- 挖掘方法
- 用户交互
- 有效性与伸缩性
- 数据类型的多样性
- 数据挖掘与社会
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。