机器学习导图系列(1):数据处理

机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫。我又将导图整理成了知识卡片,方便大家查看。由于机器学习的知识网络很大,导致完整的导图过大,文章中的图片可能经过压缩,如需完整图片可查看github项目machine-learning-mindmap-cn下载高清原图。本系列还在持续创作中,你的点赞、留言、star都会成为我持续创作的动力。

Daniel Formoso: https://github.com/dformoso/m...
machine-learning-mindmap-cn: https://github.com/caiyongji/...

机器学习导图系列分为五大模块。

  1. 机器学习数据处理
  2. 机器学习概念
  3. 机器学习过程
  4. 机器学习算法
  5. 机器学习模型及神经网络模型

图片描述

数据类型

图片描述

数据探索

图片描述

数据清洗

图片描述

特征插补

图片描述

特征工程

图片描述

特征选择

图片描述

特征编码

图片描述

特征归一化(Normalisation)或缩放(Scaling)

图片描述

构造数据集

图片描述

最后

你随手就是一个赞。

阅读 506更新于 4月7日
推荐阅读
caiyongji
用户专栏

caiyongji

30 人关注
23 篇文章
专栏主页
目录