前言
- 本文是
黄佳
《零基础实战机器学习》的学习笔记
什么是机器学习?
- 传统程序是程序员来定义函数,而在机器学习中是机器训练出函数。
- 机器学习的厉害之处就在于,它能利用计算机的运算能力,从大量的数据中发现一个“函数”或“模型”,并通过它来模拟现实世界事物间的关系,从而实现预测、判断等目的。
实战步骤
机器学习实战有五大步:
1 定义问题
第一步是定义问题
在定义问题这个环节中,我们要剖析业务场景,设定清晰的目标, 同时还要明确当前问题属于哪一种机器学习类型。
机器学习分为四大类
监督学习 supervised learning: 训练数据集全部有标签 无监督学习 unsupervised learning: 训练数据集没有标签 半监督学习 semi-supervised learning: 部分数据有标签 强化学习 强化学习和监督学习的差异在于: 监督学习是从数据中学习,而强化学习是从环境给它的奖惩中学习。 强化学习对数学基础的要求是较高的,不太适合入门。
深度学习
是一种使用深层神经网络算法的机器学习模型,也就是一种算法。这个算法可以应用在监督学习、半监督学习和无监督学习里,也可以应用在强化学习中。监督学习能解决的两类问题:回归和分类。
回归问题的标签是连续数值。 分类问题的标签是离散性数值。
2 数据收集和预处理
- 第二步是数据的收集和预处理
六小步
收集数据; 数据可视化; 数据清洗; 特征工程(BMI 体质指数,降维,去除冗余特征) 构建特征集和标签集; 拆分训练集、验证集和测试集。
3 选择算法并建立模型
第三步是选择算法并建立模型
在这一步中,我们需要先根据特征和标签之间的关系,选出一个合适的算法, 并找到与之对应的合适的算法包, 然后通过调用这个算法包来建立模型。
4 训练模型
第四步是训练模型
训练模型就是用训练集中的特征变量和已知标签,根据当前样本的损失大小来逐渐拟合函数, 确定最优的内部参数,最后完成模型。 虽然看起来挺复杂,但这些步骤,我们都通过调用 fit 方法来完成。
5 模型的评估和优化
第五步是模型的评估和优化
在“模型的评估和优化”这一步中,当我们预测完测试集的浏览量后, 我们要再拿这个预测结果去和测试集已有的真值去比较, 这样才能够求出模型的性能。
本文出自 qbit snap
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。