前言

什么是机器学习?

  • 传统程序是程序员来定义函数,而在机器学习中是机器训练出函数。
  • 机器学习的厉害之处就在于,它能利用计算机的运算能力,从大量的数据中发现一个“函数”或“模型”,并通过它来模拟现实世界事物间的关系,从而实现预测、判断等目的。

实战步骤

机器学习实战有五大步:
机器学习五步走

1 定义问题

  • 第一步是定义问题

    在定义问题这个环节中,我们要剖析业务场景,设定清晰的目标,
    同时还要明确当前问题属于哪一种机器学习类型。
  • 机器学习分为四大类

    监督学习 supervised learning: 训练数据集全部有标签
    无监督学习 unsupervised learning: 训练数据集没有标签
    半监督学习 semi-supervised learning: 部分数据有标签
    强化学习 强化学习和监督学习的差异在于:
         监督学习是从数据中学习,而强化学习是从环境给它的奖惩中学习。
         强化学习对数学基础的要求是较高的,不太适合入门。

    image.png

  • 深度学习是一种使用深层神经网络算法的机器学习模型,也就是一种算法。这个算法可以应用在监督学习、半监督学习和无监督学习里,也可以应用在强化学习中。
  • 监督学习能解决的两类问题:回归和分类。

    回归问题的标签是连续数值。
    分类问题的标签是离散性数值。

2 数据收集和预处理

  • 第二步是数据的收集和预处理
  • 六小步

    收集数据;
    数据可视化;
    数据清洗;
    特征工程(BMI 体质指数,降维,去除冗余特征)
    构建特征集和标签集;
    拆分训练集、验证集和测试集。

    image.png

3 选择算法并建立模型

  • 第三步是选择算法并建立模型

    在这一步中,我们需要先根据特征和标签之间的关系,选出一个合适的算法,
    并找到与之对应的合适的算法包,
    然后通过调用这个算法包来建立模型。

4 训练模型

  • 第四步是训练模型

    训练模型就是用训练集中的特征变量和已知标签,根据当前样本的损失大小来逐渐拟合函数,
    确定最优的内部参数,最后完成模型。
    虽然看起来挺复杂,但这些步骤,我们都通过调用 fit 方法来完成。

5 模型的评估和优化

  • 第五步是模型的评估和优化

    在“模型的评估和优化”这一步中,当我们预测完测试集的浏览量后,
    我们要再拿这个预测结果去和测试集已有的真值去比较,
    这样才能够求出模型的性能。
本文出自 qbit snap

qbit
268 声望279 粉丝