机器学习第三讲:监督学习 → 带答案的学习册,如预测房价时需要历史价格数据
资料取自《零基础学机器学习》。
查看总目录:学习大纲
关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南
一、理解核心比喻:练习册与参考答案 📚
教材中的经典比喻1:
监督学习就像学生使用「题目+答案」的练习册:
- 学习阶段:对着题目做练习 → 对照答案改错 → 找到解题思路
- 考试阶段:面对新题时能用学到的思路解答
映射到监督学习:
二、房价预测全流程拆解 🏠(教材第三章典型案例2)
通过房屋特征预测售价的完整过程:
关键技术点:
- 特征工程(Feature Engineering)
将原始数据转化为可理解的指标(如将地址转化为"距地铁站距离") - 损失函数(Loss Function)
相当于错题本,计算预测价与实际价的差距(例如预测310万实际300万 → 记10万误差) - 梯度下降(Gradient Descent)
像学生调整解题方法,逐步减少错误(每次调整让预测误差更小)
三、深入理解训练过程 🔄
以学生数学备考类比(教材第三章训练流程解析3):
运行逻辑对比:
学生备考 | 机器学习模型训练 |
---|---|
每道题有标准答案 | 每个数据样本都有标签 |
错题重点复习 | 损失函数提示误差方向 |
定期模拟考 | 验证集测试泛化能力 |
四、实战应用与限制 🚧
经典应用场景
- 医疗诊断(输入症状 → 输出疾病类型)
- 股票预测(输入行情数据 → 输出明日涨跌概率)
关键限制(教材第三章注意事项4)
- 数据依赖性:新开发的市中心楼盘若历史数据不足,预测可能失准
- 冷启动问题:没有过往成交记录的区域需要其他方法补充
- 过拟合风险:像学生死记硬背习题答案,遇到变形题就出错
五、算法选择策略 ⚖️
针对不同问题规模选择工具(教材第三章方法选型指南5):
六、一句话总结监督学习本质 💎
监督学习就是让计算机通过观察大量「题目+标准答案」,自己总结出从问题到答案的解决规律,并在遇到新问题时应用这个规律做出预测(教材第三章核心定义1)
目录:总目录
上篇文章:机器学习第二讲:对比传统编程:解决复杂规则场景
- 《零基础学机器学习》第三章第一节:"监督学习基础概念",P.89 ↩
- 《零基础学机器学习》第三章案例3-2:"房价预测实战",P.102-105 ↩
- 《零基础学机器学习》第三章第四节:"训练过程解析",P.116-118 ↩
- 《零基础学机器学习》第三章注意事项:"监督学习的局限性",P.135 ↩
- 《零基础学机器学习》第三章方法选择矩阵,P.127 ↩
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。