10分钟聊聊火热的deepseek、ai时代

deepseek大火了，相信很多人连chatgpt还没搞懂，今天来简单聊聊。

deepseek、chatgpt都属于ai的产物，ai是什么？

ai全称artificial intelligence，人工智能，通常指用系统来呈现人类智能的技术。这里的智能包括学习、交流、推理、决策等，而这个系统，目前就是计算机程序。

人类通过看、读、背学习知识，机器要怎么学习呢？业界分为监督学习和无监督学习。
监督学习，就是先把准备好的数据标注好特征分类，然后输入给机器，让机器进行训练，训练完后，机器就能识别新的数据属于什么分类了。
无监督学习，就没有提前训练了，直接给定一些规则，让机器自行分类。

机器学习前期，还依赖人工提取特征、指定规则，发展非常缓慢，直到出现了深度学习这个分支。

深度学习，核心在神经网络。神经网络模拟的是人类大脑神经元的连接，构建了大量的神经元作为一张网络，让数据经过多层神经元的处理，完成各种复杂数据识别、处理任务。有了神经网络，ai处理的数据规模就突飞猛进了。
把海量的数据放到神经网络里深度学习，可以构建出一个个大模型。业界主要分成语言模型、图像模型、多模态模型。

类似GPT，就属于语言模型，通过学习语言的语法、语义等，具体理解和生成自然语言的能力。
类似Midjourney，用到的就是图像模型，通过海量的图像特征、风格等学习，完成图像创作、生成等任务。
类似deepseek的r1模型，就是多模态模型，可以同时理解和处理文本+图像信息。

不同的模型，输入相同的问题/任务，自然出来的结果也不一样。市场上产品的优劣，大多数讲的也就是底层模型的优劣了。

更详细的原理，例如Transformer、模型调优，距离相对遥远，普通人直接选择需要的产品上手就行。

10分钟聊聊火热的deepseek、ai时代

sre阿文

引用和评论

假如何小鹏是微信ceo，一天要花多少成本

从 DeepSeek 看25年前端的一个小趋势

大模型中的Token究竟是什么？从原理到作用深度解析

Open WebUI：开源AI交互平台的全面解析

一文掌握 MCP 上下文协议：从理论到实践

MySQL × 向量数据库：大模型时代的黄金组合实战指南

Mac 安装 DeepSeek-R1 本地化部署