deepseek大火了,相信很多人连chatgpt还没搞懂,今天来简单聊聊。
deepseek、chatgpt都属于ai的产物,ai是什么?
ai全称artificial intelligence,人工智能,通常指用系统来呈现人类智能的技术。这里的智能包括学习、交流、推理、决策等,而这个系统,目前就是计算机程序。
人类通过看、读、背学习知识,机器要怎么学习呢?业界分为监督学习和无监督学习。
监督学习,就是先把准备好的数据标注好特征分类,然后输入给机器,让机器进行训练,训练完后,机器就能识别新的数据属于什么分类了。
无监督学习,就没有提前训练了,直接给定一些规则,让机器自行分类。
机器学习前期,还依赖人工提取特征、指定规则,发展非常缓慢,直到出现了深度学习这个分支。
深度学习,核心在神经网络。神经网络模拟的是人类大脑神经元的连接,构建了大量的神经元作为一张网络,让数据经过多层神经元的处理,完成各种复杂数据识别、处理任务。有了神经网络,ai处理的数据规模就突飞猛进了。
把海量的数据放到神经网络里深度学习,可以构建出一个个大模型。业界主要分成语言模型、图像模型、多模态模型。
类似GPT,就属于语言模型,通过学习语言的语法、语义等,具体理解和生成自然语言的能力。
类似Midjourney,用到的就是图像模型,通过海量的图像特征、风格等学习,完成图像创作、生成等任务。
类似deepseek的r1模型,就是多模态模型,可以同时理解和处理文本+图像信息。
不同的模型,输入相同的问题/任务,自然出来的结果也不一样。市场上产品的优劣,大多数讲的也就是底层模型的优劣了。
更详细的原理,例如Transformer、模型调优,距离相对遥远,普通人直接选择需要的产品上手就行。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。