Nvidia股价大跌与DeepSeek的崛起
周一,Nvidia股价下跌了17%,主要原因是对中国AI公司DeepSeek的担忧。DeepSeek的R1推理模型上周挑战了美国在AI领域的领先地位,其低成本且免费提供的AI模型震惊了行业观察者。此外,DeepSeek的AI助手应用在周末迅速攀升至iPhone App Store“免费应用”类别的榜首,超过了ChatGPT。
DeepSeek的重大意义
1月20日左右,中国AI初创公司DeepSeek宣布推出R1模拟推理模型,声称其推理基准测试可以与OpenAI的o1模型相媲美。R1模型通过模拟思维链过程来提供答案,这可能会提高AI模型在某些类型问题上的准确性或实用性。
尽管其他AI公司如Google也在紧追OpenAI推出自己的模拟推理模型,但DeepSeek R1的三个特点让专家们感到震惊:
- 低成本训练:DeepSeek仅花费了600万美元训练R1模型,约为训练o1模型成本的3%。
- 快速推出:R1模型在OpenAI宣布o1模型仅四个月后便推出。
- 开源发布:DeepSeek以MIT许可证免费发布了模型权重,任何人都可以下载、运行和微调该模型。
风险投资家Marc Andreessen在X上表示,DeepSeek R1是“我见过的最令人惊叹和印象深刻的突破之一”,并称其为“对世界的深刻礼物”。
DeepSeek应用的成功与争议
DeepSeek的应用在周末迅速攀升至美国iPhone App Store的榜首,允许用户免费试用R1模型和V3传统大语言模型(LLM)。然而,一些Reddit用户指责有人在中国进行“Astroturfing”(假装普通用户发帖以支持某事物),尽管这些指控目前尚无根据。
专家观点:开源模型的崛起
Meta首席AI科学家Yann LeCun在LinkedIn上表示,不应将DeepSeek的成功视为“中国超越美国在AI领域的领先地位”,而应理解为“开源模型正在超越专有模型”。他强调,DeepSeek从开源研究和开源工具(如Meta的PyTorch和Llama)中受益,并在此基础上提出了新的想法。
DeepSeek R1的实际表现
DeepSeek声称R1模型在AI基准测试中与OpenAI的o1模型相当,但基准测试容易被操纵,不一定能反映模型在日常场景中的实际表现。初步测试显示,DeepSeek-V3和DeepSeek-R1与OpenAI的ChatGPT模型大致相当,但具体表现可能因使用和提示方式而异。
对闭源AI公司的威胁
低成本训练的开源AI模型能够与美国最好的商业模型相媲美,这对闭源AI公司构成了真正的威胁。然而,对于一直在关注AI快速进展的人来说,这并不意外。信息技术的历史表明,技术会变得越来越便宜和小型化,最终成为更大产品的组成部分。
总结
DeepSeek的崛起不仅对Nvidia等公司造成了市场冲击,也引发了关于开源模型与专有模型之间竞争的广泛讨论。尽管一些人将这一事件视为中美科技竞争的一部分,但更多专家认为,这标志着开源模型在AI领域的崛起。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。