DeepSeek版o1炸场,数学代码超越OpenAI,每天免费玩50次,后续将开源
2024-11-21
阅读 2 分钟
220DeepSeek版o1来了,发布即上线,现在就能玩!模型名为DeepSeek-R1-Lite,预览版在难度较高数学和代码任务上超越o1-preview,大幅领先GPT-4o等。据了解,DeepSeek-R1-Lite使用强化学习训练,推理含大量反思和验证,遵循新的Scaling Laws——推理越长,表现更强。如下展示,在AIME测试基准中,随着计算时间增加,其得分稳步...