准备针对这些技术亮点学习对应的知识点,目前只学习过其中一个亮点,就是这篇论文:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning https://arxiv.org/pdf/2501.12948
准备针对这些技术亮点学习对应的知识点,目前只学习过其中一个亮点,就是这篇论文:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning https://arxiv.org/pdf/2501.12948
1 回答1k 阅读
2 回答579 阅读
525 阅读
488 阅读
481 阅读
1 回答253 阅读
2 回答579 阅读
481 阅读
488 阅读
542 阅读
1 回答253 阅读