推理成本降98%,准确率升13%!微软提出TwT:Thinking without Tokens

北京

推理成本降98%,准确率升13%!微软提出TwT:Thinking without Tokens,旨在通过减少生成文字量和优化推理过程,降低大模型计算成本并提升性能。TwT通过多教师筛选优质答案和三步内化推理能力实现高效训练,在代码生成、常识问答和数学推理任务中显著提升准确率并减少token消耗。

关键点

  • TwT核心理念是让大模型“少想多干”,通过减少推理步骤直接输出答案。
  • 使用多教师筛选策略(DCRS),通过质量关和多样性关挑选优质答案,提升答案质量和多样性。
  • 采用三步内化推理能力(HaRD方法),逐步压缩推理步骤,最终训练出“秒答”能力。
  • 实验结果显示,TwT在多个任务中准确率提升13.6%,推理token数减少98%,响应速度显著加快。
  • TwT潜在意义包括降低企业部署成本、提升用户体验以及减少碳排放,但目前仅适用于特定任务,未来需拓展更多任务类型。
阅读 288
0 条评论