• Babble源自Jacob Jackson的TabNine(2018年)。
• 采用编辑序列训练,超越传统“填充中间”方法。
• Babble拥有1M上下文窗口,2024年达到300k,延迟250ms。
• Jacob Jackson创办Supermaven(2022年),推出Babble。
• Babble是市场上最强的Tab补全模型。
• Cursor收购Babble,提升Tab补全能力,获得数据优势。
• 当前风险:新兴工具(如Cline)可能改变开发流程。
作者:Jos van der Westhuizen
2025年5月5日
在构建Unity Tab补全功能时,我深入研究了现有的解决方案及其历史。这引出了Cursor收购Babble的故事,Babble是今天最强的标签补全模型。它源自Jacob Jackson的TabNine,通过使用编辑序列进行训练,完全超越了传统的“填充中间”方法。凭借1M的上下文窗口,Babble在速度和覆盖范围上远超竞争对手。Cursor收购Babble,不仅提升了自身产品,也获得了重要的数据优势,处于AI编程助手的前沿。
为了构建我们的Unity Tab补全,我深入了解了当前的Tab补全解决方案,它们是如何工作的,如何训练的。这个故事讲述了Cursor如何收购市场上最强的标签补全解决方案。
故事要从2018年说起,那时LLM(大语言模型)还不普及。Jacob Jackson创建了TabNine,这是最早的代码补全工具之一。四年后,OpenAI发布了ChatGPT的早期演示(2022年11月30日),这标志着LLM的觉醒。Jackson于2019年毕业于滑铁卢大学,在学习期间,他曾在Jane Street、Hudson River Trading和OpenAI实习,并同时启动了TabNine。他通过在Jane Street让UI创建更简单,提前进入了开发工具领域。
2019年11月,Codota收购了TabNine,Jackson转职到OpenAI,担任研究科学家,工作了2年半。2022年,他离开OpenAI,创办了Supermaven,直接与Cursor竞争。尽管Supermaven没有Cursor受欢迎,但他们的Tab补全模型Babble却是市场上最好的。2024年2月,当ChatGPT的上下文窗口为32k时,Babble已经有了300k的上下文窗口,延迟为250ms。与此相比,当时Cursor的模型延迟为1883ms!
Supermaven被收购前,Babble的上下文窗口已达到1M,这非常惊人,因为流行的聊天模型(更慢的)上下文窗口仍然停留在128k。
Babble的与众不同之处在于它的训练方式。大多数提供商使用“填充中间”(FIM)方法来训练自动补全模型,但这种方法的局限性很大,因为补全建议总是从光标当前位置向下填充。但如果你想跳到文件顶部导入一个新包呢?如果你想跳到另一个文件呢?
Babble采用编辑序列而不是代码行进行训练,类似于git diff。Cursor拥有整个编辑器,可以访问开发者在项目中发起、接受和拒绝的所有更改,这使他们在训练最强Tab补全模型上占据了有利位置。
但Cursor当时并没有最强的模型,同时,Cursor的创始人与Jacob早已有过交流,他们在Supermaven成立之前就认识。Jacob在插件的局限下计划制作自己的IDE,而Cursor团队则可能正在努力赶超Tab补全技术,最终促成了这次收购。
这就是Cursor如何获得市场上最强Tab补全模型的故事。凭借庞大的客户群,Cursor现在拥有巨大的数据优势,保持模型的领先地位。目前的主要风险是,像Cline这样的新兴工具可能会彻底改变代码协同工作流程。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。