主要观点:Zed 致力于快速编辑体验,引入由 Zeta 驱动的编辑预测功能,可通过按下tab
应用预测编辑并节省时间。
关键信息:
- 编辑预测可在工作时预测下一次编辑,通过
tab
确认,多次按tab
可进行后续编辑。 - 引入 Zeta 开源编辑预测模型,源于 Qwen2.5-Coder-7B 且完全开源,可通过下载 Zed 试用。
- 解决编辑预测与现有
tab
使用及语言服务器建议的冲突,在不同系统上有不同操作。 - 介绍 Zeta 的开发过程,包括编辑重写、评估预测、提示工程、监督微调、直接偏好优化等方面。
- 解决延迟问题,通过投机解码减少生成令牌,利用 Baseten 优化模型服务,在多地部署 GPU 并使用 Cloudflare Workers 减少网络延迟。
重要细节: - 测试编辑预测时使用大型语言模型的输出差异问题,通过 Claude 评估和普通英语断言来验证。
- 提示工程中最初使用 Qwen2.5-Coder-32B 并不断调整,后采用监督微调结合 Unsloth 和 LoRA 及直接偏好优化。
- 投机解码利用输入作为参考并行生成令牌以减少延迟,Baseten 优化模型服务实现目标延迟,在多地部署 GPU 并使用 Cloudflare Workers 提升性能。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。