航行 - 3 - 大型：新的最先进的通用嵌入模型

发布于 2025-01-09

主要观点：介绍了“voyage-3-large”这一先进的通用多语言嵌入模型，在 100 个数据集涵盖的 8 个评估领域中排名第一，超 OpenAI-v3-large 和 Cohere-v3-English 平均达 9.74%和 20.71%，通过 Matryoshka 学习和量化感知训练支持小维度及 int8 和二进制量化以降低向量数据库成本，还介绍了其精度和维度的灵活性及不同模型的评估细节、结果，包括整体和各领域的表现，以及二进制重评分的效果，“voyage-3-large”已可用且前 2 亿个 token 免费。
关键信息：

“voyage-3-large”在 8 个领域 100 个数据集表现优异，超其他模型。
支持多种维度和量化选项，减少存储成本。
评估涉及多种数据集和模型，用 NDCG@10 评估检索质量。
各领域具体表现及二进制重评分效果。
重要细节：
数据集涵盖技术、代码、法律、金融等 8 个领域及多种语言。
评估模型包括 OpenAI 等多种。
结果可在特定表格查看，“voyage-3-large”部分维度和存储成本下优势明显。
已可用且有免费 token 和相关学习资源。

阅读 24