航行 - 3 - 大型:新的最先进的通用嵌入模型

主要观点:介绍了“voyage-3-large”这一先进的通用多语言嵌入模型,在 100 个数据集涵盖的 8 个评估领域中排名第一,超 OpenAI-v3-large 和 Cohere-v3-English 平均达 9.74%和 20.71%,通过 Matryoshka 学习和量化感知训练支持小维度及 int8 和二进制量化以降低向量数据库成本,还介绍了其精度和维度的灵活性及不同模型的评估细节、结果,包括整体和各领域的表现,以及二进制重评分的效果,“voyage-3-large”已可用且前 2 亿个 token 免费。
关键信息:

  • “voyage-3-large”在 8 个领域 100 个数据集表现优异,超其他模型。
  • 支持多种维度和量化选项,减少存储成本。
  • 评估涉及多种数据集和模型,用 NDCG@10 评估检索质量。
  • 各领域具体表现及二进制重评分效果。
    重要细节:
  • 数据集涵盖技术、代码、法律、金融等 8 个领域及多种语言。
  • 评估模型包括 OpenAI 等多种。
  • 结果可在特定表格查看,“voyage-3-large”部分维度和存储成本下优势明显。
  • 已可用且有免费 token 和相关学习资源。
阅读 8
0 条评论