双子座嵌入:来自双子座的可推广嵌入

主要观点:报告介绍了 Gemini Embedding 这一利用 Gemini 力量的先进嵌入模型,利用其多语言和代码理解能力为多种语言和文本模态生成高度可泛化的嵌入。其生成的表示可用于多种下游任务,在 Massive Multilingual Text Embedding Benchmark(MMTEB)上表现远超先前的先进模型,在多语言、英语和代码基准上均达先进水平,展示出跨多种任务的强大能力且超越了专业领域特定模型。
关键信息

  • 模型名称:Gemini Embedding
  • 利用模型:Google 的 Gemini
  • 下游任务:分类、相似性、聚类、排序、检索等
  • 评估基准:MMTEB(包含 250 多种语言的 100 多个任务)
    重要细节
  • 作者包括众多人员
  • 发表 venue 为 arXiv
阅读 9
0 条评论