RAG 领域的新宠:为什么 AI 圈都在谈论 Jina ColBERT?

2 月 27 日
阅读 3 分钟
212
在 RAG (检索增强生成)领域,选对向量模型至关重要,它基本就决定了 RAG 系统的“天花板”,也因此,向量模型的选择总是业界的热门讨论话题。
封面图

中英双语8K向量大模型新鲜出炉,企业出海必备!

1 月 18 日
阅读 3 分钟
164
自从我们的 Embeddings V2 获得各界好评后,今日,我们推出了全新的中英双语文本向量大模型:jina-embeddings-v2-base-zh。此模型不仅继承了 V2 的全部优势,能够处理长达八千词元的文本,更能流畅应对中英文双语内容,为跨语种的应用插上了翅膀。
封面图

用 PromptPerfect 搭建属于自己的西部世界!

2023-10-25
阅读 3 分钟
259
这种想象在《西部世界》的设定里得到了完美的还原:AI 机器人被投放到主题乐园,每个机器人都有自己的角色设定和情节,整个乐园就是一个完整的人类社会的复制品。
封面图

综合演示 :Embeddings 如何驱动人工智能

2023-10-20
阅读 4 分钟
205
💡 深入理解 EmbeddingEmbedding 是用来表示其他对象(无论是数字、物理还是抽象对象)的向量。这些对象的关键属性被转化为该向量的几何属性。
封面图

代码生成优化:微调Falcon40b

2023-09-25
阅读 4 分钟
504
Falcon40b是当前最大的开源大语言模型之一,且采用商业友好的Apache 2.0许可证。这使得对于希望将NLP产品推向市场的开发者来说,它具有相当大的吸引力。
封面图

超越规模的冒险之旅:引导人工智能价值对齐

2023-09-22
阅读 3 分钟
469
人们已经不再局限于人机对弈和AI识图,开始探索那些能够模仿人类思考的机器。无论是日常聊天、文本写作,还是在完美的提示词引导下创作出惊艳的诗歌,我们不得不承认AI工具已经不再仅仅是工具。它们与同事、伙伴无异。
封面图

用两成数据也能训练出十成功力的模型,Jina Embeddings 这么做

2023-09-14
阅读 3 分钟
384
句向量(Sentence Embeddings)模型在多模态人工智能领域起着至关重要的作用,它通过将句子编码为固定长度的向量表示,将语义信息转化为机器可以处理的形式,在 文本分类、信息检索和相似度计算 等多个方面有着广泛应用。
封面图

ChatGPT 如何应用于决策?Rationale 带你狂飙!

2023-02-09
阅读 3 分钟
709
ChatGPT 回答多领域问题的能力之强悍,引发了全球关注。许多人将 ChatGPT 视为对话式 AI 或生成式 AI 发展史上的一个重要里程碑。从 ChatGPT 本身的生产力来看,它可以帮助人们完成很多事,比如写项目申报书、写股票查询代码,甚至写一个坏 AI 征服世界的故事,但要想获得更理想、符合期望、或者说更加有针对性的结果,...

Top 5 OSSInsight 年度最佳 MLOps 开源工具

2023-02-08
阅读 10 分钟
485
MLOps,即机器学习的 DevOps。它能够帮助企业或组织更好地管理生产中的机器学习模型的复杂性,从而使机器学习项目更快速、更可靠地推广到市场。在本文中,我们将回顾 OSSInsight.io 2022 年列出的排名前 5 的最热门开源 MLOps 工具。

分享回顾|新岁序开,2023 和Jina AI共同码梦

2023-01-18
阅读 8 分钟
1.4k
在坚持开放协作精神、具备全球影响力的 Jina AI 开源社区,每天都有来自世界各地的开发者来到这里,因为技术产生联结,因为联结产生共创。一直以来,我们都为拥有这样一个全球化、多元化和高速发展的社区而感到自豪和感激!就在昨晚 20 点,Jina AI 社区举办了「Nice🐰Meet You·兔年迎新面对面」活动,联合了 8 位合作伙...

嘿,Jina 帮我画一幅高山流水图

2023-01-12
阅读 7 分钟
1.2k
本项目将 Whisper 与 Stable Diffusion 模型结合,可以直接完成语音生成图像的任务。用户可以语音输入一个短句,Whisper 会自动将语音转化为文本,接着,Stable Diffusion 会根据文本生成图像。本项目基于 Jina AI MLOps 平台搭建,通过使用 DocArray 跨越了不同数据类型之间的鸿沟,减少了应用的数据传输成本。同时使用...

嵌套数据搜索还能这么玩!

2022-09-14
阅读 2 分钟
596
向量数据库固然很好,它让我们可以根据相似性快速地检索向量。但向量数据库考虑的是向量,而我们要考虑的是数据,当数据很简单时,这两者几乎是等价的,每个向量代表一个数据点,而每个数据点都与一个向量相关。但是,现实世界的数据往往都是复杂的,多层级的,各式各样的...往往嵌套的数据结构才能更好地表达数据内容和...
封面图

轻松入门,30min 搭建一个「淘立拍」应用

2022-05-25
阅读 1 分钟
767
人人皆可「以图搜图」。淘立拍大家肯定都不陌生,用手机拍下喜欢的衣服,就可以搜到对应商品的链接。如果没有丰富的工程开发、AI 模型训练以及 DevOps 经验,个人开发者如何开发一个类似「淘立拍」的以图搜图的系统呢?现在,无需耗费大量人力,只需借助 Jina NOW,轻轻松松就可以创建一个以图搜图的系统了。了解更多 Ji...

分享回顾 | 基于深度学习的神经语义搜索

2022-04-07
阅读 9 分钟
1.4k
​ 本文内容主要分为以下四部分:​神经搜索的背景及优势一、什么是神经搜索?​神经搜索 (Neural Search) 由 Jina AI 首创,可以理解为 Deep Learning for Search 的简称,是指借助深度学习技术,使用非结构化数据,搜索非结构数据。神经搜索包括两个重要部分:信息搜索及深度学习技术。1、神经搜索之信息搜索提到搜索,最...

BERT-as-service 时隔三年突然更新,这次连名儿都改了

2022-03-30
阅读 6 分钟
1.7k
2018 年 9 月,Google 一篇 BERT 模型相关论文引爆全网:该自然语言模型,在机器阅读理解顶级水平测试 SQuAD1.1 中,连破 11 项 NLP 测试记录,两个衡量指标全面超越人类。
封面图

救救小王吧!如何快速搞定图像相似性检测问题?

2022-03-15
阅读 4 分钟
1.3k
相似性图像检测,是模型训练过程中常出现的问题,本文介绍了 4 个常用的哈希算法,并通过 Colab 代码,展示了完整的训练过程。新晋炼丹师小王最近遇到了一个难题,愁的头发掉了好几根儿。一问才知道,原来是他师傅给他分配了一个深度学习模型训练的任务,但是训练模型的图像数据集,略微有那么一丝丝复杂:里边除了已有...
封面图

今夜科技谈 | AlphaCode 会不会影响程序员的饭碗?

2022-03-02
阅读 2 分钟
1.3k
AlphaCode 是一个可以自主编程的系统,在 Codeforces 举办的编程竞赛中,超过了 47% 的人类工程师。 这标志着 AI 代码生成系统,首次在编程竞赛中,达到了具有竞争力的水平。
封面图

论文分享 | Yann LeCun 联合发布、工程师都在读的自监督学习论文

2022-02-21
阅读 4 分钟
1.4k
对于大型机器视觉训练任务而言,自监督学习 (Self-supervised learning,简称 SSL) 与有监督方法的效果越来越难分伯仲。
封面图