搜索准确性提升 20%,Jina Reranker 成为 RAG 优化的新标杆!

3 月 5 日
阅读 3 分钟
165
在整合大型语言模型(LLM)到业务流程时,企业经常会遇到一些头疼的问题,比如怎样保持数据时效性、避免幻觉现象,以及如何保护数据安全等等。为了解决这些问题,检索增强生成(RAG)技术应运而生,它不仅帮助我们克服了这些挑战,还引领了信息检索的新方向。虽然 RAG 系统及其科普非常流行,但在实际使用中,我们会发现...

RAG 领域的新宠:为什么 AI 圈都在谈论 Jina ColBERT?

2 月 27 日
阅读 3 分钟
224
在 RAG (检索增强生成)领域,选对向量模型至关重要,它基本就决定了 RAG 系统的“天花板”,也因此,向量模型的选择总是业界的热门讨论话题。
封面图

Jina AI 发布中英和英德双语 8K 向量模型,即刻开源!

1 月 29 日
阅读 3 分钟
169
作为多模态人工智能技术领域的翘楚,Jina AI 的使命是通过创新的向量大模型和提示词技术,铺平通往多模态 AI 的未来之路。我们正在积极扩展多语言产品线,以满足更广泛的客户需求。

中英双语8K向量大模型新鲜出炉,企业出海必备!

1 月 18 日
阅读 3 分钟
172
自从我们的 Embeddings V2 获得各界好评后,今日,我们推出了全新的中英双语文本向量大模型:jina-embeddings-v2-base-zh。此模型不仅继承了 V2 的全部优势,能够处理长达八千词元的文本,更能流畅应对中英文双语内容,为跨语种的应用插上了翅膀。
封面图

一张地毯,能讲出怎样的产品故事?

2023-12-28
阅读 4 分钟
63
AKIA 地毯工坊是一家集当代艺术与设计织造相融的地毯品牌商,历经 15 年发展,已在高端地毯行业站立脚跟。作为产品经理,Kevin 一直以来对地毯有着深厚的感情。他认为地毯不仅是家居装饰品,更是艺术品。它承载着设计师的创意和匠心,也传递着品牌的故事和情感。
封面图

来自开发者的点赞,Jina AI 入选 2023 中国技术品牌影响力企业榜

2023-12-26
阅读 1 分钟
97
2023 年 12 月 26 日,中国技术先锋年度评选 | 2023 中国技术品牌影响力企业榜单正式发布。作为中国领先的新一代开发者社区,SegmentFault 思否依托数百万开发者用户数据分析,各科技企业在国内技术领域的行为及影响力指标,最终评选出 30 家上榜企业。
封面图

EMNLP 2023 亮点回顾:大模型时代下的 NLP 研究

2023-12-20
阅读 8 分钟
209
作为自然语言处理(NLP)领域的顶级盛会,EMNLP 每年都成为全球研究者的关注焦点。2023 年的会议在新加坡举行,聚集了数千名来自世界各地的专家学者,也是自疫情解禁以来,中国学者参会最多的一次。巧的是,EMNLP 似乎总在召开时迎来业界大新闻。去年此时,ChatGPT 的发布引发学术大地震,颠覆了传统 NLP 的研究格局;今...
封面图

用 PromptPerfect 搭建属于自己的西部世界!

2023-10-25
阅读 3 分钟
262
这种想象在《西部世界》的设定里得到了完美的还原:AI 机器人被投放到主题乐园,每个机器人都有自己的角色设定和情节,整个乐园就是一个完整的人类社会的复制品。
封面图

综合演示 :Embeddings 如何驱动人工智能

2023-10-20
阅读 4 分钟
209
💡 深入理解 EmbeddingEmbedding 是用来表示其他对象(无论是数字、物理还是抽象对象)的向量。这些对象的关键属性被转化为该向量的几何属性。
封面图

DocArray 近期更新

2023-10-11
阅读 2 分钟
209
支持 Pydantic v2 🚀 (#1652)此版本最重要的功能是对 Pydantic v2 的全面支持!同时我们将继续支持 Pydantic v1。如果您使用 Pydantic v2,您需要调整您的 DocArray 代码以适配新的 Pydantic API。请查看他们的 迁移指南。Pydantic v2 的核心部分采用 Rust 编写,并为 DocArray 提供了显著的性能改进:JSON 序列化速度提...

Jina 近期更新

2023-10-11
阅读 5 分钟
182
优化动态批处理处理方式 (#6066)为了改善系统的性能,我们优化了动态批处理的行为,确保不会把超过 preferred_batch_size 的文档发送给 Executor。这样一来,客户端也将能够更快地收到他们的请求的响应,不需要等待其他请求的处理完成。这样有助于降低系统的平均延迟,提高用户体验。

代码生成优化:微调Falcon40b

2023-09-25
阅读 4 分钟
507
Falcon40b是当前最大的开源大语言模型之一,且采用商业友好的Apache 2.0许可证。这使得对于希望将NLP产品推向市场的开发者来说,它具有相当大的吸引力。
封面图

微调GPT-3.5 Turbo是空中楼阁吗?

2023-09-22
阅读 2 分钟
415
这一进展引人注目,它为利用这个强大的AI工具提供了普适性,可以为用户量身定制调试。正如在突破性创新中常会出现的那样,仔细观察可能会带来更加细致入微的理解。
封面图

超越规模的冒险之旅:引导人工智能价值对齐

2023-09-22
阅读 3 分钟
472
人们已经不再局限于人机对弈和AI识图,开始探索那些能够模仿人类思考的机器。无论是日常聊天、文本写作,还是在完美的提示词引导下创作出惊艳的诗歌,我们不得不承认AI工具已经不再仅仅是工具。它们与同事、伙伴无异。
封面图

用两成数据也能训练出十成功力的模型,Jina Embeddings 这么做

2023-09-14
阅读 3 分钟
386
句向量(Sentence Embeddings)模型在多模态人工智能领域起着至关重要的作用,它通过将句子编码为固定长度的向量表示,将语义信息转化为机器可以处理的形式,在 文本分类、信息检索和相似度计算 等多个方面有着广泛应用。
封面图

Jina AI 受邀出席 WAIC 2023「科技无障碍」论坛,与行业专家共话 AI 普惠未来

2023-07-10
阅读 4 分钟
837
7 月 6 日,2023 世界人工智能大会(WAIC)在上海世博中心及世博展览馆开幕,并在浦东张江、徐汇西岸设分会场,同步在闵行等产业集聚区开展同期活动。本届大会由上海市人民政府和国家发改委、工信部、科技部、国家网信办、中国科学院、中国工程院、中国科协等七个部门共同主办,以“智联世界,生成未来”为主题,聚焦科学...

多模态超省钱!JinaChat 面向开发者的大模型服务

2023-06-28
阅读 4 分钟
568
2023年6月25日 Jina AI 发布了 JinaChat,一个面向开发者和终端用户的多模态大模型API。传统大型语言模型往往将竞争力建立在「参数多」和「刷分强」的基础上,然而对于应用开发者来说,传统模型商的 API 并不能很好地让开发者低成本的实现解决方案。结果就产生了AIGC时代的悖论:人人都是开发者,结果开发者一分钱没赚到...

AI 运营,是替代还是协作?

2023-06-13
阅读 2 分钟
790
今天让我们来聊点不一样的 🚨,聊聊 AI 在运营这一块,到底是要帮咱们忙,还是抢咱们的饭碗呢。现在的 AI 像个刚刚踏入社会的孩子,虽然常常会让人眼前一亮,却又充满不确定性。那么你说,这孩子会推翻一切,自个儿独挑大梁,把运营赶出厨房呢?还是它会和我们搭把手,咱们一起做出更好吃的大餐呢?让我们一起探讨一下,...
封面图

一张图就是一个故事,用 SceneXplain 讲个好故事

2023-04-13
阅读 6 分钟
939
精准的图像描述不仅可以让人们更容易理解图像背后的故事和信息,还可以让图像更易于被检索和识别。然而,对于那些复杂的图像来说,写出既准确又详细的描述实在是件非常困难的事情。
封面图

Finetuner 0.7.1版本发布!支持在之前模型基础上继续微调,新增SphereFace损失函数!

2023-02-22
阅读 3 分钟
763
Finetuner[1] 是一个基于云端的神经搜索结果调优平台。Finetuner 简化了工作流程,处理了云端的复杂性和基础设施要求,使得神经网络的微调变得更容易,更快速,更高效。有了 Finetuner,你可以很容易地提高预训练模型的性能,并且无需大量标签或昂贵的硬件即可投入生产。

DocArray 0.21.0版本发布!新增OpenSearch后端存储,支持Redis后端存储的多语言文本搜索!

2023-02-17
阅读 3 分钟
771
DocArray 是一个用于处理、传输和存储多模态数据的 Python 工具包。DocArray 提供便捷的多模态数据处理功能,具备基于 Protobuf 提供高性能的网络传输性能,同时也为多种向量存储方案提供统一的 API 接口。

实践指南|如何在 Jina 中使用 OpenTelemetry 进行应用程序的监控和跟踪

2023-02-15
阅读 7 分钟
673
随着软件和云技术的普及,越来越多的企业开始采用微服务架构、容器化、多云部署和持续部署模式,这增加了因系统失败而给运维/ SRE / DevOps团队带来的压力,从而增加了开发团队和他们之间的摩擦,因为开发团队总是想尽快部署新功能并启动新的A/B测试。在云时代,CI/CD 模式发展迅速,它能帮助研发团队快速改进、修复系统...

ChatGPT 如何应用于决策?Rationale 带你狂飙!

2023-02-09
阅读 3 分钟
720
ChatGPT 回答多领域问题的能力之强悍,引发了全球关注。许多人将 ChatGPT 视为对话式 AI 或生成式 AI 发展史上的一个重要里程碑。从 ChatGPT 本身的生产力来看,它可以帮助人们完成很多事,比如写项目申报书、写股票查询代码,甚至写一个坏 AI 征服世界的故事,但要想获得更理想、符合期望、或者说更加有针对性的结果,...

Top 5 OSSInsight 年度最佳 MLOps 开源工具

2023-02-08
阅读 10 分钟
489
MLOps,即机器学习的 DevOps。它能够帮助企业或组织更好地管理生产中的机器学习模型的复杂性,从而使机器学习项目更快速、更可靠地推广到市场。在本文中,我们将回顾 OSSInsight.io 2022 年列出的排名前 5 的最热门开源 MLOps 工具。

多模态搜索的未来:超越关键字和向量的混合搜索!

2023-02-08
阅读 9 分钟
865
二十年前,“混合”一词仅在植物学和化学领域使用。如今,“混合”这个概念在搜索领域一片繁荣,许多搜索系统都在推出基于 AI 技术的混合搜索方案。但是,“混合搜索”是真的具有应用价值,还只是流行的一阵风呢?

分享回顾|新岁序开,2023 和Jina AI共同码梦

2023-01-18
阅读 8 分钟
1.4k
在坚持开放协作精神、具备全球影响力的 Jina AI 开源社区,每天都有来自世界各地的开发者来到这里,因为技术产生联结,因为联结产生共创。一直以来,我们都为拥有这样一个全球化、多元化和高速发展的社区而感到自豪和感激!就在昨晚 20 点,Jina AI 社区举办了「Nice🐰Meet You·兔年迎新面对面」活动,联合了 8 位合作伙...

嘿,Jina 帮我画一幅高山流水图

2023-01-12
阅读 7 分钟
1.2k
本项目将 Whisper 与 Stable Diffusion 模型结合,可以直接完成语音生成图像的任务。用户可以语音输入一个短句,Whisper 会自动将语音转化为文本,接着,Stable Diffusion 会根据文本生成图像。本项目基于 Jina AI MLOps 平台搭建,通过使用 DocArray 跨越了不同数据类型之间的鸿沟,减少了应用的数据传输成本。同时使用...

SE0 已死, LLMO 万岁

2023-01-11
阅读 6 分钟
799
“北风那个吹,雪花那个飘”,我手捧一杯咖啡,听着白毛女。朋友坐在对面高谈阔论:“有了 ChatGPT,我再也不缺内容了,SEO 的春天就要来了!”然而他没有看到真相是 —— ChatGPT 直接颠覆了 SEO 行业,能直接为用户生成答案的 ChatGPT 可能很快就会取代谷歌成为下一代搜索引擎,再也没有什么提高网页排名,SEO 也将变得毫无...
封面图

模型微调,低预算,高期望!

2023-01-10
阅读 4 分钟
1.2k
作为迁移学习中的常用技术,Fine-tuning(微调)已经成为了深度学习革命的重要部分。微调不需要针对新任务从头开始学习,只需要加载预训练模型的参数,然后利用新任务的数据进行一步训练模型即可。也可以说微调是对开放域任务的预训练模型进行训练,从而适应特定域任务。与从零开始训练网络相比,微调是一种低成本,高收...
封面图

DocArray 和 Redis 联手,让推荐系统飞起来

2022-12-13
阅读 7 分钟
1.1k
在DocArray中使用Redis后端,基于向量相似性搜索可以快速搭建一个实时商品推荐系统。现在,跟上我们的脚步,一起了解搭建系统的关键步骤,并且深入了解推荐的原理吧!
封面图