大模型时代来临,检索增强生成(RAG)从百度特色,逐渐发展成为了行业共识。然而,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。

针对上述问题,百度开发了检索增强的文生图技术iRAG(image based RAG)

iRAG 即 image based RAG,是大模型在图像领域的检索增强生成技术。它将百度搜索的亿级图片资源与强大的基础模型能力相结合,通过检索增强的方法,在生成图像时从外部海量图片资源中检索相关信息,并将其作为额外的上下文提供给生成模型,从而提高 AI 生成图像的真实性,有效解决传统图像生成中的 “幻觉” 问题,即生成错误或不准确的细节。“整体效果远远超过文生图原生系统,去除了机器味儿”。

百度搜索的亿级图片资源+强大的基础模型能力相结合=各种去掉AI味的超真实图片!

有了iRAG加持,天马行空的创意得以真实地落地实现,AI可以赋予企业无幻觉、超真实、没成本、立等可取的文生图。

文末还有使用攻略,一定要看到最后!

▌iRAG表现如何?我们先来看看!

你好,请帮我乾坤大挪移

生成一张福建土楼出现在现代都市里的图
在这里插入图片描述

生成一张北京白塔在江南小镇的图
在这里插入图片描述

Hello,我要打破次元壁
帮我画一张贝多芬吃蛋糕
在这里插入图片描述

帮我画一张蒙娜丽莎在公司甩臭脸的图
在这里插入图片描述

*以上图片均为iRAG测试生成
▌iRAG优势
1.解决图像生成幻觉问题
iRAG技术是一项创新解决方案,专门针对过往大模型在图像生成方面存在的幻觉问题。通过结合检索与增强的生成能力,iRAG能够显著提升图像生成内容的准确性和可靠性,有效减少不符合事实或逻辑错误的图像产生,从而突破多模态大模型规模化应用的限制。
2.依托百度搜索提高生图准确率
百度搜索收录了海量特定事物的可信图片资源,千帆大模型生成能力与百度“外挂知识库”相结合,iRAG可以做到在生成特定物品、特定人物以及特定人物与任意背景结合的图像时,提高生成图像的准确率。
▌企业应用场景
iRAG在广告拍摄、营销海报、商品展示、绘本生成、文旅海报、影视作品、漫画插图、连续画本等很多领域都有广泛的应用空间,可以有效降低AI生图的幻觉问题,让生成的图片更真实、自然,而且可以帮助用户大幅降低创作成本。比如在品牌宣传场景,以前拍一组汽车在某场景的大片宣传海报动辄需要一二十万,甚至大几十万,现在有了iRAG,创作的成本接近于0。
个人娱乐创作、b站/朋友圈封面、表情包生成、社区内容创作等C端的使用场景也可以在文小言上体验~
在这里插入图片描述

应用于文娱内容下的封面图生成、内容图生成等传统文生图场景
在这里插入图片描述

🛒应用于电商营销下穿搭图生成、商品展示、广告图片生成、营销海报生成等场景
在这里插入图片描述

📖应用教育行业下儿童绘本生成、课程材料生成等场景
在这里插入图片描述

更快、更好、更便宜,更多应用场景等你来开发~
⬇️⬇️
▌使用方式
1.基于千帆ModelBuilder平台直接调用iRAG-1.0接口,灵活开发自己的专属应用:https://qianfan.cloud.baidu.com/modelbuilder?track=cptg
在这里插入图片描述

2.基于千帆AppBuilder使用官方iRAG图片生成组件,快速构建具备图像生成能力的应用:https://console.bce.baidu.com/ai_apaas/componentCenter
在这里插入图片描述

欢迎大家前往百度智能云千帆使用!


百度智能云
1 声望1 粉丝

智能时代基础设施