——已获知乎作者【GitHub Daily】授权转载

目前大模型的强大能力,使其成为一些企业和行业的主要创新驱动力,企业亟需重新审视和调整现有的创新机制,以适应AI技术和大数据的快速发展。目前很多企业已经开始尝试大模型在业务中进行赋能,但在使用一些大模型时往往因为自身场景的需求不同,导致在应用落地中存在一些场景受限,知识库不完善等一些痛点。

阿里云AI搜索,凭借先进的大模型能力和强大的 RAG 处理技术,为企业提供全场景、高智能、低门槛的搜索服务解决方案,不管是金融还是电商,不管是教育还是医疗,都可以根据自身行业的一些需求进行定制化的服务。从而更高效构建适合自身企业的大模型应用,实现业务智能化升级。

一.阿里云 AI 搜索开放平台介绍

尽管 AI 搜索在效果上取得了显著进步,但是在某些垂直领域的应用还是存在一些不足,尤其在对知识准确性要求极高的业务场景中更为突出。此外,高成本和隐私安全可控性低也是实施过程中面临的重要挑战。

为应对这些问题,阿里云 Elasticsearch 推出了创新的 AI 搜索方案,使用 RAG 技术对检索增强生成的各个环节进行能力增强,并深度融合了企业版 AI Assistant,将 RAG 技术应用于 AI搜索领域。

1.1什么是 RAG 技术?

简单来说,RAG 技术是通过先从海量数据中精准检索相关信息,再将这些信息与用户查询融合,最后利用生成模型基于增强后的上下文生成准确回答,从而提升语言模型在特定任务中的表现,确保信息的实时性和准确性,广泛应用于智能客服、知识管理等领域。

1.2 阿里云 RAG 有何不同

1.2.1 Elasticsearch 向量性能5倍提升

Elasticsearch是利用硬件加速技术在文本向量检索领域,尤其是处理复杂相似度计算任务时,提高计算性能的一种工具。它的运用旨在将复杂的相似度计算简单化。从最初的利用高维向量计算到后面利用 knn 来进行过滤,到查询纬度增至2028,文本计算和搜索性能都在有效的提升,但随着企业不同的需求,文本数据的日益增长,对于性能的要求也越来越高。

Elasticsearch 通过向量量化技术,将 float32 位量化为 int8,所需内存仅为原先需求的四分之一,并利用诸如稀疏编码技术,能够基于原始词汇建立索引,有效扩展至与其相关的概念或词汇,每项扩展均附有模型计算出的权重,增强了语义理解的深度和广度。

1.2.2 RAG 模块组件化

RAG(检索增强生成)是大模型应用的重要方向,它需要在生成回答之前,通过之前收集的知识库进行整合匹配,结合上下文的提示,使生成的回答结果准确。

因此 RAG 需要一套完成的流程进行知识库的构建。

我们通过上面的框架可以看到,一套完善的 RAG 流程需要很多的模块,从数据的处理,搜索引擎,再到大模型的生成,这对于普通的开发者和企业来说是很困难的。

阿里云AI搜索针对这些环节,通过将服务以组件化的方式进行开放,使不同的企业和垂直场景可以灵活的进行使用。它涵盖了数据层,引擎层,搜索层到应用层的全链路能力。

1.2.3 强大的大模型技术

为了满足用户对更高效、更智能搜索功能的需求,阿里云 AI 搜索开放平台新增加 QwQ 模型,这一全新模型的加入将为企业和开发者带来更强大的搜索解决方案。

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到 DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。

如何体验其强大的搜索能力,只需两步:

  • 登录并开通 阿里云 OpenSearch-AI 搜索开放平台;

  • 选择 qwq 模型,同时可输出深度思考内容。

二、AI 搜索技术赋能企业智能化

再好的技术也需要经过实践才能证明其强大之处,阿里云AI搜索技术为企业提供了高效、智能的信息获取解决方案。其定制化的搜索结果和智能化服务,极大地提升了企业的工作效率和决策质量,助力企业实现智能化转型。

2.1 搜索引擎让电商搜索更准确

以电商板块为例,如果一个电商平台面临海量商品信息和用户查询需求时,传统的搜索方式就难以满足其快速、精准的检索需求。

但无论对于平台方还是电商卖家(B端企业),都可以通过引入阿里云AI搜索来提升自己店铺商品的搜索准确率和曝光率。

以下是通过阿里云AI搜索针对电商行业算法版进行一些的个性化优化:

在阿里云 OpenSearch-行业算法版控制台中我们可以选择“行业算法版”,行业类型选择“电商行业”,其他配置信息与通用行业模板配置相同:

在购买电商行业算法服务之后,我们就可以根据自己店铺的一些商品数据进行查询分析,排序侧拉和周边服务等。

具体怎么使用了官方附有专门的操作指南,我在此做个简单的整理:

在实例管理-->应用列表中找到对应的应用单击“配置”,配置应用需要依次按照如下步骤进行:功能选择-->应用结构-->索引结构-->数据源-->完成。

应用结构的创建有4种方式:通过数据源创建,手动创建,模板上传和文档上传,下面以通过数据源创建为例进行说明

  • 应用结构配置:

  • 索引结构配置:

  • 填写数据源配置信息:

通过以上的配置我们就完成了阿里云 AI 针对电商行业的算法后台配置,如果你要测试效果:

搜索测试:索引构建完成后可在功能扩展>搜索测试页面对电商行业算法版的行业文本分析器对应的索引进行测试,例如:牛肉。

假如你搜索的是牛肉,算法会根据你提供的数据源数据,进行精确的匹配,并将最接近的商品结果进行排序呈现。阿里云AI通过一站式的算法优化,从语义理解,排序,搜索引导等相关的升级,使用户在搜索商品时搜的更准,曝光的商品更优质。

2.2 加快金融数智化转型

据新闻报道,招商银行已在多个业务场景广泛应用阿里云通义千问大模型,包括智能投研助手“招银智库 AI 小研”、智能客服、通用办公、全行级知识库等。

以智能投研助手“AI 小研”为例,它依托招行最大的研究资源平台“招银智库”,利用阿里云通义千问大模型,搭建全站智能问答机器人、Chat 研报和热点聚焦等功能,解决了传统投研过程中信息检索难、研报提炼复杂、分析耗时等问题,实现金融语义的精准理解和生成,大幅提升查询效率和投研精度,并自动化生成热点摘要与专业科普知识,显著提高了工作效率和决策质量,成为金融科技领域的重要创新。

2.3 开放搜索助攻教育搜题

在日常学习中,常常会在解题过程中遇到各种困难,尤其是面对复杂的公式时,更是感到无从下手。这时候 AI 搜题就可以助你一臂之力。但是目前一些AI搜题针对与公式解析,文档识别仍存在一些不确定的误差,导致最终的结果总是差强人意。

阿里云AI搜索在教育领域具备高性能向量检索引擎和先进算法模型,能实现精准快速响应,结合语义向量召回与关键字搜索提升搜题准确率,支持多模态输入适应不同教学场景,可提供定制化解决方案,拥有弹性扩展和高可靠性,通过数据驱动不断优化,并紧跟技术发展保障安全与隐私,为教育搜索带来全面优质体验。

某在线教育平台,主打 K12 教育,用户数千万级别,题库量8千万左右且持续增加,由自建题库和第三方题库两部分组成,之前通过 OCR+自建 ES 搜索服务实现拍照搜索功能,面临的主要问题是搜索准确率待优化提升,降低搜索延迟等问题。开放搜索接入后:

  • 搜题准确率绝对值提升5%;
  • 延时从100 ms -300 ms 降到稳定50 ms;
  • 离线数据同步大于4000 TPS。

搜题 Query:“张慧研所指与小磁大概相近的是乐府之音”

搜题 Query:“如图是由一些相同的小正方体搭成的几何体从三个不同方向看得到的形状图,则搭成这样的几何体需要__个小正方体. 0 A 3 从上面看看从正面看”

通过升级 阿里云 AI 搜索开放平台。开放搜索集成了教育搜题行业专属的教育分词器,同时在此基础之上用户还可上传自己的分词词条定制个性化的分词器。让搜题结果更准确。

从技术架构再到应用场景,不得不说阿里云 AI 搜索开放平台的功能的确强大。阿里云 AI 搜索凭借高性能向量检索引擎和先进算法模型,为AI 搜索奠定了坚实的技术基础。

智能客服,电商优化,数据智能化等场景,阿里云 AI 搜索正在以技术为基石,以场景作为价值,赋能各行各业,加速企业数字化转型。如果你的企业也需要一些定制化的服务和更智能化的垂直大模型,我建议可以试试!

快速体验:https://help.aliyun.com/zh/open-search/search-platform/getting-started/ai-getting-started?spm=5176.29330531.J_2017351270.3.456d466cjW92hK


阿里云大数据AI
12 声望11 粉丝

分享阿里云计算平台的大数据和AI方向的技术创新、实战案例、经验总结。