随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。
一、阿里云 AI 搜索开放平台
一站式的 AI 搜索开放平台作为阿里云 AI 搜索整个产品体系核心,提供丰富的 AI 搜索组件化服务。兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。
核心优势:
- 多模态搜索支持文本、图像、文档联合检索,覆盖PDF、DOC、图片等格式,可提取结构化内容(如标题、表格、代码),并结合多模态大模型理解图片语义。
- 大模型深度集成提供Qwen3、QwQ、DeepSeek、GTE 多语言文本向量化模型等大语言模型,支持语义分析、NL2SQL转换、对话生成,降低模型幻觉率,提升问答准确性。
- 全链路组件化服务内置文档解析、切片、向量化、查询分析、排序、效果评估等20+原子化服务能力,可灵活组合搭建智能搜索、RAG或推荐系统。
- 多场景支持覆盖电商搜索、智能客服、知识库问答、多模态内容检索等场景,提供行业适配模板(如电商排序策略、医疗文档分析)。
应用场景:
- 智能客服
基于 RAG(检索增强生成)技术,结合 Qwen3、QwQ等大模型,构建企业专属智能客服系统,通过私有知识库与联网搜索能力,提供精准、安全的问答服务。
- 对话式搜索
提供基于 LLM 的对话式搜索服务,支持自然语言交互与多模态结果展示,适用于搜索引擎、问答机器人等场景。
- 知识图谱增强
通过文档解析、向量化与 RAG 技术,构建并优化企业知识图谱,实现语义化查询与关联分析。
- 个性化推荐
结合用户行为数据、向量化推荐与排序服务,实现电商、内容平台等场景的精准推荐。
二、产品能力介绍
无论是文档解析、图片理解还是 OCR 识别,AI 搜索开放平台都能高效处理多类型数据,凭借行业分析、意图识别与排序算法,显著提升特定业务场景下的搜索效率与准确性。此外,基于大模型的自动测评功能,涵盖无幻觉率、准确率和相关性等指标,帮助开发者不断优化搜索体验。
1. 文档解析服务
支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标等信息,以结构化的格式输出。
2. 图片解析服务
针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。
3. 文档切片服务
提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。
4. 多语言向量模型
- 文本向量化提供将文本数据转化为稠密向量形式表达的服务,支持多款不同语言、输入长度、输出维度的文本向量模型,可用于信息检索、文本分类、相似性比较等场景。
- 文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。
- 量微调服务提供向量模型调优服务,可通过定制训练向量降维模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。
5. 查询分析服务
提供 Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。
6. 搜索引擎
提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的API服务组合使用。
7. 排序服务
提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。
8. 大模型内容生成服务
提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo、通义千问-Plus、通义千问-Max大模型。同时内置 OpenSearch-通义千问-Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。
三、新功能介绍
1. 大模型联网能力
通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。了解更多
2. GTE 多语言文本向量化模型
GTE 多语言通用文本向量模型(iic/gte_sentence-embedding_multilingual-base),来源于 ModelScope 模型库,并开放自部署能力,助力企业构建更高并发、更低延迟的多语言搜索与分析系统。了解更多
3. 服务开发能力
服务开发能力,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。了解更多
4. Qwen3 模型
通义最新大模型 Qwen3 是 Qwen 系列中最新一代的大型语言模型,提供了一整套密集和混合专家模型(MoE)。基于广泛的训练,Qwen3 在推理、指令跟随、Agent能力和多语言支持方面取得了突破性进展。了解更多
5. QWQ 模型
基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。了解更多
四、计费
阿里云 AI 搜索开放平台均采用按量付费模式,按照服务调用量与模型定制训练实际消耗的计算时(CU)计费。
部分示例:
- 更多计费详情点击查看
五、结尾
阿里云 AI 搜索旨在帮助用户简化搜索应用的构建过程,提供丰富的开箱即用服务,涵盖多模态数据处理、精准搜索算法、效果测评与场景开发,全面满足各种搜索需求。
了解更多阿里云 AI 搜索开放平台
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。