随着 AI 技术的快速发展,用户对 以算法驱动的 AI 搜索相关能力需求日益增长。AI 搜索开放平台已提供20+原子化服务能力,可灵活组合搭建AI搜索。本期发布将重点解决用户在代码开发中的不便,通过集成 dsw 能力,新增 notebook 功能,为用户提供更便捷的代码编写、调试及运行环境,进一步提升服务调试体验。

一、产品能力

1. 文档解析服务

支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标等信息,以结构化的格式输出。

2. 图片解析服务

针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。

3. 文档切片服务

提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。

4. 多语言向量模型

  • 文本向量化提供将文本数据转化为稠密向量形式表达的服务,支持多款不同语言、输入长度、输出维度的文本向量模型,可用于信息检索、文本分类、相似性比较等场景。
  • 文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。
  • 向量微调服务提供向量模型调优服务,可通过定制训练向量降维模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。

5. 查询分析服务

提供Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。

6. 搜索引擎

提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的API服务组合使用。

7. 排序服务

提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。

8. 大模型内容生成服务

提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo通义千问-Plus通义千问-Max大模型。同时内置 OpenSearch-通义千问-Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。

二、产品优势

1. 丰富的 AI 搜索能力:

  • 依托领先的模型底座训练AI搜索专属模型,内置搜索及RAG场景全链路组件化服务。

2. 灵活的调用方式:

  • 通过 API、SDK调用服务,方便开发者、企业客户及 ISV 技术人员将部分或全链路AI搜索服务集成到自身业务链路中。

3. 开箱即用:

4. 最佳实践:

  • 基于 OpenSearch 多年在智能搜索、RAG 领域的沉淀,内置多种 AI 搜索最佳实践,可快速搭建更加适配业务需求的搜索链路。

三、功能使用

1. 创建服务开发实例

  • AI搜索开放平台选择模型服务>服务开发,然后单击新建开发实例
  • 输入实例名称描述信息,选择实例资源规格,确定提交后系统开始部署实例。

详情见:https://help.aliyun.com/zh/open-search/search-platform/user-guide/service-development

2. 服务开发

当创建的服务开发实例状态为运行中时,可通过以下入口进入 Notebook 开发环境:

  • 从服务开发列表进入:

  • 从场景中心,可一键进入场景开发环境:

  • 从服务体验中心,可一键进入服务开发环境:

四、计费

服务开发能力根据购买的 CPU/GPU 机型,消耗的计算资源计费,CU 单价为1.07元/CU/小时

若完成开发或调试可随时停止开发实例,停止后将暂停计费

对外透出机型:

机型单台机器消耗CU数量单台机器单价(元/小时)
gpu.t4.16g.x116.0717.193
ops.basic1.gi.large0.610.65

部署服务的价格为:CU 单价机型消耗的 CU 数量购买机器个数

如:1台 ops.basic1.gi.large 部署开发服务的价格=1.07元/CU/小时0.611=0.65元/小时

五、结尾

本次阿里云 AI 搜索开放平台服务开发能力的发布,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。

了解更多AI搜索开放平台能力https://help.aliyun.com/zh/open-search/search-platform/product-overview/introduction-to-search-platform

快速登录控制台https://opensearch.console.aliyun.com/cn-shanghai/rag/server-market


阿里云大数据AI
12 声望11 粉丝

分享阿里云计算平台的大数据和AI方向的技术创新、实战案例、经验总结。