SF
阿里云大数据AI技术
阿里云大数据AI技术
注册登录
关注博客
注册登录
主页
关于
RSS
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
阿里云大数据AI
今天 13:37
阅读 4 分钟
51
近几年,大语言模型(LLM)取得了突破性进展。然而,尽管这些大模型在各种任务中展现出了强大的语言理解与生成能力,也存在一些问题,其中最为突出的是幻觉问题以及知识时效性的问题。
阿里云 AI 搜索开放平台新功能发布:大模型联网能力上线
阿里云大数据AI
今天 10:02
阅读 2 分钟
56
在数字化转型的浪潮中,高效、智能的搜索技术正成为企业提升竞争力的关键。为了满足用户对更智能、更精准搜索体验的需求,阿里云 AI 搜索开放平台此次新增了大模型联网能力,通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。以下是此次更新的核心功能详情:
阿里云 Elasticsearch Serverless 检索增强型8.17版免费邀测!
阿里云大数据AI
4 月 15 日
阅读 2 分钟
148
在数字化转型的背景下,企业对高效、低成本的检索系统需求激增。阿里云Elasticsearch Serverless检索增强型8.17版现已开放邀测,通过向量搜索性能突破、弹性资源调度优化及成本控制增强,助力企业应对海量数据检索的挑战:
鹰角:EMR Serverless Spark 在《明日方舟》游戏业务的应用
阿里云大数据AI
4 月 15 日
阅读 3 分钟
133
鹰角网络是一家年轻且富有创新的游戏公司,致力于开发充满挑战性和艺术价值的游戏产品。公司目前涵盖了游戏开发、运营和发行的全生命周期业务。随着业务的扩展,鹰角网络从单一爆款游戏发展到多赛道、多平台、全球化的战略布局,在数据业务上进行了全面的优化和升级。
面向MoE和推理模型时代:阿里云大数据AI产品升级发布
阿里云大数据AI
4 月 14 日
阅读 2 分钟
217
阿里云 2025 AI 势能大会上,阿里云智能集团副总裁、阿里云智能计算平台事业部负责人汪军华带来主题演讲 《范式演进:MoE&推理模型时代的挑战与应对》 ,并发布大数据 AI 平台一系列重磅产品能力升级。
DataWorks智能体Agent发布!基于MCP实现数据开发与治理自动化运行
阿里云大数据AI
4 月 11 日
阅读 4 分钟
235
在传统的数据开发工作中,企业用户或者开发者常常需要进行繁琐的配置、复杂的代码撰写、反复的性能调优和大量重复性的操作,才能实现数据开发、数据集成和数据治理等工作,效率十分低下。
阿里云 AI 搜索开放平台:从算法到业务——AI 搜索驱动企业智能化升级
阿里云大数据AI
4 月 10 日
阅读 5 分钟
204
目前大模型的强大能力,使其成为一些企业和行业的主要创新驱动力,企业亟需重新审视和调整现有的创新机制,以适应AI技术和大数据的快速发展。目前很多企业已经开始尝试大模型在业务中进行赋能,但在使用一些大模型时往往因为自身场景的需求不同,导致在应用落地中存在一些场景受限,知识库不完善等一些痛点。
用友畅捷通基于阿里云 MaxCompute 搭建智能数仓的落地实践
阿里云大数据AI
4 月 9 日
阅读 4 分钟
241
今天非常荣幸能够与大家分享用友畅捷通基于阿里云 MaxCompute(以下简称 MC)构建智能数据仓库的落地实践经验。本次分享将从以下几个方面展开:一是业务背景,介绍我们在2017年启动数仓搭建时的技术选型背景;二是选择 MC 作为核心技术平台的原因及具体应用案例;三是对未来工作的展望。
【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
阿里云大数据AI
4 月 8 日
阅读 7 分钟
304
随着 DeepSeek-R1 和 QwQ-32B 等面向深度推理的大语言模型的开源,“大模型+慢思考”已成为拓展大语言模型智能边界的标准配置。然而,这些模型在资源受限的移动设备和边缘计算场景中的普及仍面临巨大挑战。因此,学术界和工业界迫切需要解决如何有效利用知识蒸馏技术,将这些超大规模深度推理模型的知识迁移到小模型中,从...
阿里云 AI 搜索开放平台新发布:增加 QwQ 模型
阿里云大数据AI
4 月 2 日
阅读 1 分钟
353
为了满足用户对更高效、更智能搜索功能的需求,阿里云 AI 搜索开放平台 新增加 QwQ 模型,这一全新模型的加入将为企业和开发者带来更强大的搜索解决方案。
百观科技基于阿里云 EMR 的数据湖实践分享
阿里云大数据AI
4 月 2 日
阅读 4 分钟
307
百观科技成立于 2016 年,是以数据为核心驱动力的市场研究和信息服务公司。百观以全域数据为基础,通过客观科学的数据分析,解锁数据价值,为客户提供具有现实指导意义的洞察和解决方案。
DataWorks数据集成同步至Hologres能力介绍
阿里云大数据AI
4 月 1 日
阅读 5 分钟
324
摘要:本次分享的主题是DataWorks数据集成同步至Hologres能力,由计算平台的产品经理喆别(王喆)分享。介绍DataWorks将多个数据源的数据集成并同步到Hologres的能力。DataWorks数据集成是一个稳定高效、弹性伸缩的数据同步平台,致力于提供在复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力,提供低...
高效向量检索实践:阿里云百炼生成+Milvus存储技术方案解析
阿里云大数据AI
3 月 31 日
阅读 3 分钟
308
凌晨1点,某电商平台的推荐系统突然告急——每秒涌入的10万次用户点击,让原本精准的搜索推荐陷入混乱。商品库中上亿张图片和描述文本,如何在毫秒内找到与用户行为最匹配的商品?另一边,一家汽车公司的自动驾驶团队正为如何用千万份单日PB级的仿真驾驶多模态数据的预训练发愁;同时还有更多企业在思考如何进一步提高智能...
MaxCompute MaxFrame正式推出AI Function功能,一键调用大模型处理海量数据!
阿里云大数据AI
3 月 28 日
阅读 13 分钟
370
当下,以大语言模型为代表的人工智能(AI)正在快速演进,这将深刻改变我们分析、处理与使用数据的方式,推动各行各业迎来新的发展机遇。但另一方面,选取、部署和使用好大模型具备一定的技术要求和开发成本,限制了用户利用AI批量处理和分析海量数据的能力。
谁是 AI 搜索先锋?阿里云携手 Elastic 正式启动先锋者招募!
阿里云大数据AI
3 月 28 日
阅读 3 分钟
325
在人工智能(正文简称“AI”)技术深刻重构全球产业生态的当下,AI 搜索技术正以革新性力量驱动千行万业智能化跃迁。值此技术变革关键节点,业界领先的搜索分析引擎 Elasticsearch 也迎来了 15 年的里程碑,阿里云携手 Elastic 于 3 月 26 日在中国市场正式启动“Elastic Pioneer” 先锋者计划。这一计划,是精心筹备的 Elas...
快速使用Milvus MCP Server,0代码搭建智能搜索Agent
阿里云大数据AI
3 月 27 日
阅读 5 分钟
409
在AI时代,搜索场景已从传统的关键词匹配过渡到语义化、向量化的智能深度搜索。一个高效的智能搜索Agent能通过自然语言理解、语义表示和向量检索,实现更精准的信息匹配。然而想要搭建这样一个Agent往往需要面临和解决很多问题,如产品技术选型、模型的选择与部署、向量数据的存储和处理以及返回结果的实时性保障等。
【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B
阿里云大数据AI
3 月 27 日
阅读 2 分钟
316
DeepSeek近期推出了 “DeepSeek-V3-0324” 版本,据测试在数学推理和前端开发方面的表现已优于 Claude 3.5 和 Claude 3.7 Sonnet。
Hologres诊断与优化快速入门
阿里云大数据AI
3 月 27 日
阅读 5 分钟
401
我的介绍将分为五个部分:首先,在事前阶段,讲解如何利用监控指标实现实时监控和预防措施。其次,事中探讨团队如何通过活跃日志发现运行中的问题,并及时采取措施止损,以避免业务问题的恶化。接下来,在事后阶段介绍如何通过深入分析和结合可视化工具来诊断当前的性能瓶颈。此外展示如何通过表管理工具实现成本治理,...
爱橙科技基于 MaxCompute 智能物化视图最佳实践
阿里云大数据AI
3 月 27 日
阅读 5 分钟
298
今天,从三个角度分享爱橙科技如何基于 MaxCompute 智能物化视图进行计算成本优化。首先,是弹内 MaxCompute 物化视图实践;其次,我将介绍物化视图帮助我们在数据模型层进行的优化,也就是公共层挖掘;最后是物化视图如何与 Quick BI 等产品进行联动。
DistilQwen2.5-R1发布:知识蒸馏助推小模型深度思考
阿里云大数据AI
3 月 26 日
阅读 10 分钟
338
随着 DeepSeek-R1 和 QwQ-32B 等面向深度推理的大语言模型的开源,“大模型+慢思考”已成为拓展大语言模型智能边界的标准配置。然而,这些模型在资源受限的移动设备和边缘计算场景中的普及仍面临巨大挑战。因此,学术界和工业界迫切需要解决如何有效利用知识蒸馏技术,将这些超大规模深度推理模型的知识迁移到小模型中,从...
最佳实践 | 在 EMR Serverless Spark 中实现 Doris 读写操作
阿里云大数据AI
3 月 25 日
阅读 6 分钟
326
EMR Serverless Spark 是一款面向 Data+AI 的高性能 Lakehouse 产品。它为企业提供了一站式的数据平台服务,包括任务开发、调试、调度和运维等,极大地简化了数据处理和模型训练的全流程。同时,它100%兼容开源 Spark 生态,能够无缝集成到客户现有的数据平台。使用 EMR Serverless Spark,企业可以更专注于数据处理分析...
MCP+Hologres+LLM 搭建数据分析 Agent
阿里云大数据AI
3 月 24 日
阅读 5 分钟
513
如果使用静态文件交换,难以做数据审计,即使数据实时更新,但是也只能进行 T+1 的离线分析,且需经历数据清洗(占比 28%)、格式转换(占比 22%)、版本核对(占比 15%)等冗长环节
使用DataWorks Notebook实现智能图片标注,给你的图片加个“注释”
阿里云大数据AI
3 月 21 日
阅读 9 分钟
408
DataWorks作为一站式智能数据开发治理平台,积累和沉淀了阿里巴巴十余年大数据建设方法论和最佳实践,为数仓、数据湖、OpenLake湖仓一体数据架构提供智能化ETL开发、数据分析与主动式数据资产治理服务,助力“Data+AI”全生命周期的数据管理。面向大数据&AI协同开发场景,DataWorks提供了交互式开发和分析工具Notebook。Da...
如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介
阿里云大数据AI
3 月 21 日
阅读 4 分钟
328
随着大模型(LLM)技术的爆发式应用,如何快速、客观评估模型回复质量成为行业痛点。对于回答客观问题的LLM,目前业内已经有比较成熟的数据集进行效果评测与模型打榜。但是如何对一个开放式生成LLM进行效果评估,尤其在知识问答、客服对话、内容合规、RAG(检索增强生成)等场景中,目前主流的评测方式仍存在一定的局限性:
最佳实践 | 在 EMR Serverless Spark 中实现 StarRocks 读写操作
阿里云大数据AI
3 月 20 日
阅读 8 分钟
325
EMR Serverless Spark 是一款兼容开源 Spark 的高性能 Lakehouse 产品。它为用户提供任务开发、调试、发布、调度和运维等全方位的产品化服务,显著简化了大数据计算的工作流程,使用户能更专注于数据分析和价值提炼。
Hologres Dynamic Table快速入门
阿里云大数据AI
3 月 20 日
阅读 7 分钟
318
本次分享的主题是Dynamic Table快速入门,由Hologres PD 赵红梅分享。今天的分享分为三个部分。首先,第一部分介绍Dynamic Table;第二部分进行Dynamic Table的实操;第三部分为一些使用DynamicTable的建议和最佳实践。
DataWorks :Data+AI 一体化开发实战图谱
阿里云大数据AI
3 月 19 日
阅读 4 分钟
373
在数字经济时代,企业正面临数据规模指数级增长与AI应用场景爆发式增长的双重挑战,企业数据工程师也面临着双重挑战:既要应对PB级数据处理需求,又要驾驭AI工程化落地的复杂性。
阿里云 AI 搜索产品荣获 Elastic Innovation Award 2024
阿里云大数据AI
3 月 19 日
阅读 4 分钟
349
阿里云AI搜索产品荣获Elastic Innovation Award 2024,该奖项于近日在新加坡ElasticON 2025的Elastic合作伙伴峰会上颁发,旨在表彰基于Elastic平台开发企业级生成式人工智能(GenAI)应用的顶尖合作伙伴,这些应用有效帮助客户优化搜索、安全和可观测性领域的工作流程。
Hologres实时湖仓能力入门实践
阿里云大数据AI
3 月 18 日
阅读 8 分钟
389
2024年云栖大会,Hologres发布3.0版本,全面升级为一体化实时湖仓平台,通过统一数据平台实现湖仓存储一体、多模式计算一体、分析服务一体、Data+AI 一体,实现一份数据、一份计算、一份服务,极大提高数据开发及应用效率。其中,湖仓存储一体是其重要部分。本文将为您介绍Hologres湖仓存储一体核心能力及使用实践。
Flink CDC+Hologres高性能数据同步优化实践
阿里云大数据AI
3 月 18 日
阅读 10 分钟
336
摘要: 本次分享的主题是 Flink CDC + Hologres 高性能数据同步优化实践,由阿里云高级技术专家胡一博分享。主要分为三个部分:
1
(current)
2
3
下一页
1
(current)
下一页