SF
阿里云大数据AI技术
阿里云大数据AI技术
注册登录
关注博客
注册登录
主页
关于
RSS
阿里云 MaxCompute MaxQA 开启公测,解锁近实时高效查询体验
阿里云大数据AI
2 月 17 日
阅读 3 分钟
366
随着实时、近实时数据分析需求的持续增长,查询响应时间在现代数据分析和业务应用中变得越来越重要。为减少查询响应时间,提升数据效率,阿里云云原生大数据计算服务 MaxCompute 推出 MaxQA(原 MCQA2.0)查询加速功能,在独享的查询加速资源池的基础上,对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个...
面向 Data+AI 的新一代智能数仓平台
阿里云大数据AI
2 月 14 日
阅读 5 分钟
633
MaxCompute 是阿里云自研大数据计算平台,发展至今已历经约15年的演进与优化。MaxCompute 最初命名为 ODPS,在阿里集团内部则被称为“云梯2”。ODPS 自诞生之初便致力于构建一个全面且高效的 SQL 生态系统,并针对 Hive SQL 进行了大量优化。在阿里集团内部应用也十分广泛,支撑了很多核心业务。2014-2015年,ODPS 正式登...
云上玩转DeepSeek系列之二:PAI+DeepSeek,打造智能问答助手
阿里云大数据AI
2 月 14 日
阅读 3 分钟
568
DeepSeek 系列模型以卓越性能在全球范围内备受瞩目,在各类评测中表现优异,推理性能接近甚至超越国际顶尖闭源模型。2025年2月以来,阿里云人工智能平台 PAI 持续推出围绕 DeepSeek 系列模型的最佳实践,包含快速部署、应用搭建、蒸馏、微调等各个环节,让企业和个人开发者可以在云上高效、灵活地部署和探索 DeepSeek-R1...
DataWorks Copilot × DeepSeek-R1 来了!给你的智能数据开发加满 buff
阿里云大数据AI
2 月 14 日
阅读 2 分钟
575
DataWorks Copilot,作为一站式智能数据开发治理平台 DataWorks 的智能助手,借助AI推理和自然语言处理能力,通过提供代码辅助和智能应用开发功能,为开发者和企业用户带来便捷高效的数据开发体验。现在,DataWorks Copilot 与 DeepSeek-R1 模型深度对接,支持 DeepSeek-R1-671B 模型与DeepSeek-R1-Distill-Qwen-32B 模...
Flink+Paimon+Hologres,面向未来的一体化实时湖仓平台架构设计
阿里云大数据AI
2 月 13 日
阅读 8 分钟
627
摘要:本次分享整理自阿里云实时数仓 Hologres 负责人姜伟华在2024FFA分论坛——行业解决方案 2的分享。内容主要分为以下四个部分:
OpenSearch LLM 智能问答版基于 Deepseek-R1 一分钟搭建 RAG 系统
阿里云大数据AI
2 月 12 日
阅读 2 分钟
497
阿里云OpenSearch LLM智能问答版是OpenSearch推出的一站式开箱即用的检索增强生成(RAG)云产品,帮助开发者快速构建多模态对话式搜索服务。
DataWorks Copilot:让你的数据质量覆盖率一键飞升!
阿里云大数据AI
2 月 8 日
阅读 6 分钟
511
在数据加工链路中,如何确保高质量的数据产出是一个一直需要重点解决的问题。因为一旦数据加工链路中,出现了数据质量问题,轻则数据报表给出不靠谱的业务分析,影响业务决策;重则向用户推送数据错误,严重降低产品用户对产品的信心,甚至失去重要产品客户。根据Gartner的研究报告,“企业每年因低劣的数据质量而蒙受的...
阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
阿里云大数据AI
2 月 7 日
阅读 3 分钟
559
微财是一家创新型的金融科技企业,凭借多年积累的金融科技能力和数据处理优势,为客户提供消费分期等金融信息服务,致力于成为值得信赖的金融机构合作伙伴。旗下拥有好分期等品牌,为高成长用户提供信用分期借款过程中的综合性信息、技术以及辅助服务。
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
阿里云大数据AI
2 月 7 日
阅读 4 分钟
465
摘要: 本文整理自Flink Forward Asia 2024大会中阿里云 DataWorks 数据集成团队陈吉通的分享,主要分享Flink CDC 在阿里云 DataWorks数据集成入湖场景的应用实践。内容分为以下四个部分:
PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
阿里云大数据AI
2 月 2 日
阅读 3 分钟
769
DeepSeek-V3 是 DeepSeek 发布的 MoE(Mixture-of-Experts)大语言模型,总参数量为671B,每个 token 激活的参数量为37B。为了实现高效的推理和成本效益的训练,DeepSeek-V3 采用了 MLA(Multi-head Latent Attention)和 DeepSeekMoE 架构。此外,DeepSeek-V3 首次引入了一种无需辅助损失的负载均衡策略,并设定了多tok...
BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术
阿里云大数据AI
1 月 17 日
阅读 8 分钟
612
近年来,随着深度学习技术的迅猛发展,越来越多的模型展现出动态特性,这引发了对动态形状深度学习编译器(Dynamic Shape AI Compiler)的广泛关注。本文将介绍阿里云 PAI 团队近期发布的 BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,主要内容包括以下三个部分:
阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%
阿里云大数据AI
1 月 16 日
阅读 2 分钟
442
开源大数据平台 E-MapReduce(简称“EMR”)是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、StarRocks、Flink、Presto等开源大数据计算和存储引擎。
MaxCompute Bloomfilter index在蚂蚁安全溯源场景大规模点查询的最佳实践
阿里云大数据AI
2024-12-18
阅读 4 分钟
557
应急溯源是数据安全的最后一道防线,当出现疑似数据泄露的事件时,必须第一时间展开全面准确的排查,并且快速的组织和同步排查的结果,才能为后续事件的妥善处置和报告争取最大空间。
重磅发布 | OpenSearch 推出向量检索 GPU 图算法方案并支持 GPU 规格售卖
阿里云大数据AI
2024-12-18
阅读 4 分钟
502
在数据驱动的时代背景下,快速准确地检索大量非结构化数据,对于支持前沿AI应用至关重要。然而,加载向量数据的内存带宽和高吞吐量的需求不断挑战着基于CPU的传统解决方案。
1
2
3
(current)
上一页
3
(current)
下一页