SF
阿里云大数据AI技术
阿里云大数据AI技术
注册登录
关注博客
注册登录
主页
关于
RSS
DataWorks Copilot:让你的数据质量覆盖率一键飞升!
阿里云大数据AI
2 月 8 日
阅读 6 分钟
584
在数据加工链路中,如何确保高质量的数据产出是一个一直需要重点解决的问题。因为一旦数据加工链路中,出现了数据质量问题,轻则数据报表给出不靠谱的业务分析,影响业务决策;重则向用户推送数据错误,严重降低产品用户对产品的信心,甚至失去重要产品客户。根据Gartner的研究报告,“企业每年因低劣的数据质量而蒙受的...
阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
阿里云大数据AI
2 月 7 日
阅读 3 分钟
646
微财是一家创新型的金融科技企业,凭借多年积累的金融科技能力和数据处理优势,为客户提供消费分期等金融信息服务,致力于成为值得信赖的金融机构合作伙伴。旗下拥有好分期等品牌,为高成长用户提供信用分期借款过程中的综合性信息、技术以及辅助服务。
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
阿里云大数据AI
2 月 7 日
阅读 4 分钟
554
摘要: 本文整理自Flink Forward Asia 2024大会中阿里云 DataWorks 数据集成团队陈吉通的分享,主要分享Flink CDC 在阿里云 DataWorks数据集成入湖场景的应用实践。内容分为以下四个部分:
PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
阿里云大数据AI
2 月 2 日
阅读 3 分钟
845
DeepSeek-V3 是 DeepSeek 发布的 MoE(Mixture-of-Experts)大语言模型,总参数量为671B,每个 token 激活的参数量为37B。为了实现高效的推理和成本效益的训练,DeepSeek-V3 采用了 MLA(Multi-head Latent Attention)和 DeepSeekMoE 架构。此外,DeepSeek-V3 首次引入了一种无需辅助损失的负载均衡策略,并设定了多tok...
BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术
阿里云大数据AI
1 月 17 日
阅读 8 分钟
721
近年来,随着深度学习技术的迅猛发展,越来越多的模型展现出动态特性,这引发了对动态形状深度学习编译器(Dynamic Shape AI Compiler)的广泛关注。本文将介绍阿里云 PAI 团队近期发布的 BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,主要内容包括以下三个部分:
阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%
阿里云大数据AI
1 月 16 日
阅读 2 分钟
501
开源大数据平台 E-MapReduce(简称“EMR”)是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、StarRocks、Flink、Presto等开源大数据计算和存储引擎。
MaxCompute Bloomfilter index在蚂蚁安全溯源场景大规模点查询的最佳实践
阿里云大数据AI
2024-12-18
阅读 4 分钟
622
应急溯源是数据安全的最后一道防线,当出现疑似数据泄露的事件时,必须第一时间展开全面准确的排查,并且快速的组织和同步排查的结果,才能为后续事件的妥善处置和报告争取最大空间。
重磅发布 | OpenSearch 推出向量检索 GPU 图算法方案并支持 GPU 规格售卖
阿里云大数据AI
2024-12-18
阅读 4 分钟
559
在数据驱动的时代背景下,快速准确地检索大量非结构化数据,对于支持前沿AI应用至关重要。然而,加载向量数据的内存带宽和高吞吐量的需求不断挑战着基于CPU的传统解决方案。
1
2
3
4
(current)
上一页
4
(current)
下一页