Alluxio - SegmentFault 思否

Alluxio 携手 vLLM Production Stack 加速大语言模型推理

3 月 27 日

阅读 2 分钟

510

近日，Alluxio 宣布与芝加哥大学 LMCache 实验室开发的 vLLM Production Stack 项目达成战略合作。作为大语言模型（LLM）推理领域的开源项目，vLLM Production Stack 旨在为 LLM 推理提供高效的集群级全栈解决方案。此次合作将深度融合双方技术优势，共同推动新一代 AI 基础设施在 LLM 推理场景中的创新突破。

后DeepSeek时代，Alluxio重塑企业AI存储基础设施

3 月 27 日

阅读 2 分钟

515

随着 2025 年 DeepSeek 等大语言和多模态大模型的技术边界持续突破，全球 AI 训练集群规模已迈入百万卡级别，单次训练任务的数据吞吐需求突破 PB / 小时的级别。这场由算法创新驱动的 “AI 风暴” 正深刻重塑着基础设施架构的核心规则，其中，存储侧的性能、扩展性、成本效率与数据主权控制，已成为决定企业 AI 成败的关键...

全球跨境电商构建高性能数据访问平台实战宝典

3 月 27 日

阅读 2 分钟

447

在数字化时代，电商已成为全球商业最具活力的领域之一。Alluxio 作为数据管理与存储领域的先锋，为电商行业的快速发展提供了重要支持，尤其在全球跨境电商的崛起中，成为企业高效运营和创新的关键力量。

Alluxio Enterprise AI 3.5 发布，全面提升AI模型训练性能

2 月 18 日

阅读 2 分钟

589

近日，Alluxio 发布 Alluxio Enterprise AI 3.5 版本。该版本凭借仅缓存写入模式 ( Cache Only Write Mode )、高级缓存管理策略以及 Python 的深度集成等创新功能，大幅加速 AI 模型训练并简化基础设施运维，助力企业高效处理海量数据集、优化 AI 工作负载性能。

案例分享｜Alluxio在媒体融合领域的应用

1 月 23 日

阅读 7 分钟

635

桂静，就读于中国传媒大学计算机与网络空间安全学院，媒体融合与传播国家重点实验室，导师为王永滨教授。已发表论文三篇。其中 SCI 论文1篇。参与多项国家级以及省部级子课题项目。致力于媒体融合领域数据存储与处理关键技术研究。

Alluxio 联手 Solidigm 推出针对 AI 工作负载的高级缓存解决方案

1 月 21 日

阅读 4 分钟

600

Alluxio 作为全球领先的 AI 缓存解决方案供应商，提供针对 GPU 驱动 AI 负载的高速缓存。其可扩展架构支持数万个节点，能显著降低存储带宽的消耗。Alluxio 在解决 AI 存储挑战方面的前沿技术在很大程度上推动了大语言模型( LLM )在全球范围内的成功。

案例分享｜Alluxio数据流转方案在联通智网的应用

1 月 16 日

阅读 3 分钟

591

分享嘉宾陈得泳 - 中国联通大数据平台 SRE 工程师，致力于基于开源生态构建稳定、高效、安全、低成本的大数据集群。观看完整分享回放业务背景统一底座和安全基座位于不同 IDC；统一底座：承接 O 域全域网络数据，包括移动网信令、告警、故障、资源以及固网数据等基础数据加工的大数据集群，位于郑州 IDC；安全基座：是应...

东南亚电商巨头 Shopee 加速 AI 训练的实践与探索

1 月 7 日

阅读 6 分钟

764

分享嘉宾孙颢宁Shopee Data Infra 分布式存储开发工程师分享大纲AI 平台面临的挑战Alluxio 加速AI 训练的实践Alluxio 的性能探索Alluxio 的大版本滚动升级未来规划观看完整回放视频AI 平台面临的挑战在打造 AI 平台前，不同部门的算法团队都需要自己去申请购买云服务，资源利用率低。公司决定搭建训练机房，构建 AI 平...

封面图

南科大分享｜大数据技术如何赋能大模型训练及开发

2024-12-20

阅读 11 分钟

737

分享嘉宾张松昕，南方科技大学统计与数据科学系研究学者，UCloud 顾问资深算法专家，曾任粤港澳大湾区数字经济研究院访问学者，主导大模型高效分布式训练框架的开发，设计了 SUS-Chat-34B 的微调流程，登顶 Open LLM Leaderboard、Opencompass 同参数量级模型榜首。

Alluxio在数据索引和模型分发中的核心价值与应用

2024-12-20

阅读 3 分钟

581

在当前的技术环境下，搜索、推荐、广告、大模型、自动驾驶等领域的业务依赖于海量数据的处理和复杂模型的训练。这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息，进行模型训练和推理。这一过程需要强大的数据分发能力，尤其是在多个服务器同时拉取同一份数据时，更是考验基础设施的性能。在这样的背景下，A...

案例分享｜企查查的数据降本增效之路

2024-12-19

阅读 8 分钟

893

“企查查”是企查查科技股份有限公司旗下的一款企业信用查询工具。2023年5月20日，企查查正式发布全球首款商查大模型——“知彼阿尔法”，该模型基于企查查覆盖的全球企业信用数据进行训练，相较于当前 AIGC（生成式人工智能）领域其它模型，“知彼阿尔法”大模型的亮点在于用垂直领域的海量数据进行训练，保证信息的精准度，基...

选择Alluxio来解决AI模型训练场景数据访问的五大理由

2024-12-19

阅读 3 分钟

605

在AI模型训练尤其是大模型领域，存储系统的性能和稳定性直接决定了模型训练、推理、部署任务的效率和成本。随着全球AI行业的爆发带来的数据规模的快速增长，如何高效管理和利用这些数据成为AI模型训练中的一大挑战。

Alluxio 在B站AI训练场景的应用

2024-11-18

阅读 5 分钟

410

分享嘉宾刘礼铭 bilibili 人工智能资深工程师分享提纲B站 AI 训练场景介绍；Alluxio 如何提升 AI 训练效率；未来规划观看完整视频分享B站AI的训练场景机器学习平台介绍首先，简单介绍一下B站 AI 的训练场景，整个机器学习平台的架构如下图所示：它具备了一个常规机器学习平台的能力，比如交互式建模、数据集管理、模型训...

小红书多云统一数据加速层介绍

2024-11-18

阅读 9 分钟

462

嘉宾介绍：李亚斌小红书大数据技术专家负责小红书多云统一数据加速层的建设关于小红书小红书是年轻人的生活记录、分享平台，用户可以通过短视频、图文等形式记录生活点滴，分享生活方式。分享提纲本文主要介绍小红书多云统一数据加速层的内容，主要内容包括以下几个部分：小红书在复杂的多云环境下面临的挑战；如何通过...

Alluxio AI助力知乎千卡模型训练

2024-11-18

阅读 6 分钟

297

离线机房：专为满足大数据相关业务方需求而设计的离线计算服务中心。其主要职能是部署离线调度、离线存储以及调度平台等服务。这些服务的目标是提供高效的离线数据处理和计算能力。在离线机房中，大数据业务方可以安心进行批量数据处理和计算任务，从而满足他们对数据处理、存储和调度的要求。

封面图

Alluxio Enterprise AI on K8s 部署教程

2024-09-23

阅读 21 分钟

501

Alluxio Enterprise AI on K8s 部署视频视频为Alluxio Enterprise AI on K8s 部署教程。下面内容将通过文字方式主要介绍如何通过 Operator（Kubernetes 管理应用程序的扩展）在 Kubernetes 上安装 Alluxio。

封面图

对比速览 | Alluxio 企业版 v.s. 社区版

2024-08-06

阅读 2 分钟

462

当前诸多企业面临着日益增长的数据量和复杂的数据管理挑战。特别是在模型训练的过程中，诸如GPU短缺、GPU利用率不高等问题已经成为许多企业在技术实施中面临的挑战。同时，大数据分析中跨云数据访问速度慢、成本高等问题也给企业带来了痛点。为了应对这些挑战，企业们积极寻求更便捷的数据管理和模型训练加速解决方案。

案例分享｜Alluxio在自动驾驶数据闭环中的应用

2024-08-02

阅读 9 分钟

733

中汽创智科技有限公司（以下简称“中汽创智”）由中国一汽、东风公司、南方工业集团、长安汽车和南京江宁经开科技共同出资设立。聚焦智能底盘、新能动力、智能网联三大业务领域，围绕“车端+云端+通信端”生态体系，开展前瞻、共性、平台、核心技术和产品研发及产业孵化。

封面图

案例分享｜Alluxio在自动驾驶模型训练中的应用与部署

2024-05-21

阅读 7 分钟

660

关于辉羲智能辉羲智能是一家做自动驾驶芯片的初创公司，成立于2022年。致力打造创新车载智能计算平台，提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案，助力车企实现优质高效的自动驾驶量产交付，构建低成本、大规模和自动化迭代能力，引领数据驱动时代的高阶智慧出行。

封面图

OPPO案例 | Alluxio在Data&AI湖仓一体的实践

2024-03-22

阅读 5 分钟

475

在OPPO的实际应用中，我们将自研的Shuttle与Alluxio完美结合，使得整个Shuttle Service的性能得到显著提升，基本上实现了性能翻倍的效果。通过这一优化，我们成功降低了约一半的系统压力，同时吞吐量也直接翻倍。这样的结合不仅解决了性能问题，更为OPPO的服务体系注入了新的活力。

封面图

数据本地性如何助力企业在云上实现高效机器学习

2024-03-22

阅读 4 分钟

539

分享嘉宾：Lu Qiu, Shawn Sun本文将讨论数据本地性对于在云上进行高效机器学习的重要性。首先对比现有解决方案的利弊，并综合考虑如何通过数据本地性来降低成本和实现性能最大化。其次会介绍新一代的Alluxio设计与实现，详细说明其在模型训练和部署中的价值。最后会分享从基准测试和实际案例研究中得出的结论。

封面图

超算互联网统一存储平台技术研究

2024-03-08

阅读 6 分钟

568

大家好，我是来自山东省计算中心（国家超级计算济南中心）的王春晓，我从2022年开始参与超算互联网的项目，主要负责算网统一存储平台的研发，在存储基座方面也做了很多调研，最后选择了Alluxio平台，经过一年多的努力，也取得了一定的进展，非常感谢Alluxio公司提供的支持和帮助。接下来我们将围绕超算互联网的主题，从...

封面图

实录分享 | 央企大数据平台架构发展趋势与应用场景的介绍

2024-01-12

阅读 7 分钟

684

分享嘉宾：孟子涵-中国华能集团信息中心平台架构师2021年华能就与Alluxio建立了合作，共同写了整个华能统一纳管的架构方案。这个方案我认为是现在我们在央企里边比较核心的一套体系，能让全集团所有我们认为重要的数字化资源实现真正的统一集中，让存储、计算、数据、应用、技术能力，能够在全集团范围内最大化的流动起...

封面图

Alluxio AI 全新产品发布：无缝对接低成本对象存储 AI 训练解决方案

2023-10-20

阅读 4 分钟

726

（2023 年 10 月 19 日，北京）Alluxio 作为一家承载各类数据驱动型工作负载的数据平台公司，现推出全新的 Alluxio Enterprise AI 高性能数据平台, 旨在满足人工智能 (AI) 和机器学习 (ML) 负载对于企业数据基础设施不断增长的需求。 Alluxio Enterprise AI 平台可综合优化企业 AI 和分析基础设施的性能、数据可访问性、...

封面图

实录分享 | 使用Prometheus和Grafana监控Alluxio运行状况

2023-08-14

阅读 7 分钟

864

欢迎来到【微直播间】，2min纵览大咖观点本次分享主要包括三个方面：Prometheus&Grafana简介环境搭建手动调优一、 Prometheus&Grafana简介关于Prometheus：Prometheus 是一个开源的完整监控解决方案，其对传统监控系统的测试和告警模型进行了彻底的颠覆，形成了基于中央化的规则计算、统一分析和告警新模型。关于Grafana...

封面图

实录分享 | Alluxio Operator一体化部署方案

2023-06-25

阅读 10 分钟

1.2k

首先，介绍 Kubernetes 容器化部署和当前所面临的挑战。然后，引入operator的概念，介绍当前业界关于Kubernetes 容器化部署问题的主流解决方案。接着，讲解如何针对应用服务去实现对应的operator。最后用Alluxio作为实际案例展示operator是如何实现的。

封面图

如何挖掘闲置硬件资源的潜力-PrestoDB缓存加速实践小结

2023-05-19

阅读 7 分钟

968

用户体验很重要，降本也很重要。做技术的都知道，加机器堆资源可以解决绝大多数的用户觉得慢的问题，但要加钱。没什么用户体验是开发不了的，但要排期，本质也要钱。在成本有限，包括机器资源和开发人力都有限的情况下，如何提升用户体验呢？

封面图

Alluxio跨集群同步机制的设计与实现

2023-03-23

阅读 8 分钟

823

Alluxio 位于存储和计算层之间，在不同的底层文件系统（UFS）上层提供高性能缓存和统一的命名空间。虽然通过 Alluxio 对 UFS 进行更新可使 Alluxio 与 UFS 保持一致，但在某些情况下, 例如在运行多个共享某一个或多个 UFS 命名空间的 Alluxio 集群时，结果可能并非如此。为了确保这种情况下的一致性，Alluxio 已经实现了...

封面图

ChatGPT：“Hello Alluxio，我为你写了一首诗！”

2023-02-13

阅读 2 分钟

1.1k

新晋“网红”ChatGPT爆火网络，大家都很好奇ChatGPT究竟是什么？各种解读/研究的文章铺天盖地，但让小编更好奇的是：它眼中的Alluxio是怎样的？带着这份探知欲，我们聊了聊！

封面图

如何借力Alluxio推动大数据产品性能提升与成本优化？

2023-02-09

阅读 4 分钟

815

随着数字化不断发展，各行各业数据呈现海量增长的趋势。存算分离将存储系统和计算框架拆分为独立的模块，Alluxio作为如今主流云数据编排软件之一，为计算型应用（如 Apache Spark、Presto）和存储系统（如 Amazon S3、Alibaba OSS）的数据访问构建了桥梁。

封面图

1

1