OPPO案例 | Alluxio在Data&AI湖仓一体的实践

3 月 22 日
阅读 5 分钟
58
在OPPO的实际应用中,我们将自研的Shuttle与Alluxio完美结合,使得整个Shuttle Service的性能得到显著提升,基本上实现了性能翻倍的效果。通过这一优化,我们成功降低了约一半的系统压力,同时吞吐量也直接翻倍。这样的结合不仅解决了性能问题,更为OPPO的服务体系注入了新的活力。
封面图

数据本地性如何助力企业在云上实现高效机器学习

3 月 22 日
阅读 4 分钟
43
分享嘉宾:Lu Qiu, Shawn Sun本文将讨论数据本地性对于在云上进行高效机器学习的重要性。首先对比现有解决方案的利弊,并综合考虑如何通过数据本地性来降低成本和实现性能最大化。其次会介绍新一代的Alluxio设计与实现,详细说明其在模型训练和部署中的价值。最后会分享从基准测试和实际案例研究中得出的结论。
封面图

超算互联网统一存储平台技术研究

3 月 8 日
阅读 6 分钟
58
大家好,我是来自山东省计算中心(国家超级计算济南中心)的王春晓,我从2022年开始参与超算互联网的项目,主要负责算网统一存储平台的研发,在存储基座方面也做了很多调研,最后选择了Alluxio平台,经过一年多的努力,也取得了一定的进展,非常感谢Alluxio公司提供的支持和帮助。接下来我们将围绕超算互联网的主题,从...
封面图

实录分享 | 央企大数据平台架构发展趋势与应用场景的介绍

1 月 12 日
阅读 7 分钟
179
分享嘉宾:孟子涵-中国华能集团信息中心平台架构师2021年华能就与Alluxio建立了合作,共同写了整个华能统一纳管的架构方案。这个方案我认为是现在我们在央企里边比较核心的一套体系,能让全集团所有我们认为重要的数字化资源实现真正的统一集中,让存储、计算、数据、应用、技术能力,能够在全集团范围内最大化的流动起...
封面图

Alluxio AI 全新产品发布:无缝对接低成本对象存储 AI 训练解决方案

2023-10-20
阅读 4 分钟
325
(2023 年 10 月 19 日,北京)Alluxio 作为一家承载各类数据驱动型工作负载的数据平台公司,现推出全新的 Alluxio Enterprise AI 高性能数据平台, 旨在满足人工智能 (AI) 和机器学习 (ML) 负载对于企业数据基础设施不断增长的需求。 Alluxio Enterprise AI 平台可综合优化企业 AI 和分析基础设施的性能、数据可访问性、...
封面图

实录分享 | 使用Prometheus和Grafana监控Alluxio运行状况

2023-08-14
阅读 7 分钟
332
欢迎来到【微直播间】,2min纵览大咖观点本次分享主要包括三个方面:Prometheus&Grafana简介环境搭建手动调优一、 Prometheus&Grafana简介关于Prometheus:Prometheus 是一个开源的完整监控解决方案,其对传统监控系统的测试和告警模型进行了彻底的颠覆,形成了基于中央化的规则计算、统一分析和告警新模型。关于Grafana...
封面图

实录分享 | Alluxio Operator一体化部署方案

2023-06-25
阅读 10 分钟
723
首先,介绍 Kubernetes 容器化部署和当前所面临的挑战。然后,引入operator的概念,介绍当前业界关于Kubernetes 容器化部署问题的主流解决方案。接着,讲解如何针对应用服务去实现对应的operator。最后用Alluxio作为实际案例展示operator是如何实现的。
封面图

如何挖掘闲置硬件资源的潜力-PrestoDB缓存加速实践小结

2023-05-19
阅读 7 分钟
615
用户体验很重要,降本也很重要。做技术的都知道,加机器堆资源可以解决绝大多数的用户觉得慢的问题,但要加钱。没什么用户体验是开发不了的,但要排期,本质也要钱。在成本有限,包括机器资源和开发人力都有限的情况下,如何提升用户体验呢?
封面图

Alluxio跨集群同步机制的设计与实现

2023-03-23
阅读 8 分钟
569
Alluxio 位于存储和计算层之间,在不同的底层文件系统(UFS)上层提供高性能缓存和统一的命名空间。虽然通过 Alluxio 对 UFS 进行更新可使 Alluxio 与 UFS 保持一致,但在某些情况下, 例如在运行多个共享某一个或多个 UFS 命名空间的 Alluxio 集群时,结果可能并非如此。为了确保这种情况下的一致性,Alluxio 已经实现了...
封面图

ChatGPT:“Hello Alluxio,我为你写了一首诗!”

2023-02-13
阅读 2 分钟
710
新晋“网红”ChatGPT爆火网络,大家都很好奇ChatGPT究竟是什么?各种解读/研究的文章铺天盖地,但让小编更好奇的是:它眼中的Alluxio是怎样的?带着这份探知欲,我们聊了聊!
封面图

如何借力Alluxio推动大数据产品性能提升与成本优化?

2023-02-09
阅读 4 分钟
547
随着数字化不断发展,各行各业数据呈现海量增长的趋势。存算分离将存储系统和计算框架拆分为独立的模块,Alluxio作为如今主流云数据编排软件之一,为计算型应用(如 Apache Spark、Presto)和存储系统(如 Amazon S3、Alibaba OSS)的数据访问构建了桥梁。
封面图

2023年五大趋势预测 | 大数据分析、人工智能和云产业展望

2023-01-19
阅读 3 分钟
676
随着我们迈入2023年,大数据分析、人工智能和云产业将迎来蓬勃的创新和发展阶段以下是我们预测的,将对行业格局产生重大影响的五大趋势:世界在剧变,我们需要尽快寻找行业中的方向,迅速重回轨道2023年,全球经济层面的不确定性将持续存在。在云上部署数据密集型负载的企业需重新评估其云战略,更加关注成本优化,根据...

从“少林寺”毕业后,我当上了开源社区“区长”

2023-01-04
阅读 3 分钟
649
本期名人堂我们有幸邀请到了Alluxio创始成员兼开源社区副总裁范斌先生。范斌先生讲述了自己的求学、工作、加入开源社区的经历,以及对未来十年数据编排发展的展望,和对开发贡献者的一些建议。
封面图

如何用Alluxio加速云上深度学习训练?

2022-12-29
阅读 6 分钟
670
随着企业数据量的不断增加,为了提高深度学习训练的准确性、加快速度并且降低成本,许多企业开始逐步在云上实施分布式训练的方案,本期内容将结合阿里、微软等实际应用案例,分享如何通过Alluxio加速云上深度学习。
封面图

【蚂蚁】Alluxio在蚂蚁集团大规模训练中的应用

2022-12-28
阅读 7 分钟
1.2k
本期内容我们邀请到了来自蚂蚁集团的开发工程师陈传迎老师,给大家分享Alluxio在蚂蚁集团是如何支持大规模模型训练的。首先是关于引入Alluxio的背景:为什么要引入Alluxio?Alluxio到底解决了什么问题?带着这些问题,我们快速get陈老师分享的核心内容:第一部分:稳定性建设稳定性建设主要从两块进行:worker register ...
封面图

从博士论文到被各大厂应用,Alluxio 如何走过 7 年创业路

2022-12-06
阅读 3 分钟
715
今年 2 月,Alluxio 宣布以实现收入同比增长 3 倍的成绩结束了 2022 财年。“这个财年的业绩进一步表明了市场需要更好的方法来访问大规模分析和 AI/ML 应用程序中的数据,尤其是在分布式混合云和多云环境中。”Alluxio 创始人兼 CEO 李浩源表示。 
封面图

Alluxio 2.9新版发布 | 重塑架构,支持大规模多租户环境

2022-11-18
阅读 2 分钟
345
Alluxio 2.9 版本的主要新增功能包括:新增跨环境集群同步功能、增强Alluxio在Kubernetes上的可管理性、提高S3 API 安全性和用户体验。
封面图

大咖分享 | 如何构建 Alluxio 审计日志分析系统

2022-11-10
阅读 7 分钟
763
大数据技术日新月异,数据湖、数据中台、逻辑数据湖、数据编织、数据编排等数据建设理念不断出现、深化,究其根本依然是如何能够将数据规整起来,以统一的规范对数据的脉络进行梳理,形成统一的视图、统一的标准,实现业务层面的数据治理目标。
封面图

Alluxio 源码完整解析 | 你不知道的开源数据编排系统(下篇)

2022-10-26
阅读 16 分钟
820
本篇将在上篇的基础上,继续为大家讲述Alluxio中重点类详解,Alluxio中Block底层读写流程,Alluxio Client调用流程和 Alluxio内置的轻量级调度框架。
封面图

Alluxio 源码完整解析 | 你不知道的开源数据编排系统 (上篇)

2022-10-26
阅读 9 分钟
958
目前数据湖已成为大数据领域的最新热门话题之一,而什么是数据湖,每家数据平台和云厂商都有自己的解读。整体来看,数据湖主要的能力优势是:集中式存储原始的、海量的、多来源的、多类型的数据,支持数据的快速加工及计算。相比于传统的数据仓库,数据湖对数据有更大的包容性,支持结构化/半结构化/非结构化数据,能快...
封面图

一站式全覆盖数据 I/O 平台 - Alluxio 与 Aunalytics 的完美结合

2022-10-26
阅读 2 分钟
662
“Aunalytics云原生数据分析平台与Alluxio 的开源数据编排软件相结合,使客户能够进行跨所有数据源的统一访问,并驱动人工智能分析,产出更好的答案,获得竞争优势。”Aunalytics分析云首席技术官汤姆·帕诺佐
封面图

技术分享 | Presto性能对比测试:Kubernetes部署 VS 物理机部署

2022-10-11
阅读 7 分钟
1.1k
Presto是开源分布式SQL查询引擎,可以对从GB到PB级大小的数据源进行交互式分析查询。Presto支持Hive、Cassandra、关系型数据库甚至专有数据存储等多种数据源,允许跨源查询。(详见参考[1] )
封面图

Alluxio与北京大学计算机学院签署合作框架协议,推动产学研深度融合

2022-09-30
阅读 2 分钟
794
此次Alluxio与北京大学计算机学院达成合作框架协议,双方将在学术研究、人才培养、联合实验室、开源社区共建等方面展开深入合作,并将成立“云原生数据编排服务系统联合实验室”。
封面图

Presto on Alluxio By Alluxio SDS 单节点搭建

2022-09-27
阅读 6 分钟
711
急性子,想直接实操的,先绕过这个章节,直接看后边的实操步骤。把环境运行起来再看原理。Presto 的架构如下图所示,client 的请求,会递交给 Coordinator 进行处理,而元数据信息由 HiveMetaStore(HMS) 进行管理。那么表或分区的 location 信息,也在 HMS 中存放,因此,如果想把表或分区的数据放到其它存储系统里,则...
封面图

Alluxio Local Cache 监控指南 Alluxio Alluxio ​

2022-09-27
阅读 3 分钟
778
随着云计算在基础设施领域的市场份额持续上升,主流数据分析引擎纷纷选择独立扩展存储、计算来适配云基础设施,并以此为云提供商降低成本。但是,存储计算分离也为查询延迟带来了新的挑战,因为当网络饱和时,通过网络扫描大量数据将受到 IO 限制。此外,元数据也面临远程网络来检索的性能问题。
封面图

技能速成!教你10分钟内在电脑上配置运行Hive Metastore和Presto

2022-09-27
阅读 4 分钟
838
本教程将指导初学者在本地服务器上通过搭建Presto和Hive Metastore来查询S3上的数据。Presto是用于计划和执行查询的SQL引擎,S3为表分区文件提供存储服务,而Hive Metastore是为Presto访问表模式和位置信息提供catalog服务。本教程将展示如何一步一步安装并配置Presto和Hive MetaStore,从而查询存储在公有S3 bucket中的...
封面图

帮助 Meta 解决 Presto 中的数据孤岛问题

2022-09-27
阅读 6 分钟
635
Raptor 是用来支持 Meta(以前的 Facebook)中的一些关键交互式查询工作负载的 Presto 连接器(presto-raptor)。尽管 ICDE 2019 的论文 Presto:SQL on Everything([链接])中提到过这一特性,但它对于许多 Presto 用户来说仍然有些神秘,因为目前还没有关于此特性的可用文档。本文将介绍 Raptor 的历史,以及为什么 M...
封面图

Meta公司内部项目-RaptorX:将Presto性能提升10倍

2022-09-13
阅读 6 分钟
938
RaptorX是Meta(前“Facebook公司”,下文统称“Meta”)公司的一个内部项目名称,目的是为了降低查询延迟,让Presto的查询性能大大超越原生(vanilla) Presto,这篇文章介绍了RaptorX的关键模块——分层缓存。
封面图

【联通】数据编排技术在联通的应用

2022-09-13
阅读 11 分钟
733
欢迎来到【微直播间】,2min纵览大咖观点,本期分享的题目是数据编排技术在联通的应用。本次分享内容将围绕四个方面讲述Alluxio数据编排技术在联通的应用,主要围绕缓存加速、存算分离、混合负载以及轻量级分析四个不同的使用场景进行分享:
封面图

什么是数据编排

2022-08-26
阅读 1 分钟
964
[链接]