Gravitino1,一个高性能、地理分布式的联合元数据湖项目,上周通过 Apache 软件基金会(ASF)孵化器的投票2,正式成为 ASF 孵化器项目,标志着该项目在全球开源社区中的地位和影响力得到了进一步的提升。
Gravitino 项目由 Datastrato 3 发起,自 2023 年开源以来,它作为多云数据目录,凭借强大而轻量级的功能,迅速引起了数据基础设施专业人士的广泛关注。它可以管理来自不同来源、类型和地区的元数据,支持多种类型的数据目录,如 Apache Hive 元存储、Apache Iceberg 表、关系存储、文件集、Apache Kafka 等消息系统,以及对 Trino、Apache Spark 和 Apache Flink 的多引擎支持。
这种统一的元数据访问对于利用各种存储格式和查询工具来管理其数据和 AI 资产的组织非常有用。使用统一元数据湖方法,Gravitino 能够在所有数据存储之上创建一个抽象层,并通过 RESTful API 提供服务。这样,用户无需管理许多分散的数据资产和孤立的数据源,而是可以让团队在一个地方处理数据,并以非侵入式方式加入他们自己喜欢的工具。
过去六个月,得益于来自领先技术公司如 Datastrato、小米、腾讯、Pinterest 和 Bilibili 等的开发者们的积极贡献,该项目社区快速发展和扩大。他们的参与不仅为 Gravitino 项目带来了领先的技术和生产级可用的标准,还确保了项目现有及新功能的持续开发和改进。
截至目前,Gravitino 全球贡献者超过 70 人,发布了 8 个release。随着成为 Apache 软件基金会的一部分以及该项目成立第一年的结束,这一趋势有望继续延续下去。
“我们预计 Gravitino 将成为新一代开放数据目录的事实标准。这项厂商中立的开源技术将进一步解决数据孤岛问题,使整个社区和生态系统受益。” ASF 成员、Datastrato 联合创始人兼首席执行官堵俊平表示。
Apache®, Apache Flink®, Apache Hive™, Apache Iceberg™, Apache Kafka® and Apache Spark™ are trademarks of the Apache Software Foundation.
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。