活动介绍:
数据治理是一个很宏大的概念,包括但不限于指标治理、数仓治理、成本治理、规范治理、埋点治理、报表治理,基本能够涵盖数据团队方方面面的工作,是每个公司数据团队的核心工作之一。治理的核心目的是为了提升数据的质量,改善数据使用的效率,但因每个公司所处的阶段不同,遇到的问题不同,解决问题的侧重不同,所以大家具体的落地点和执行方向也不同,但最终的目的一致,基本属于殊途同归。本次沙龙邀请到网易数帆、阿里云及得物App的四位技术专家,希望与业界同行一起交流,共同成长。
演讲嘉宾
潘成 - 网易数帆软件工程师,Apache Kyuubi (Incubating) PPMC成员
分享主题:《降本增效, Spark在网易的成本优化实践》
- 计算成本优化
1.1 动态资源分配
1.2 治理数据倾斜
1.3 存算分离 - 存储成本优化
2.1 小文件治理
2.2 Z-Order
2.3 兼顾计算与存储
陆俭彪 - 数据专家,得物App 离线数仓TL,ODPS成本治理owner
分享主题:《得物离线数仓ODPS成本治理实践》
- 离线数仓ODPS成本治理背景
- 治理思路
- 治理经验总结
范茸 - 阿里云技术专家
分享主题:《DataWorks介绍及全链路数据治理实践 》
- DataWorks数据治理概述
- DataWorks数据治理详解
- 全链路治理最佳实践
- 总结
程晗 - 得物App 数据平台TL
分享主题:《得物埋点治理实践》
- 过往问题
- 埋点设计
- 数据流方案
- 质控机制
欢迎大家报名参与,可以在得物技术公众号回复「数据」进群交流。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。