活动图

阿里巴巴大数据+AI Meetup 重磅上线!

阿里巴巴大数据+AI Meetup 重磅上线!

2020-06-03 周三 16:00 —— 2020-06-14 周日 17:00
线上
活动介绍

近年来,随着工业界多年的努力以及新兴技术的不断涌现,数据规模庞大的问题已逐步得到解决,而数据处理的时效性、数据价值的挖掘正成为企业及开发者面临的新的巨大挑战。也因此,大数据计算引擎、AI、数据仓库、数据湖等成为当前无可争议的热门话题。

  • 当前大数据计算引擎各有千秋,如何选择适合自己的?
  • 数据仓库、数据湖、HSAP 架构,它们究竟能解决什么问题?
  • 机器学习平台那么多,好用的有哪些?

KV 2350*1000.png

6月14日,阿里巴巴计算平台事业部与阿里云开发者社区共同举办的大数据+AI Meetup 系列第一季即将重磅开启,此次 Meetup 邀请了来自阿里巴巴、Databricks、快手、网易云音乐的7位技术专家,集中解读大数据当前热门话题!

▼ 活动亮点 ▼

> 超豪华嘉宾阵容!
多位资深技术专家在线分享对行业趋势的洞察!
> 极丰富干货分享!
集结大数据热门议题,一次看完:
数据处理、数仓、数据湖、AI 等技术实践与生产应用落地。
> 多种奖品拿到手软!
直播间已准备超多精美礼品,现场送送送!
预约直播并参与互动即有机会领走哦。

本次 Meetup 您将了解:

  1. Spark 3.0 有哪些新功能
  2. 从 Lambda 架构到 HSAP,数仓未来趋势如何
  3. 流批一体机器学习算法平台 Alink 易用性的提升
  4. Flink + Kafka 在网易云音乐的落地实践
  5. 数据湖如何解决数据实时入库问题
  6. 2020 春晚活动中快手实时链路保障独家实践分享
  7. Flink 1.11 最新版本功能特性深度解读

如何观看:

图片描述

《深入研究 Apache Spark 3.0 的新功能》

李潇 | Databricks Spark 研发部主管

图片描述

嘉宾简介:

李潇,就职于 Databricks,Spark 研发部主管,领导 Spark,Koalas,Databricks runtime,OEM 的研发团队。Apache Spark Committer、PMC 成员。2011 年从佛罗里达大学获得获得了博士学位。曾就职于 IBM,获发明大师称号(Master Inventor),是异步数据库复制和一致性验证的领域专家,发表专利十余篇。(Github: gatorsmile)

演讲简介:

Apache Spark 3.0旨在实现更快、更轻松、更智能的目标,本次发布提供了3000多种已解决的JIRA。涵盖以下功能: accelerator-aware scheduling, adaptive query execution, dynamic partition pruning, join hints, new query explain, better ANSI compliance, observable metrics, new UI for structured streaming, new built-in functions, new unified interface for Pandas UDF, and various enhancements in the built-in data sources [e.g., parquet, ORC and JDBC].

在本次演讲中,我们将一起讨论这些新开发的令人兴奋的功能点,以及将来的重要计划,也会更多与国内社区同学分享和演示示例。

《从 Lambda 架构到 HSAP,实时数仓的演进之路》

姜伟华(果贝) | 阿里巴巴 资深技术专家

28.png

嘉宾简介:

姜伟华博士,阿里巴巴资深技术专家。曾长期在 Intel、唯品会等公司工作。在 Intel期间,创建并负责 Intel 大数据研发团队,创立 Intel 大数据发行版,并连续多年保持国内市场占有率第一。领导 Intel 大数据开源,团队涌现出 10+ Apache Committer,创立两个 Apache 项目。曾获 Intel 最高奖(Intel Achievement Award)和 Intel 中国最高奖(Intel China Award)。在唯品会期间负责大数据平台与 AI 平台。现在阿里巴巴从事新一代大数据交互式分析引擎的研发工作。

演讲简介:

Lambda架构是目前做实时数仓的标准方案,但是它的弊端也随着业务更加精细化的诉求变得愈发明显,简化的架构HSAP由此应运而生,究竟什么是HSAP,HSAP平稳落地该如何设计?HSAP落地后如何实现数仓向前方的赋能?在本次分享中我们将会一一给到解答。

主要内容包括:

1.Lambda架构的痛点
2.什么是HSAP
3.HSAP平稳落地--Hologres
4.基于Hologres的实时数仓

《Alink:提升基于 Flink 的机器学习平台易用性》

杨旭(品数)| 阿里巴巴 资深算法专家

29.png

嘉宾简介:

杨旭(品数),阿里巴巴资深算法专家,阿里云机器学习平台 PAI 中基础机器学习算法的负责人。2004 年获南开大学数学博士学位;随后在南开大学信息学院从事博士后研究工作;2006 年加入微软亚洲研究院,进行符号计算、大规模矩阵计算及机器学习算法研究;2010 年加入阿里巴巴,从事大数据相关的统计和机器学习算法研发,2017 年带领团队研发基于Flink的流批一体的机器学习平台 Alink,现已开源。出版《重构大数据统计》,《机器学习在线:解析阿里云机器学习平台》等著作。

演讲简介:

Alink 是基于Flink的流批一体的机器学习平台,提供的一系列算法,可以帮助处理各种机器学习任务,比如统计分析、机器学习、实时预测、个性化推荐和异常检测。除了提供Java API也提供了PyAlink,可以轻松部署到单机及集群环境,通过Jupyter、Zepplin等notebook使用。Alink已在阿里巴巴内部支持了众多的应用场景,并在2019年11月的Flink Forward Asia大会上宣布开源,随后不断迭代发布新的版本,增强功能,提升易用性。

《Flink + KafKa 在网易云音乐的应用实战》

岳猛 | 网易云音乐 实时计算平台研发工程师

图片描述

嘉宾简介:

岳猛,网易云音乐 实时计算平台研发工程师,Apache Flink Contributor。先后任职杭州华为技术有限公司大数据平台,网易杭研 sloth 实时计算平台,网易云音乐 magina 实时计算平台。目前负责网易云音乐实时计算平台的研发,在开源领域是 ZK,Calcite,Apache Flink 项目的 Contributor。

演讲简介:

主要介绍基于flink+kafka在云音乐的应用实践,包括kafka流表元数据管理以及使用,使用flink+ kafka构建实时数据分发功能以及基于flink + kafka实时特征构建场景下的一些策略和思考。

《Delta Lake 如何帮助云用户解决数据实时入库问题》

辛庸 | 阿里巴巴 技术专家

31.png

嘉宾简介:

辛现银,花名辛庸,阿里巴巴计算平台事业部 EMR 技术专家。Apache Hadoop,Apache Spark contributor。对 Hadoop、Spark、Hive、Druid 等大数据组件有深入研究。目前从事大数据云化相关工作,专注于计算引擎、存储结构、数据库事务等内容。

演讲简介:

Delta Lake 自发布以来得到了业界广泛的关注,其提供的 ACID 支持、历史版本回溯、UPDATE/DELETE/MERGE INTO 语法支持等功能完美契合了用户对数据湖内容管理的需求;其 Multi-Hop 架构的流批一体设计极大简化了用户运维数据管道的成本,使得传统的 ETL 流程进化为更灵活的 ELT+ 流程。

在本次演讲中,我们将分享 EMR 是如何利用 Delta Lake 帮助用户解决数据实时入库的问题,以及在这个过程中我们对 Delta Lake 做了哪些有益的提升和探索。

《Apache Flink 快手春晚项目的落地》

刘建刚 | 快手 开发工程师

32.png

嘉宾简介:

刘建刚,快手开发工程师。毕业于北京航空航天大学,曾就职于百度,目前就职于快手,从事实时计算方向。

演讲简介:

本次分享主要介绍,2020春晚活动下,快手内部为保障公司实时链路业务需求所做的保障工作。包括:实时任务的分级保障方案,整体链路稳定性保障,以及典型业务场景及压测保障方案等。最终在一系列保障下,实时链路顺利抗住春晚压力,保障活动顺利完成。

《Flink 1.11 Table&SQL 深度解读》

李劲松(之信) | 阿里巴巴 技术专家

7之信.png

嘉宾简介:

李劲松,花名之信,Apache Flink Committer,2014 年起专注于阿里内部 Galaxy 流计算框架;2017 年起开始 Flink 研发,主要专注于 Batch 计算、数据结构与类型。

演讲简介:

Flink SQL 1.11 又是一个较大提升的版本,完成了多项 features 来提升SQL的易用性和功能,不但加强了流处理领域的易用性和灵活性,还大力发展了Flink在流批统一架构中发挥的作用,主要内容是:

1.DDL易用性提升
2.Change table重构
3.Hive Streaming Source&Sink&Join
4.Hive DDL Dialect
5.Filesystem connector

以上为本次 Meetup 详细嘉宾介绍,6月14日 10:00,大数据+AI Meetup 直播间期待您的到来,还有更多精美礼品,参与互动即可领取!点击下方链接即可预约 Meetup 直播~

https://developer.aliyun.com/live/2894?spm=a2c6h.12873587.0.0...

Tips:了解更多 Meetup 信息可钉钉扫描下方二维码进群咨询。

图片描述
(大数据 + AI Meetup 交流群)

发布于 2020-06-03
0 条评论
组织者