SeaTunnel毕业!首个国人主导的数据集成项目成为Apache顶级项目 | PowerData发来贺电

2023-06-01
阅读 14 分钟
33
北京时间 2023 年 6 月 1 日,全球最大的开源软件基金会 Apache Software Foundation(以下简称 ASF)正式宣布 Apache SeaTunnel 毕业成为 Apache 顶级项目(TLP, Top Level Project)。这是首个由国人主导并贡献到 ASF 的大数据集成领域的顶级项目,这一里程碑的达成标志着 SeaTunnel 在开源软件开发领域的突破,并为其在...

Apache Doris 常见适用场景浅析

2023-05-31
阅读 5 分钟
39
PowerData编者荐语:PowerData满一同学力作,狠狠支持!!!以下文章来源于Apache Doris 补习班 ,作者苏奕嘉[Apache Doris 补习班 .Apache Doris Active Contributor 和 SelectDB SA 来做的不定时更新,主打 Apache Doris 系列学习文章和相关信息、原理解析或者新特性使用教程,争取 All In 原创,欢迎投稿~](#)什么是 ...

Apache Doris 新书正式上市:今晚 8 点,与作者相约直播间,聊聊《Doris 实时数仓实战》!

2023-05-30
阅读 1 分钟
20
亲爱的社区小伙伴们,我们非常高兴地宣布,Apache Doris 新书《Doris 实时数仓实战》已正式上市!为了庆祝书籍出版上市,我们将于 5 月 30 日 20 点 举办一场线上发布会,与本书作者王春波及五位特邀嘉宾面对面一起聊聊新书《Doris 实时数仓实战》、谈谈 Apache Doris 使用心得!

【文中送书】Kafka与Pulsar该如何选择?

2023-05-18
阅读 9 分钟
23
原创 PowerData杨国栋 PowerData全文共 7496 个字,建议阅读时长:18 分钟转发并评论此文,评论区点赞数前五位分别送出一本《Apache Pulsar 原理解析与应用实践》统计截止时间:2023-05-19 12:00:00书籍领取方式:文末扫描作者二维码,申请加入社区查看中奖名单填写收货信息作者简介国栋,腾讯软件工程师,Apache Pulsar...

【实战讲解】数据血缘落地实施

2023-05-08
阅读 7 分钟
46
本文由PowerData灵魂人物贡献 姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

Apache 孵化项目被公然抄袭,开源世界真的会变得更好吗?

2023-04-27
阅读 4 分钟
18
StreamPark作为优秀的开源项目,也是PowerData的好朋友,如今被侵权,PowerData必须要站出来,替好朋友发声,维护一个良好的开源环境!

改变我人生的数据之路:一个普通男孩的十年

2023-04-14
阅读 4 分钟
41
本文由PowerData灵魂人物贡献 姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

【实战】CDH6.3.0集成Atlas2.1.0部署及使用

2023-04-10
阅读 26 分钟
19
本文由PowerData王昱翔贡献 姓名:王昱翔 花名:醉舞斜陽 微信:ycwziyan 年龄:85后 工作经验:10年以上 工作内容:运维,架构,数仓,数开 自我介绍:家穷人丑,一米八九,小学文化,农村户口,今来社区,紧跟大佬,苦练技术。

Spark面试热门考点

2023-04-06
阅读 10 分钟
26
本文由PowerData罗富良贡献 姓名:罗富良 花名:阿良 微信:Liang-Ace 年龄:95后 工作经验:0年 工作内容:学生 自我介绍:乐观晴朗,勤奋好学 内容介绍:文章内容主要根据大数据科班生富良同学在面试过程中总结的Spark热门问题,结合社区已有的Spark相关内容进行凝练,帮助大家复习以获得更好的面试表现;

美联物业基于Apache Doris数仓实践

2023-03-13
阅读 5 分钟
34
本文由PowerData谢帮桂贡献 姓名:谢帮桂 花名:谢帮桂 微信:xc606060\_ 年龄:90后 工作经验:5-10年 工作内容:数仓,数分 自我介绍:一美联物业数仓负责人,主要负责数仓规划和数据开发,下方是作者帅照喔。

PowerData满一同学 | 今晚20 点,手把手教你快速入门 Apache Doris Docker !

2023-03-09
阅读 2 分钟
27
本次活动由PowerData满一进行分享 姓名:苏奕嘉 花名:满一 微信:fl\_manyi 年龄:95后 工作经验:3-5年 工作内容:架构,数开,后端,方案 自我介绍:ApacheDoris Contributor & SelectDB 生态研发工程师,使用 Doris 请 Call 我~

Hbase相关知识点整理

2023-03-07
阅读 23 分钟
30
本文由PowerData灵魂人物贡献 姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

Kafka相关知识点整理

2023-02-28
阅读 25 分钟
27
本文由PowerData灵魂人物贡献 姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

从0到1介绍一下开源大数据比对平台dataCompare

2023-02-24
阅读 3 分钟
31
PowerData以下文章来源于诸葛子房的博客 ,作者诸葛子房[诸葛子房的博客 .前京东、BAT 程序员](#)1.背景&现状在大数据领域也已经工作了多年,无论所待过的大公司还是小公司,都会遇到集群升级迁移过程中据搬迁等相关工作,经常会碰到搬迁之后,搬迁的数据是不是能对的上呢?两边数据究竟是不是一致的呢?如果不一致...

PowerData社区近期内推信息汇总

2023-02-22
阅读 6 分钟
20
原创 PowerData一笔墨 PowerData想要参与内推的同学可关注上方公众号点击“加入我们”,加入社区后可获取对应岗位推荐人的联系方式。以下内推岗位皆为PowerData成员提供,在此也感谢PowerData一笔墨对社区内推信息的登记与维护。岗位名称: 大数据开发工程师 公司名称: 东方财富信息股份有限公司 工作地点: 上海 学历要...

StreamPark 发布首个 Apache 版本 2.0.0|PowerData发来贺电

2023-02-21
阅读 5 分钟
25
StreamPark作为PowerData的合作伙伴,今天正式发布了首个Apache版本,后续PowerData社区也会邀请StreamPark社区的小伙伴进行技术分享活动,各位可以多多关注并参与StreamPark。

【优秀论文翻译】Realtime Data Processing at Facebook

2023-02-14
阅读 16 分钟
23
本文由PowerData钻石王老五贡献 姓名:胥朝辉 花名:钻石王老五 微信:wxid\_i8mczvku170k22 年龄:00后 工作经验:0年 工作内容:学生 自我介绍:我是一名来自武汉的大学生,对实时计算和数据仓库比较感兴趣 希望加入社区和大家探讨技术问题和交流前沿解决方案!

【万字长文】Spark较全知识点整理(内含脑图)

2023-02-13
阅读 16 分钟
63
姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

数据从业者的机器学习入门分享

2023-02-08
阅读 8 分钟
28
本文由PowerData飞绝贡献 姓名:雷鑫 花名:飞绝 微信:threekupup 年龄:90后 工作经验:3-5年 工作内容:算法,数分 自我介绍:大数据算法工程师一枚

搞懂 Spark 系列之 深入理解 Spark 内存管理

2023-02-07
阅读 6 分钟
31
本文由PowerData凌熙贡献 姓名:徐振超 花名:凌熙 微信:Faith\_xzc 年龄:95后 工作经验:无 工作内容:研究生 自我介绍:大数据方向小硕一枚,热衷于大数据技术,拥抱开源,乐于分享

对数据中台的梳理与思考

2023-01-31
阅读 8 分钟
55
本文由PowerData灵魂人物贡献 姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

【Flink】checkPoint与savePoint应用

2023-01-11
阅读 4 分钟
41
本文由PowerData陆酒贡献 姓名:孙含亚 花名:陆酒 微信:S17696769327 年龄:95后 工作经验:3-5年 工作内容:数开,数仓,数分,方案 自我介绍:千里之行,始于足下。谋事在天,成事在我。

峰会倒计时 1 天!PowerData 预祝 Doris Summit 2022 成功举办!

2023-01-05
阅读 2 分钟
33
年度技术盛会 Doris Summit 2022 将在1 月 6 -7 日(本周五-周六)于线上举行。本次峰会分为核心技术解析、商业与数据生态、行业最佳案例 3 个论坛,对 Apache Doris 的最新技术趋势、行业最佳实践、数据上下游生态、企业级产品特性等进行全面解读,带你体验前所未有的技术盛宴。

海量数据同步首选 SeaTunnel Zeta 引擎正式发布!

2023-01-04
阅读 8 分钟
28
版本发布 PowerData 点亮 ⭐️ Star · 照亮开源之路[链接]版本发布今天,Apache SeaTunnel(incubating) 正式推出 2.3.0 正式版本,并正式发布自己的核心同步引擎 Zeta!此外,SeaTunnel 2.3.0 还带来了许多大家期待已久的新特性,包括支持 CDC、以及近百种 Connector 等。文档 [链接] 下载地址 [链接] 01主要更新SeaTunnel...

【万字长文】数仓构建理论

2023-01-03
阅读 13 分钟
36
本文由PowerData满一贡献 姓名:苏奕嘉 花名:满一 微信:fl\_manyi 年龄:95后 工作经验:3-5年 工作内容:架构,数开,后端,方案 自我介绍:ApacheDoris Contributor & SelectDB 生态研发工程师,使用 Doris 请 Call 我~

核心技术特性全面解读!Doris Summit 2022 主论坛议程介绍|即刻报名

2022-12-28
阅读 4 分钟
20
Doris Summit 2022 将于 1 月 6 -7 日在线上正式举办,本次峰会共分 2 天进行,首日上午为主论坛:核心技术解析,下午为商业与数据生态分论坛,7 日全天为行业用户最佳实践案例。大会汇聚了来自全球顶尖云厂商、一线互联网企业、明星创业公司以及开源领域的众多资深技术专家,旨在探讨和洞悉 Apache Doris 最新技术趋势...

搞懂 Spark 系列之 Spark Shuffle 的前世今生

2022-12-20
阅读 6 分钟
31
Shuffle 中文意思是“洗牌,混洗”,而在 Hadoop 的 MapReduce 框架中,Shuffle 是 Map 和 Reduce 中间必不可少的连接桥梁。数据在从Map 阶段结束经过 Shuffle 到 Reduce 阶段的过程中,涉及到磁盘的读写、网络传输和数据序列化,Shuffle 操作还会在磁盘上生成大量中间 文件,这些都是直接影响程序的性能的,因此,Shuff l...

Maxwell使用指南

2022-12-16
阅读 11 分钟
49
目前MySQL的同步工具有很多,Maxwell也是其中比较好的一个选择,本文就同步工具的优略,以及Maxwell的使用做一个较为详细的说明。

【分享】数据集成-从入门到实践

2022-12-14
阅读 3 分钟
32
大数据、物联网 (IoT)、软件即服务 (SaaS)、云活动等正在导致世界上现有的数据源数量以及数据量呈爆炸性增长,但这些数据大部分都收集并存储在数据孤岛或独立的数据存储空间中。

【中台】数据质量管理落地实施

2022-12-13
阅读 3 分钟
68
在企业数字化转型浪潮下,传统的质量管理手段已无法应对数字化转型中的数据质量管理需求,我们需要探索出一条数据独有的质量管理体系应对新的需求。本篇文章以数据质量管理为目标,探究数据质量背后的逻辑,并通过管理与技术手段进行落地。