PowerData社区近期内推信息汇总

2023-02-22
阅读 6 分钟
82
原创 PowerData一笔墨 PowerData想要参与内推的同学可关注上方公众号点击“加入我们”,加入社区后可获取对应岗位推荐人的联系方式。以下内推岗位皆为PowerData成员提供,在此也感谢PowerData一笔墨对社区内推信息的登记与维护。岗位名称: 大数据开发工程师 公司名称: 东方财富信息股份有限公司 工作地点: 上海 学历要...

StreamPark 发布首个 Apache 版本 2.0.0|PowerData发来贺电

2023-02-21
阅读 5 分钟
105
StreamPark作为PowerData的合作伙伴,今天正式发布了首个Apache版本,后续PowerData社区也会邀请StreamPark社区的小伙伴进行技术分享活动,各位可以多多关注并参与StreamPark。

【优秀论文翻译】Realtime Data Processing at Facebook

2023-02-14
阅读 16 分钟
118
本文由PowerData钻石王老五贡献 姓名:胥朝辉 花名:钻石王老五 微信:wxid\_i8mczvku170k22 年龄:00后 工作经验:0年 工作内容:学生 自我介绍:我是一名来自武汉的大学生,对实时计算和数据仓库比较感兴趣 希望加入社区和大家探讨技术问题和交流前沿解决方案!

【万字长文】Spark较全知识点整理(内含脑图)

2023-02-13
阅读 16 分钟
190
姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

数据从业者的机器学习入门分享

2023-02-08
阅读 8 分钟
107
本文由PowerData飞绝贡献 姓名:雷鑫 花名:飞绝 微信:threekupup 年龄:90后 工作经验:3-5年 工作内容:算法,数分 自我介绍:大数据算法工程师一枚

搞懂 Spark 系列之 深入理解 Spark 内存管理

2023-02-07
阅读 6 分钟
112
本文由PowerData凌熙贡献 姓名:徐振超 花名:凌熙 微信:Faith\_xzc 年龄:95后 工作经验:无 工作内容:研究生 自我介绍:大数据方向小硕一枚,热衷于大数据技术,拥抱开源,乐于分享

对数据中台的梳理与思考

2023-01-31
阅读 8 分钟
158
本文由PowerData灵魂人物贡献 姓名:李奇峰 花名:灵魂人物 微信:bigdata\_qifeng 年龄:95后 工作经验:3-5年 工作内容:数仓,数开,数据中台,后端开发 自我介绍:一个对数据中台非常感兴趣的人

【Flink】checkPoint与savePoint应用

2023-01-11
阅读 4 分钟
156
本文由PowerData陆酒贡献 姓名:孙含亚 花名:陆酒 微信:S17696769327 年龄:95后 工作经验:3-5年 工作内容:数开,数仓,数分,方案 自我介绍:千里之行,始于足下。谋事在天,成事在我。

峰会倒计时 1 天!PowerData 预祝 Doris Summit 2022 成功举办!

2023-01-05
阅读 2 分钟
116
年度技术盛会 Doris Summit 2022 将在1 月 6 -7 日(本周五-周六)于线上举行。本次峰会分为核心技术解析、商业与数据生态、行业最佳案例 3 个论坛,对 Apache Doris 的最新技术趋势、行业最佳实践、数据上下游生态、企业级产品特性等进行全面解读,带你体验前所未有的技术盛宴。

海量数据同步首选 SeaTunnel Zeta 引擎正式发布!

2023-01-04
阅读 8 分钟
114
版本发布 PowerData 点亮 ⭐️ Star · 照亮开源之路[链接]版本发布今天,Apache SeaTunnel(incubating) 正式推出 2.3.0 正式版本,并正式发布自己的核心同步引擎 Zeta!此外,SeaTunnel 2.3.0 还带来了许多大家期待已久的新特性,包括支持 CDC、以及近百种 Connector 等。文档 [链接] 下载地址 [链接] 01主要更新SeaTunnel...

【万字长文】数仓构建理论

2023-01-03
阅读 13 分钟
116
本文由PowerData满一贡献 姓名:苏奕嘉 花名:满一 微信:fl\_manyi 年龄:95后 工作经验:3-5年 工作内容:架构,数开,后端,方案 自我介绍:ApacheDoris Contributor & SelectDB 生态研发工程师,使用 Doris 请 Call 我~

核心技术特性全面解读!Doris Summit 2022 主论坛议程介绍|即刻报名

2022-12-28
阅读 4 分钟
98
Doris Summit 2022 将于 1 月 6 -7 日在线上正式举办,本次峰会共分 2 天进行,首日上午为主论坛:核心技术解析,下午为商业与数据生态分论坛,7 日全天为行业用户最佳实践案例。大会汇聚了来自全球顶尖云厂商、一线互联网企业、明星创业公司以及开源领域的众多资深技术专家,旨在探讨和洞悉 Apache Doris 最新技术趋势...

搞懂 Spark 系列之 Spark Shuffle 的前世今生

2022-12-20
阅读 6 分钟
114
Shuffle 中文意思是“洗牌,混洗”,而在 Hadoop 的 MapReduce 框架中,Shuffle 是 Map 和 Reduce 中间必不可少的连接桥梁。数据在从Map 阶段结束经过 Shuffle 到 Reduce 阶段的过程中,涉及到磁盘的读写、网络传输和数据序列化,Shuffle 操作还会在磁盘上生成大量中间 文件,这些都是直接影响程序的性能的,因此,Shuff l...

Maxwell使用指南

2022-12-16
阅读 11 分钟
180
目前MySQL的同步工具有很多,Maxwell也是其中比较好的一个选择,本文就同步工具的优略,以及Maxwell的使用做一个较为详细的说明。

【分享】数据集成-从入门到实践

2022-12-14
阅读 3 分钟
123
大数据、物联网 (IoT)、软件即服务 (SaaS)、云活动等正在导致世界上现有的数据源数量以及数据量呈爆炸性增长,但这些数据大部分都收集并存储在数据孤岛或独立的数据存储空间中。

【中台】数据质量管理落地实施

2022-12-13
阅读 3 分钟
177
在企业数字化转型浪潮下,传统的质量管理手段已无法应对数字化转型中的数据质量管理需求,我们需要探索出一条数据独有的质量管理体系应对新的需求。本篇文章以数据质量管理为目标,探究数据质量背后的逻辑,并通过管理与技术手段进行落地。

PowerData社区发布会延期通知

2022-12-01
阅读 1 分钟
82
PowerData PowerData各位,因不可抗力原因,原定于2022-12-01 20:30的PowerData社区发布会,延期举行,具体时间请关注社区群内通知。

【2022-12-01 20:30】 PowerData社区发布会

2022-11-30
阅读 2 分钟
98
PowerData PowerData一、社区声明1、我们是谁我们是由一群数据从业人员,因为热爱凝聚在一起,以开源精神为基础,组成的PowerData数据之力社区。2、为什么是PowerDataPower代表力量, Data代表数据 PowerData代表我们想要将国内数据力量通过社区凝聚在一起,专注自我提升,推动行业发展。3、我们的目标1、吸引国内数据人...