头图

SeaTunnel 加入开源之夏!一起来拿奖金

SeaTunnel

又是一年【开源之夏】季。今年,Apache SeaTunnel(Incubating)参与到了【开源之夏】活动中来,希望有更多学生群体关注到 Apache SeaTunnel(Incubating),并踊跃参与项目共建拿奖金!

No.1 活动介绍

开源之夏是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,由中国科学院软件研究所与 openEuler 社区共同举办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展,培养和发掘更多优秀的开发者。

学生可自主选择感兴趣的项目进行申请,并在中选后获得社区导师亲自指导。根据项目的难易程度和完成情况,参与者还将获取开源之夏活动奖金和结项证书。

开源之夏活动官网:https://summer.iscas.ac.cn/

No.2 活动日程

No.3 项目介绍

SeaTunnel 是一个非常易用的超高性能分布式数据集成平台,支持海量数据的实时同步,每天可以稳定、高效地同步数百亿条数据,并已在近百家企业的生产中得到应用。

No.4 奖金设置

  • 进阶:奖金人民币 12000 元
  • 优化类的任务,例如提高性能,降低资源占有
  • 基础:奖金人民币 8000 元
  • 功能类的任务,例如为本社区开源项目增加一个或若干个重要特性等

No.5 课题介绍

本次活动,Apache SeaTunnel(Incubating)开源社区共设有 2 个项目课题具体如下,欢迎参与:

01 SeaTunnel指标系统设计开发

【项目编号】224010246

【项目难度】进阶

【编程语言】Java

【项目描述】实现 SeaTunnel 自己的指标系统,需要包含抽象接口来定义不同的指标数据传输方式的抽象,同时使用该抽象实现 1-2种具体指标传输方式(HTTP 接口,Prometheus 等)。指标包含SeaTunnel 数据指标以及通过接口获取的底层引擎指标(Spark 和 Flink),从而为用户提供统一的指标获取方案。

SeaTunnel 层面指标应该至少包含任务信息,运行时间,算子并行度等简单指标。

【项目产出要求】

完整的方案在社区讨论且获得社区认可

项目能够合并到社区主库

【项目技术要求】

数据同步监控领域知识

【项目成果仓库】

https://github.com/apache/incubator-seatunnel

【项目主导师】范佳

联系方式:fanjia1214@gmail.com

02 改进源/sink 插件的 E2E 测试模块

【项目编号】224010403

【项目难度】基础

【编程语言】Java

【项目描述】

SeaTunnel是一个高性能、分布式、海量的数据集成框架,由源、转换、sink 等插件组成。SeaTunnel 中有大量的插件,每个插件都有许多种参数,我们需要在 CI/CD 中使用 E2E(End-to-End)测试来保护插件的质量。

目前,SeaTunnel 的 E2E 模块包含一些基本的测试用例来测试SeaTunnel 的数据管道能否在 Flink 和 Spark 引擎上成功运行。在这个任务中,我们希望 SeaTunnel 的 E2E 模块能够覆盖大部分的连接器测试,包括 Kafka,MySQL,ElasticSearch等。

【项目产出要求】

完成现有的源和 sink 插件

【项目技术要求】

自学能力强,使用过Java、Flink、Spark、Docker 更好。

【项目成果仓库】

https://github.com/apache/incubator-seatunnel

【项目主导师】Wenjun

联系方式:bestruanwenjun@gmail.com

No.6 申请参与项目

01 申请资格

本活动面向年满 18 周岁在校学生。

暑期即将毕业的学生,只要在申请时学生证处在有效期内,就可以提交申请。

海外学生可提供录取通知书/学生卡/在读证明证明学生身份。

02 参与流程

03 申请建议

欢迎主动向导师发送邮件进行沟通,附上自己的方案和简历,让我们更加了解你;

认真了解社区项目文档,与导师充分沟通;

欢迎加入交流群交流。

Apache Seatunnel

Apache SeaTunnel(Incubating) 是一个分布式、高性能、易扩展、用于海量数据(离线&实时)同步和转化的数据集成平台。

仓库地址:

https://github.com/apache/incubator-seatunnel

网址:

https://seatunnel.apache.org/

Proposal:

https://cwiki.apache.org/confluence/display/INCUBATOR/SeaTunnelProposal

Apache SeaTunnel(Incubating) 2.1.0 下载地址:

https://seatunnel.apache.org/download

衷心欢迎更多人加入!

能够进入 Apache 孵化器,SeaTunnel(原 Waterdrop) 新的路程才刚刚开始,但社区的发展壮大需要更多人的加入。我们相信,在「Community Over Code」(社区大于代码)、「Open and Cooperation」(开放协作)、**「Meritocracy」(精英管理)、以及「多样性与共识决策」等 The Apache Way 的指引下,我们将迎来更加多元化和包容的社区生态,共建开源精神带来的技术进步!

我们诚邀各位有志于让本土开源立足全球的伙伴加入 SeaTunnel 贡献者大家庭,一起共建开源!

提交问题和建议:

https://github.com/apache/incubator-seatunnel/issues

贡献代码:

https://github.com/apache/incubator-seatunnel/pulls

订阅社区开发邮件列表 :

dev-subscribe@seatunnel.apache.org

开发邮件列表:

dev@seatunnel.apache.org

加入 Slack:

https://join.slack.com/t/apacheseatunnel/shared\_invite/zt-123jmewxe-RjB\_DW3M3gV~xL91pZ0oVQ

关注 Twitter:

https://twitter.com/ASFSeaTunnel

阅读 534

Apache SeaTunnel是下一代高性能、分布式、海量数据集成框架。通过我们的努力让数据同步更简单,更高效...

1 声望
0 粉丝
0 条评论

Apache SeaTunnel是下一代高性能、分布式、海量数据集成框架。通过我们的努力让数据同步更简单,更高效...

1 声望
0 粉丝
宣传栏