看python的spark实现源码和scala原生源码有什么不同?

用python做spark开发

IDE用pycharm,在pycharm中加断点debug的时候,会跳转到对应python的spark部分实现。

但是我想看看scala的源码,scala原生源码和python的实现部分源码,有什么不同?

对spark运行调度和内核的实现是否一样?对学习的理解有什么差别?

图片描述

阅读 5.7k
2 个回答

pyspark 其实底层就是 scala,只是写了一些接口封装一下,建议看一眼源码,,

新手上路,请多包涵

不想自己setup scala的IDE的话可以用insight.io看apache spark的源码,比如这个是RDD的实现
https://insight.io/github.com...

spark的核心代码都是scala写的,python的spark只是把核心代码进行了封装。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题