因为作业要用到这个SPARK和python, 就着手开始配置,但是搜了一圈还是发现了不少雷。就把我自己的解决办法发上来:
打开pycharm,导入已有的或者新建工程。
2.创建新的run configurition。
如右上角所示,选择edit configurition。
设置环境,创建PYTHONPATH和SPARK_HOME
配置路径如图所示,都可以在Spark安装路径下找到:
4.选择 File->setting->你的project->project structure
右上角Add content root添加:py4j-some-version.zip和pyspark.zip的路径(这两个文件都在Spark中的python文件夹下,自己找一下)
5.保存,ok
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。