在看spark的mlib包,用的是Java语言,发现把包导入后本地机器直接run就可以跑出结果,看日志感觉是每次都启动spark进程的,helloworld级别的跑一次也要好几秒,想问问你们一般是怎么开发调试的?
IDE 利用自动补全写代码。
sbt package 编译。
spark-submit 提交代码到本地搭建的spark 跑任务。