关于JAVA和SPARK结合的困惑

在下是个初级JAVA,目前接手了一个任务做一个数据加工系统。拿一个连锁超市举例子,这个超市的老板通过我们的系统上传小票文件,然后我们根据文件中每一条小票上的店名,销售人员和商品信息,给这个超市老板出一个报表,比如说店销售额排名,人员销售额排名等等。但是可能文件很大,没办法一次性读到内存里计算,希望借助Spark来实现...在这里有一个困惑,就是如何使用JAVA自动将这个计算任务交给Spark并获取到结果...

阅读 1.6k
1 个回答

把java达成jar包提交到spark上.
把结果输入到hdfs集群上.

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题