Windows下搭建spark

lifehack

2015-07-30

阅读 1 分钟

安装环境

JDK 1.7
scala 2.11.7
hadoop-winutils 2.6.0
spark 1.3.1

安装步骤

安装JDK、scala解释器、hadoop-winutils、spark
配置JAVA_HOME、SCALA_HOME、HADOOP_HOME环境变量
运行spark目录下/bin/spark-shell.cmd

测试代码

用这里的wordCount代码，在spark-shell上运行

scala$ spark-shell
scala> val file = sc.textFile("<input file>")
scala> val counts = file.flatMap(line => line.split(" ")).map(word => (word, 1)).reduceByKey(_ + _)
scala> counts.saveAsTextFile("<output file>")

可以在<output file>/part-00000（可能不只一个输出结果文件）中看到结果

spark

阅读 3.9k发布于 2015-07-30

lifehack

134 声望6 粉丝

« 上一篇

【Java】从一段程序看关键字finally

编辑利器Sublime Text 2

引用和评论

推荐阅读

IntelliJ IDEA与eclipse快捷键比较

lifehack赞 3阅读 8.9k

【活动回顾】StarRocks Singapore Meetup #2 @Shopee

StarRocks阅读 594

鹰角：EMR Serverless Spark 在《明日方舟》游戏业务的应用

阿里云大数据AI阅读 483

Spark on K8s 在vivo大数据平台的混部实战

vivo互联网技术阅读 478

最佳实践 | 在 EMR Serverless Spark 中实现 Doris 读写操作

阿里云大数据AI阅读 478

最佳实践 | 在 EMR Serverless Spark 中实现 StarRocks 读写操作

阿里云大数据AI阅读 472

立马耀：通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统，驱动个性化推荐业务

阿里云大数据AI阅读 461

0 条评论

得票最新

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。