Spark - Spark Submit使用

阅读 1 分钟

1

Spark Submit用于启动集群中的应用程序，他的运行命令跟Spark Shell差不多。

./bin/spark-submit \
  --class <main-class> \
  --master <master-url> \
  --deploy-mode <deploy-mode> \
  --conf <key>=<value> \
  ... # other options
  <application-jar> \
  [application-arguments]

--class：应用程序的入口
--master：master URL，这个同Spark Shell
deploy-mode：部署模式，默认client
application-jar：jar包地址
application-arguments：应用程序入口的参数

其他参数也和Spark Shell差不多，可以通过$SPARK_HOME/bin/spark-submit --help查看。
下面我们用Spark自带的程序来计算Pi。类似的例子可以参考官网

$SPARK_HOME/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://bigdata01:7077,bigdata03:7077 \
--executor-memory 512m \
--total-executor-cores 2 \
$SPARK_HOME/examples/jars/spark-examples_2.11-2.4.5.jar \
100

运行过程中的web界面，运行时通过http://bigdata01:4040/jobs 访问：

运行结果如下：

http://bigdata01:8080/可以看到，已经完成了两次Applications，在Completed Applications中还可以看到运行的信息

阅读 2.1k更新于 2021-08-05

大军

850 声望185 粉丝

学而不思则罔，思而不学则殆

« 上一篇

Spark - Spark Shell使用

下一篇 »

Spark - RDD使用

引用和评论

被 2 篇内容引用

推荐阅读

trino -- 查询流程解析

大军阅读 899

【活动回顾】StarRocks Singapore Meetup #2 @Shopee

StarRocks阅读 592

鹰角：EMR Serverless Spark 在《明日方舟》游戏业务的应用

阿里云大数据AI阅读 480

Spark on K8s 在vivo大数据平台的混部实战

vivo互联网技术阅读 474

最佳实践 | 在 EMR Serverless Spark 中实现 Doris 读写操作

阿里云大数据AI阅读 472

最佳实践 | 在 EMR Serverless Spark 中实现 StarRocks 读写操作

阿里云大数据AI阅读 469

立马耀：通过阿里云 Serverless Spark 和 Milvus 构建高效向量检索系统，驱动个性化推荐业务

阿里云大数据AI阅读 459

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。