请问Spark'DataFrame只对一列进行编辑(截取一段)并返回新的DataFrame该怎么写

请问Spark'DataFrame只对一列进行编辑(截取一段)并返回新的DataFrame该怎么写

阅读 5.2k
1 个回答

可以map一下

 val session = SparkSession.builder().config(sc).getOrCreate()
    try {

      val df = session.read.json("file:\\\\\\E:/anc.json")
        .map(new MapFunction[Row, String] {
          override def call(value: Row): String = {
            value.getAs[Long]("id").toString.substring(0, 1)
          }
        }, Encoders.STRING)

      df.show()

    } finally {
      session.close()
    }
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进