我有一个场景,我想在 spark DataFrame
的日期列中添加月份,它有两列数据类型(日期,整数)
例如
df.show()
data_date months_to_add
2015-06-23 5
2016-07-20 7
我想添加一个有新日期的新列(在现有日期上添加几个月后),输出如下所示 -
data_date month_to_add new_data_date
2015-06-23 5 2015-11-23
2016-07-20 1 2016-8-20
我试过下面的一段代码,但它似乎没有用——
df = df.withColumn("new_data_date", a
dd_months(col("data_date"), col("months_to_add")))
它给了我错误-
'Column' object is not callable
如果有任何方法可以在不在数据框之上使用 SQL 查询的情况下实现这一点,请帮助我。
原文由 anurag 发布,翻译遵循 CC BY-SA 4.0 许可协议
我会使用
expr
: