我在 Pyspark
中有一个数据框。在这个数据框中,我有一列 timestamp
数据类型。现在我想在不创建任何新列的情况下为时间戳列的每一行添加额外的 2 小时。
例如:这是示例数据
df
id testing_time test_name
1 2017-03-12 03:19:58 Raising
2 2017-03-12 03:21:30 sleeping
3 2017-03-12 03:29:40 walking
4 2017-03-12 03:31:23 talking
5 2017-03-12 04:19:47 eating
6 2017-03-12 04:33:51 working
我想要像下面这样的东西。
df1
id testing_time test_name
1 2017-03-12 05:19:58 Raising
2 2017-03-12 05:21:30 sleeping
3 2017-03-12 05:29:40 walking
4 2017-03-12 05:31:23 talking
5 2017-03-12 06:19:47 eating
6 2017-03-12 06:33:51 working
我怎样才能做到这一点?
原文由 User12345 发布,翻译遵循 CC BY-SA 4.0 许可协议
一种方法,不需要显式转换并使用 Spark 间隔文字(具有可争论的可读性优势):
或者,完整的: