我有这个 PySpark 数据框
+-----------+--------------------+
|uuid | test_123 |
+-----------+--------------------+
| 1 |[test, test2, test3]|
| 2 |[test4, test, test6]|
| 3 |[test6, test9, t55o]|
我想将列 test_123
转换成这样:
+-----------+--------------------+
|uuid | test_123 |
+-----------+--------------------+
| 1 |"test,test2,test3" |
| 2 |"test4,test,test6" |
| 3 |"test6,test9,t55o" |
所以从列表是字符串。
我怎样才能用 PySpark 做到这一点?
原文由 Dkova 发布,翻译遵循 CC BY-SA 4.0 许可协议
您可以创建一个
udf
加入 _数组/列表_,然后将其应用于 测试 列:初始数据框是从以下内容创建的: