我有一个包含两列的 pyspark 数据框:
[Row(zip_code='58542', dma='MIN'),
Row(zip_code='58701', dma='MIN'),
Row(zip_code='57632', dma='MIN'),
Row(zip_code='58734', dma='MIN')]
如何从列内的数据中创建键值对?
例如:
{
"58542":"MIN",
"58701:"MIN",
etc..
}
出于性能原因,我想避免使用 collect 。我已经尝试了一些东西,但似乎无法获得 values 。
原文由 too_many_questions 发布,翻译遵循 CC BY-SA 4.0 许可协议
正如 Ankin 所说,您可以为此使用 MapType :
输出:
输出: