如何获取 pandas 或 numpy 中列表列的唯一值,以便第二列来自
将导致 'action', 'crime', 'drama'
。
我能想到的最接近(但非功能性)的解决方案是:
genres = data['Genre'].unique()
但这可以预见地导致 TypeError 说明列表是如何不可哈希的。
TypeError: unhashable type: 'list'
Set 似乎是个好主意,但是
genres = data.apply(set(), columns=['Genre'], axis=1)
但也会导致 TypeError: set() takes no keyword arguments
原文由 hrokr 发布,翻译遵循 CC BY-SA 4.0 许可协议
如果您只想找到唯一值,我建议使用
itertools.chain.from_iterable
连接所有这些列表甚至更快
Timings