说我的数据框是:
df = pandas.DataFrame([[[1,0]],[[0,0]],[[1,0]]])
产生:
0
0 [1, 0]
1 [0, 0]
2 [1, 0]
我想删除重复项,并且只获取元素 [1,0] 和 [0,0],如果我写:
df.drop_duplicates()
我收到以下错误:TypeError: unhashable type: ‘list’
我如何调用 drop_duplicates()?
更一般地说:
df = pandas.DataFrame([[[1,0],"a"],[[0,0],"b"],[[1,0],"c"]], columns=["list", "letter"])
我想调用 df[“list”].drop_duplicates(),所以 drop_duplicates 适用于系列而不是数据框?
原文由 user 发布,翻译遵循 CC BY-SA 4.0 许可协议
您可以使用
numpy.unique()
功能:如果你想保留订单结帐: numpy.unique with order preserved