有一个较大的dataframe,几百万条记录。怎样:
(1)最快地判断是否存在重复项?也就是只要有重复项就可以,不必标记那一项。
(2)最方便地判断是否存在重复项?也就是代码写得最少
谢谢
有一个较大的dataframe,几百万条记录。怎样:
(1)最快地判断是否存在重复项?也就是只要有重复项就可以,不必标记那一项。
(2)最方便地判断是否存在重复项?也就是代码写得最少
谢谢
2 回答5.2k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
2 回答859 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
https://pandas.pydata.org/pan...