如何在列表中找到重复项并使用它们创建另一个列表?

新手上路,请多包涵

如何在整数列表中找到重复项并创建另一个重复项列表?

原文由 MFB 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 491
2 个回答

要删除重复项,请使用 set(a) 。要打印重复项,例如:

 a = [1,2,3,2,1,5,6,5,5,5]

import collections
print([item for item, count in collections.Counter(a).items() if count > 1])

## [1, 2, 5]

请注意, Counter 不是特别有效( 计时)并且可能在这里过度杀伤。 set 会表现更好。此代码按源顺序计算唯一元素列表:

 seen = set()
uniq = []
for x in a:
    if x not in seen:
        uniq.append(x)
        seen.add(x)

或者,更简洁地说:

 seen = set()
uniq = [x for x in a if x not in seen and not seen.add(x)]

我不推荐后一种风格,因为 not seen.add(x) 正在做什么并不明显(set add() 方法总是返回 None ,因此需要 not )。

要计算没有库的重复元素列表:

 seen = set()
dupes = []

for x in a:
    if x in seen:
        dupes.append(x)
    else:
        seen.add(x)

或者,更简洁地说:

 seen = set()
dupes = [x for x in a if x in seen or seen.add(x)]

如果列表元素不可散列,则不能使用集合/字典,而必须求助于二次时间解决方案(将每个元素与每个元素进行比较)。例如:

 a = [[1], [2], [3], [1], [5], [3]]

no_dupes = [x for n, x in enumerate(a) if x not in a[:n]]
print no_dupes # [[1], [2], [3], [5]]

dupes = [x for n, x in enumerate(a) if x in a[:n]]
print dupes # [[1], [3]]

原文由 georg 发布,翻译遵循 CC BY-SA 4.0 许可协议

一个非常简单的解决方案,但复杂度为 O(n*n)。

 >>> xs = [1,2,3,4,4,5,5,6,1]
>>> set([x for x in xs if xs.count(x) > 1])
set([1, 4, 5])

原文由 Ritesh Kumar 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题