我有一个这样的 .csv 文件:
stack2@domain.example,2009-11-27 01:05:47.893000000,domain.example,127.0.0.1
overflow@domain2.example,2009-11-27 00:58:29.793000000,domain2.example,255.255.255.0
overflow@domain2.example,2009-11-27 00:58:29.646465785,domain2.example,256.255.255.0
...
我必须从文件中删除重复的电子邮件(整行)(即上例中包含 overflow@domain2.example
的行之一)。如何仅在字段 1(以逗号分隔)上使用 uniq
?根据 man
, uniq
没有列选项。
我尝试了 sort | uniq
但它不起作用。
原文由 Eno 发布,翻译遵循 CC BY-SA 4.0 许可协议
-u
用于唯一-t,
所以逗号是分隔符-k1,1
用于关键字段1测试结果: