如何合并大部分重复的行

我的一些数据看起来像：

 date, name, value1, value2, value3, value4
1/1/2001,ABC,1,1,,
1/1/2001,ABC,,,2,
1/1/2001,ABC,,,,35

我正在努力达到可以跑步的程度

data.set_index(['date', 'name'])

但是，对于原样的数据，当然有重复项（如上所示），所以我不能这样做（而且我不想要一个有重复项的索引，我不能简单地删除_duplicates（），因为这会丢失数据）。

我希望能够强制将具有相同 [date, name] 值的行合并为一行，如果它们可以基于某些值为 NaN 的值成功收敛（类似于 combine_first() 的行为）。例如，以上将结束于

date, name, value1, value2, value3, value4
1/1/2001,ABC,1,1,2,35

如果两个值不同并且一个不是 NaN，则这两行不应收敛（这可能是我需要跟进的错误）。

（为了扩展上面的例子，实际上可能有任意数量的行——给定任意数量的列——它们应该能够汇聚成一行。）

这感觉像是一个应该可以通过熊猫解决的问题，但我很难找到一个优雅的解决方案。

原文由 severian 发布，翻译遵循 CC BY-SA 4.0 许可协议

阅读 321