我有以下数据框:
print(df_a)
mukey DI PI
0 100000 35 14
1 1000005 44 14
2 1000006 44 14
3 1000007 43 13
4 1000008 43 13
print(df_b)
mukey niccdcd
0 190236 4
1 190237 6
2 190238 7
3 190239 4
4 190240 7
当我尝试加入这些数据框时:
join_df = df_a.join(df_b, on='mukey', how='left')
我收到错误:
*** ValueError: columns overlap but no suffix specified: Index([u'mukey'], dtype='object')
为什么会这样?数据帧确实有共同的 'mukey'
值。
原文由 user308827 发布,翻译遵循 CC BY-SA 4.0 许可协议
您发布的数据片段的错误有点神秘,因为没有共同的值,连接操作失败,因为值不重叠它需要您为左侧和右侧提供后缀:
merge
有效,因为它没有此限制: