尝试合并 2 个数据帧但得到 ValueError

这是我保存在两个变量中的两个数据框：

 > print(df.head())
>
          club_name  tr_jan  tr_dec  year
    0  ADO Den Haag    1368    1422  2010
    1  ADO Den Haag    1455    1477  2011
    2  ADO Den Haag    1461    1443  2012
    3  ADO Den Haag    1437    1383  2013
    4  ADO Den Haag    1386    1422  2014
> print(rankingdf.head())
>
           club_name  ranking  year
    0    ADO Den Haag    12    2010
    1    ADO Den Haag    13    2011
    2    ADO Den Haag    11    2012
    3    ADO Den Haag    14    2013
    4    ADO Den Haag    17    2014

我正在尝试使用以下代码合并这两个：

 new_df = df.merge(ranking_df, on=['club_name', 'year'], how='left')

添加 how=‘left’ 是因为我的ranking_df 中的数据点少于标准df 中的数据点。

预期的行为是这样的：

 > print(new_df.head())
>

      club_name  tr_jan  tr_dec  year    ranking
0  ADO Den Haag    1368    1422  2010    12
1  ADO Den Haag    1455    1477  2011    13
2  ADO Den Haag    1461    1443  2012    11
3  ADO Den Haag    1437    1383  2013    14
4  ADO Den Haag    1386    1422  2014    17

但我得到这个错误：

ValueError：您正在尝试合并 object 和 int64 列。如果你想继续，你应该使用 pd.concat

但我不想使用 concat ，因为我想合并树而不仅仅是添加它们。

另一个在我看来很奇怪的行为是，如果我将第一个 df 保存到 .csv 然后将该 .csv 加载到数据框中，我的代码就可以工作。

代码：

 df = pd.DataFrame(data_points, columns=['club_name', 'tr_jan', 'tr_dec', 'year'])
df.to_csv('preliminary.csv')

df = pd.read_csv('preliminary.csv', index_col=0)

ranking_df = pd.DataFrame(rankings, columns=['club_name', 'ranking', 'year'])

new_df = df.merge(ranking_df, on=['club_name', 'year'], how='left')

我认为它与 index_col=0 参数有关。但是我不知道无需保存就可以修复它，这并不重要，但我必须这样做是一种烦恼。

原文由 PEREZje 发布，翻译遵循 CC BY-SA 4.0 许可协议

阅读 613

尝试合并 2 个数据帧但得到 ValueError

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译