我有以下数据框:
import pandas as pd
import numpy as np
df1 = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
'B': 'one one two three two two one three'.split(),
'C': np.arange(8), 'D': np.arange(8) * 2})
print(df1)
A B C D
0 foo one 0 0
1 bar one 1 2
2 foo two 2 4
3 bar three 3 6
4 foo two 4 8
5 bar two 5 10
6 foo one 6 12
7 foo three 7 14
我希望通过 df2
选择 df1
中的行,如下所示:
df2 = pd.DataFrame({'A': 'foo bar'.split(),
'B': 'one two'.split()
})
print(df2)
A B
0 foo one
1 bar two
这是我在 Python 中尝试过的方法,但我只是想知道是否还有另一种方法。谢谢。
df = df1.merge(df2, on=['A','B'])
print(df)
这是预期的输出。
A B C D
0 foo one 0 0
1 bar two 5 10
2 foo one 6 12
根据另一个 DataFrame 选择一个 DataFrame 的列
原文由 ah bon 发布,翻译遵循 CC BY-SA 4.0 许可协议
最简单的是将
merge
与内部连接一起使用。另一种过滤解决方案:
或者创建
MultiIndex
并使用Index.isin
进行过滤: