如何将函数应用于两列 Pandas 数据框

Question

新手上路，请多包涵

假设我有一个 df 有 'ID', 'col_1', 'col_2' 列。我定义了一个函数：

f = lambda x, y : my_function_expression 。

Now I want to apply the f to df ’s two columns 'col_1', 'col_2' to element-wise calculate a new column 'col_3' , somewhat like ：

 df['col_3'] = df[['col_1','col_2']].apply(f)
# Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments (1 given)'

怎么做？

** 添加详细示例如下\*\*\*

 import pandas as pd

df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]})
mylist = ['a','b','c','d','e','f']

def get_sublist(sta,end):
    return mylist[sta:end+1]

#df['col_3'] = df[['col_1','col_2']].apply(get_sublist,axis=1)
# expect above to output df as below

  ID  col_1  col_2            col_3
0  1      0      1       ['a', 'b']
1  2      2      4  ['c', 'd', 'e']
2  3      3      5  ['d', 'e', 'f']

原文由 bigbug 发布，翻译遵循 CC BY-SA 4.0 许可协议

python pandas dataframe

阅读 601

1 个回答

得票最新

社区维基

1

发布于
2022-09-21

在 Pandas 中有一种简洁的单行方式：

 df['col_3'] = df.apply(lambda x: f(x.col_1, x.col_2), axis=1)

这允许 f 成为具有多个输入值的用户定义函数，并使用（安全）列名而不是（不安全）数字索引来访问列。

数据示例（基于原始问题）：

 import pandas as pd

df = pd.DataFrame({'ID':['1', '2', '3'], 'col_1': [0, 2, 3], 'col_2':[1, 4, 5]})
mylist = ['a', 'b', 'c', 'd', 'e', 'f']

def get_sublist(sta,end):
    return mylist[sta:end+1]

df['col_3'] = df.apply(lambda x: get_sublist(x.col_1, x.col_2), axis=1)

print(df) 的输出：

   ID  col_1  col_2      col_3
0  1      0      1     [a, b]
1  2      2      4  [c, d, e]
2  3      3      5  [d, e, f]

如果您的列名包含空格或与现有数据框属性共享名称，则可以使用方括号进行索引：

 df['col_3'] = df.apply(lambda x: f(x['col 1'], x['col 2']), axis=1)

原文由 ajrwhite 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

如何将函数应用于两列 Pandas 数据框

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译