我是熊猫的新手，并试图弄清楚如何同时向熊猫添加多列。任何帮助在这里表示赞赏。理想情况下，我想一步完成，而不是多个重复步骤…… import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, 7]} df = pd.DataFrame(df) df[[ 'column_new_1', 'column_new_2','column_new_3']] = [np.nan, 'dogs',3] #thought this would work here... 原文由 runningbirds 发布，翻译遵循 CC BY-SA 4.0 许可协议

如何在一项作业中向熊猫数据框添加多列？

2 个回答

发布于
2022-09-21

✓ 已被采纳

我本来希望你的语法也能工作。出现问题是因为当您使用列列表语法（ df[[new1, new2]] = ... ）创建新列时，pandas 要求右侧是 DataFrame（请注意，DataFrame 的列是否实际上并不重要与您正在创建的列具有相同的名称）。

您的语法适用于将标量值分配给现有列，pandas 也很乐意使用单列语法（ df[new1] = ... ）将标量值分配给新列。所以解决方案要么将其转换为几个单列赋值，要么为右侧创建一个合适的 DataFrame。

以下是几种可行的 _方法_：

 import pandas as pd
import numpy as np

df = pd.DataFrame({
    'col_1': [0, 1, 2, 3],
    'col_2': [4, 5, 6, 7]
})

然后是以下之一：

1）三赋值合一，使用列表解包：

 df['column_new_1'], df['column_new_2'], df['column_new_3'] = [np.nan, 'dogs', 3]

2) `DataFrame` 方便地扩展单行以匹配索引，因此您可以这样做：

 df[['column_new_1', 'column_new_2', 'column_new_3']] = pd.DataFrame([[np.nan, 'dogs', 3]], index=df.index)

3）用新列制作一个临时数据框，然后与原始数据框合并：

 df = pd.concat(
    [
        df,
        pd.DataFrame(
            [[np.nan, 'dogs', 3]],
            index=df.index,
            columns=['column_new_1', 'column_new_2', 'column_new_3']
        )
    ], axis=1
)

4）与前面类似，但使用 `join` 而不是 `concat` （可能效率较低）：

 df = df.join(pd.DataFrame(
    [[np.nan, 'dogs', 3]],
    index=df.index,
    columns=['column_new_1', 'column_new_2', 'column_new_3']
))

5) 使用 dict 是一种比前两种更“自然”的方式来创建新数据框，但新列将按字母顺序排序（至少在 Python 3.6 或 3.7 之前）：

 df = df.join(pd.DataFrame(
    {
        'column_new_1': np.nan,
        'column_new_2': 'dogs',
        'column_new_3': 3
    }, index=df.index
))

6) 使用 `.assign()` 与多个列参数。

我非常喜欢@zero 的答案中的这个变体，但与前一个一样，新列将始终按字母顺序排序，至少对于早期版本的 Python：

 df = df.assign(column_new_1=np.nan, column_new_2='dogs', column_new_3=3)

7）这很有趣（基于 https://stackoverflow.com/a/44951376/3830997 ），但我不知道什么时候值得麻烦：

 new_cols = ['column_new_1', 'column_new_2', 'column_new_3']
new_vals = [np.nan, 'dogs', 3]
df = df.reindex(columns=df.columns.tolist() + new_cols)   # add empty cols
df[new_cols] = new_vals  # multi-column assignment works for existing cols

8）最后很难击败三个独立的任务：

 df['column_new_1'] = np.nan
df['column_new_2'] = 'dogs'
df['column_new_3'] = 3

注意：许多这些选项已经在其他答案中介绍过： Add multiple columns to DataFrame and set them equal to an existing column , Is it possible to add multiple columns to a pandas DataFrame? , 向 pandas DataFrame 添加多个空列

原文由 Matthias Fripp 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

1

发布于
2022-09-21

您可以将 assign 与列名和值的字典一起使用。

 In [1069]: df.assign(**{'col_new_1': np.nan, 'col2_new_2': 'dogs', 'col3_new_3': 3})
Out[1069]:
   col_1  col_2 col2_new_2  col3_new_3  col_new_1
0      0      4       dogs           3        NaN
1      1      5       dogs           3        NaN
2      2      6       dogs           3        NaN
3      3      7       dogs           3        NaN

原文由 Zero 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

如何在一项作业中向熊猫数据框添加多列？

1）三赋值合一，使用列表解包：

2) `DataFrame` 方便地扩展单行以匹配索引，因此您可以这样做：

3）用新列制作一个临时数据框，然后与原始数据框合并：

4）与前面类似，但使用 `join` 而不是 `concat` （可能效率较低）：

5) 使用 dict 是一种比前两种更“自然”的方式来创建新数据框，但新列将按字母顺序排序（至少在 Python 3.6 或 3.7 之前）：

6) 使用 `.assign()` 与多个列参数。

7）这很有趣（基于 https://stackoverflow.com/a/44951376/3830997 ），但我不知道什么时候值得麻烦：

8）最后很难击败三个独立的任务：

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

如何在一项作业中向熊猫数据框添加多列？

1）三赋值合一，使用列表解包：

2) DataFrame 方便地扩展单行以匹配索引，因此您可以这样做：

3）用新列制作一个临时数据框，然后与原始数据框合并：

4）与前面类似，但使用 join 而不是 concat （可能效率较低）：

5) 使用 dict 是一种比前两种更“自然”的方式来创建新数据框，但新列将按字母顺序排序（至少 在 Python 3.6 或 3.7 之前）：

6) 使用 .assign() 与多个列参数。

7）这很有趣（基于 https://stackoverflow.com/a/44951376/3830997 ），但我不知道什么时候值得麻烦：

8）最后很难击败三个独立的任务：

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

分解质因素的算法很难，理解不了。 请问有哪位大佬可以进行解释一下呢？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Stack Overflow 翻译

2) `DataFrame` 方便地扩展单行以匹配索引，因此您可以这样做：

4）与前面类似，但使用 `join` 而不是 `concat` （可能效率较低）：

5) 使用 dict 是一种比前两种更“自然”的方式来创建新数据框，但新列将按字母顺序排序（至少在 Python 3.6 或 3.7 之前）：

6) 使用 `.assign()` 与多个列参数。

分解质因素的算法很难，理解不了。请问有哪位大佬可以进行解释一下呢？