新手上路，请多包涵

这是我的数据框：

 d = {'col1': ['sku 1.1', 'sku 1.2', 'sku 1.3'], 'col2': ['9.876.543,21', 654, '321,01']}
df = pd.DataFrame(data=d)
df

       col1           col2
0   sku 1.1   9.876.543,21
1   sku 1.2            654
2   sku 1.3         321,01

col2 中的数据是本地格式的数字，我想将其转换为：

我尝试了 df['col2'] = pd.to_numeric(df['col2'], downcast='float') ，它返回一个 ValueError: : Unable to parse string “9.876.543,21” at position 0。

我也尝试 df = df.apply(lambda x: x.str.replace(',', '.')) ，它返回 ValueError: could not convert string to float: ‘5.023.654.46’

原文由 andrej 发布，翻译遵循 CC BY-SA 4.0 许可协议

python python-3.x pandas

阅读 621

2 个回答

得票最新

社区维基

发布于
2022-11-16

✓ 已被采纳

如果可能，最好使用 read_csv 中的参数：

 df = pd.read_csv(file, thousands='.', decimal=',')

如果不可能，那么 replace 应该有帮助：

 df['col2'] = (df['col2'].replace('\.','', regex=True)
                        .replace(',','.', regex=True)
                        .astype(float))

原文由 jezrael 发布，翻译遵循 CC BY-SA 3.0 许可协议

社区维基

发布于
2022-11-16

您总是最好使用现有的标准系统设施。知道某些语言环境使用逗号和小数点的方式不同，我无法相信 Pandas 不会使用语言环境的格式。

果然，快速搜索揭示了这个要点，它解释了如何使用语言环境将字符串转换为数字。本质上，您需要 import locale 并在构建数据帧调用之后 locale.setlocale 建立一个使用逗号作为分隔符的小数点和句点的语言环境，然后应用数据帧的 applymapp 方法。

原文由 holdenweb 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

在熊猫数据框中搜索和替换点和逗号

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何实现一个深拷贝函数？

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译