这是我的数据框:
d = {'col1': ['sku 1.1', 'sku 1.2', 'sku 1.3'], 'col2': ['9.876.543,21', 654, '321,01']}
df = pd.DataFrame(data=d)
df
col1 col2
0 sku 1.1 9.876.543,21
1 sku 1.2 654
2 sku 1.3 321,01
col2 中的数据是本地格式的数字,我想将其转换为:
col2
9876543.21
654
321.01
我尝试了 df['col2'] = pd.to_numeric(df['col2'], downcast='float')
,它返回一个 ValueError: : Unable to parse string “9.876.543,21” at position 0。
我也尝试 df = df.apply(lambda x: x.str.replace(',', '.'))
,它返回 ValueError: could not convert string to float: ‘5.023.654.46’
原文由 andrej 发布,翻译遵循 CC BY-SA 4.0 许可协议
如果可能,最好使用
read_csv
中的参数:如果不可能,那么
replace
应该有帮助: