在 python/pandas 中清理多类型数据框的值,我想修剪字符串。我目前正在按照两个说明进行操作:
import pandas as pd
df = pd.DataFrame([[' a ', 10], [' c ', 5]])
df.replace('^\s+', '', regex=True, inplace=True) #front
df.replace('\s+$', '', regex=True, inplace=True) #end
df.values
这很慢,我可以改进什么?
原文由 mxdbld 发布,翻译遵循 CC BY-SA 4.0 许可协议
您可以使用
DataFrame.select_dtypes
选择string
列,然后选择 ---apply
功能str.strip
Notice: Values cannot be
types
likedicts
orlists
, because theirdtypes
isobject
.但如果只有几列使用
str.strip
: