用“符号”数字填充 DataFrame

新手上路,请多包涵

我有一个充满浮点数(正数和负数)和一些 NaN 的 DataFrame。我想用它的符号替换每个浮点数:

  • 如果它是 NaN -> 它仍然是 Nan
  • 如果为正 -> 替换为 1
  • 如果为负 -> 替换为 -1
  • 如果为零 -> 保留为 0

有什么建议可以进行这种大规模更换吗?

原文由 vsoler 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 490
2 个回答

您可以使用 boolean indexing

 import pandas as pd
import numpy as np

df = pd.DataFrame({'A':[-1,3,0,5],
                   'B':[4,5,6,5],
                   'C':[8,-9,np.nan,7]})

print (df)
   A  B    C
0 -1  4  8.0
1  3  5 -9.0
2  0  6  NaN
3  5  5  7.0

 print (df > 0)
       A     B      C
0  False  True   True
1   True  True  False
2  False  True  False
3   True  True   True

print (df < 0)
       A      B      C
0   True  False  False
1  False  False   True
2  False  False  False
3  False  False  False

df[df > 0] = 1
df[df < 0] = -1

print (df)
   A  B    C
0 -1  1  1.0
1  1  1 -1.0
2  0  1  NaN
3  1  1  1.0

原文由 jezrael 发布,翻译遵循 CC BY-SA 3.0 许可协议

您可以使用 np.sign

 df
Out[100]:
     A
0 -4.0
1  2.0
2  NaN
3  0.0

import numpy as np
np.sign(df["A"])

Out[101]:
0   -1.0
1    1.0
2    NaN
3    0.0
Name: A, dtype: float64

为了应用于所有列,您可以直接传递数据框:

 df
Out[121]:
          0         1         2         3
0 -2.932447 -1.686652       NaN -0.908441
1  1.254436  0.000000  0.072242  0.796944
2  2.626737  0.169639 -1.457195  1.169238
3  0.000000 -1.174251  0.660111  1.115518
4 -1.998091 -0.125095  0.000000 -0.506782

np.sign(df)
Out[122]:
     0    1    2    3
0 -1.0 -1.0  NaN -1.0
1  1.0  0.0  1.0  1.0
2  1.0  1.0 -1.0  1.0
3  0.0 -1.0  1.0  1.0
4 -1.0 -1.0  0.0 -1.0

原文由 ayhan 发布,翻译遵循 CC BY-SA 3.0 许可协议

推荐问题