如何将 LabelEncoder 应用于 Pandas 数据框中的特定列

新手上路,请多包涵

我有一个由数据框加载的数据集,其中类标签需要使用来自 scikit-learn 的 LabelEncoder 进行编码。列 label 是具有以下类的类标签列:

 [‘Standing’, ‘Walking’, ‘Running’, ‘null’]

要执行标签编码,我尝试了以下但它不起作用。我该如何解决?

 from sklearn import preprocessing
import pandas as pd

df = pd.read_csv('dataset.csv', sep=',')
df.apply(preprocessing.LabelEncoder().fit_transform(df['label']))

原文由 Kristofer 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.3k
2 个回答

您可以尝试如下操作:

 le = preprocessing.LabelEncoder()
df['label'] = le.fit_transform(df.label.values)

或者以下也可以工作:

 df['label'] = le.fit_transform(df['label'])

它将用编码标签替换数据框中的原始值 label 值。

原文由 niraj 发布,翻译遵循 CC BY-SA 4.0 许可协议

你也可以这样做:

 from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df.col_name= le.fit_transform(df.col_name.values)

其中 col_name = 您要标记编码的特征

原文由 Darshan Jain 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题