我有一个带有目标变量的数据集,它可以有 7 个不同的标签。我的训练集中的每个样本只有一个目标变量标签。
对于每个样本,我想计算每个目标标签的概率。所以我的预测将包括每行 7 个概率。
在 sklearn 网站上,我阅读了有关多标签分类的内容,但这似乎不是我想要的。
我尝试了以下代码,但这只为每个样本提供了一个分类。
from sklearn.multiclass import OneVsRestClassifier
clf = OneVsRestClassifier(DecisionTreeClassifier())
clf.fit(X_train, y_train)
pred = clf.predict(X_test)
有人对此有什么建议吗?谢谢!
原文由 Bert Carremans 发布,翻译遵循 CC BY-SA 4.0 许可协议
您只需删除
OneVsRestClassifer
并使用predict_proba
方法DecisionTreeClassifier
。您可以执行以下操作:这将为您提供 7 个可能类别中每个类别的概率。
希望有帮助!