在同一个模型上多次调用 fit() 有什么作用?

新手上路,请多包涵

After I instantiate a scikit model (eg LinearRegression ), if I call its fit() method multiple times (with different X and y data ), 怎么了?它是否适合数据上的模型,就像我刚刚重新实例化模型(即从头开始)一样,或者它是否保留在之前调用 fit() 时已经适合的帐户数据?

尝试使用 LinearRegression (同时查看其源代码)在我看来,每次我调用 fit() 时,它从头开始适合,忽略任何先前调用相同方法的结果.我想知道这在一般情况下是否属实,我可以将这种行为用于 scikit 学习的所有模型/管道。

原文由 Fanta 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.5k
2 个回答

您可以在机器学习中互换使用术语 fit()train() 词。根据您实例化的分类模型,可能是 clf = GBNaiveBayes()clf = SVC() ,您的模型使用指定的机器学习技术。

一旦您调用 clf.fit(features_train, label_train) 您的模型就开始使用您已传递的特征和标签进行训练。

您可以使用 clf.predict(features_test) 进行预测。

如果您再次调用 clf.fit(features_train2, label_train2) 它将使用传递的数据再次开始训练并将删除之前的结果。您的模型将 重置 以下内部模型:

  • 重量
  • 拟合系数
  • 偏见
  • 和其他培训相关的东西……

如果您希望保留之前计算的内容并使用下一个数据进行额外训练,也可以使用 partial_fit() 方法

原文由 sgrpwr 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题