在同一个模型上多次调用 fit() 有什么作用？

社区维基

发布于
2023-01-09

新手上路，请多包涵

After I instantiate a scikit model (eg LinearRegression ), if I call its fit() method multiple times (with different X and y data ），怎么了？它是否适合数据上的模型，就像我刚刚重新实例化模型（即从头开始）一样，或者它是否保留在之前调用 fit() 时已经适合的帐户数据？

尝试使用 LinearRegression （同时查看其源代码）在我看来，每次我调用 fit() 时，它从头开始适合，忽略任何先前调用相同方法的结果.我想知道这在一般情况下是否属实，我可以将这种行为用于 scikit 学习的所有模型/管道。

原文由 Fanta 发布，翻译遵循 CC BY-SA 4.0 许可协议

python 机器学习 scikit-learn

阅读 1.5k

2 个回答

社区维基

发布于
2023-01-09

✓ 已被采纳

如果您将执行 model.fit(X_train, y_train) 第二次 - 它将覆盖所有先前拟合的系数、权重、截距（偏差）等。

如果你只想适应你的数据集的一部分，然后通过适应新数据来改进你的模型，那么你可以使用估计器，支持“增量学习”（那些，实现 partial_fit() 方法）

原文由 MaxU - stop russian terror 发布，翻译遵循 CC BY-SA 4.0 许可协议

社区维基

发布于
2023-01-09

您可以在机器学习中互换使用术语 fit() 和 train() 词。根据您实例化的分类模型，可能是 clf = GBNaiveBayes() 或 clf = SVC() ，您的模型使用指定的机器学习技术。

一旦您调用 clf.fit(features_train, label_train) 您的模型就开始使用您已传递的特征和标签进行训练。

您可以使用 clf.predict(features_test) 进行预测。

如果您再次调用 clf.fit(features_train2, label_train2) 它将使用传递的数据再次开始训练并将删除之前的结果。您的模型将重置以下内部模型：

重量
拟合系数
偏见
和其他培训相关的东西……

如果您希望保留之前计算的内容并使用下一个数据进行额外训练，也可以使用 partial_fit() 方法

原文由 sgrpwr 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题