After I instantiate a scikit model (eg LinearRegression
), if I call its fit()
method multiple times (with different X
and y
data ), 怎么了?它是否适合数据上的模型,就像我刚刚重新实例化模型(即从头开始)一样,或者它是否保留在之前调用 fit()
时已经适合的帐户数据?
尝试使用 LinearRegression
(同时查看其源代码)在我看来,每次我调用 fit()
时,它从头开始适合,忽略任何先前调用相同方法的结果.我想知道这在一般情况下是否属实,我可以将这种行为用于 scikit 学习的所有模型/管道。
原文由 Fanta 发布,翻译遵循 CC BY-SA 4.0 许可协议
如果您将执行
model.fit(X_train, y_train)
第二次 - 它将覆盖所有先前拟合的系数、权重、截距(偏差)等。如果你只想适应你的数据集的一部分,然后通过适应新数据来改进你的模型,那么你可以使用 估计器,支持“增量学习”(那些,实现
partial_fit()
方法)