多项式拟合,由于数据量少引起的过拟合如何优化?

现在是这样,横坐标只有18个,每个横坐标对应的纵坐标有26w个,所以一共是26w*18个点在图上。
如果把散点图画出来,会看见有18条分布在这18个横坐标上的竖直线(其实是很多个点)

对这些点进行聚类(过拟合的情况下10以内个类最优),聚类完后,对每一类进行多项式拟合,分别把1-9作为最高阶数来拟合,取分数最高的。结果每次都是最大阶数为9时最高,当限制为1-19,则是19阶最高。

过拟合很严重
有没有办法优化

阅读 3.5k
1 个回答

最简单使用lasso。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题