scikit-learn 中的“详细”参数

新手上路,请多包涵

许多 scikit-learn 函数都有一个 verbose 论点,根据他们的文档,“[c]控制冗长:越高,消息越多”(例如, GridSearchCV )。

不幸的是,没有提供关于允许使用哪些整数的指南(例如,用户可以将详细程度设置为 100 吗?)以及什么级别的详细程度对应于哪些整数。我无法在文档中的任何地方找到此信息。

我的问题是,哪些整数映射到哪些冗长级别?

原文由 Gyan Veda 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 410
2 个回答

正如文档字符串所说,更高的整数映射到更高的冗长程度。您可以设置 verbosity=100,但我很确定它与 verbosity=10 相同。如果您要查找每个整数的每个估计量的确切打印内容列表,则必须查看源代码。我认为大多数估算器只有两到三个级别的冗长,我认为 3 或以上将是您可以获得的最冗长的级别。

原文由 Andreas Mueller 发布,翻译遵循 CC BY-SA 3.0 许可协议

可能有点晚了,但是因为我在设置 GridSearch 时偶然发现了同样的问题,所以我在子模块最深处的文档字符串中找到了这个 sklearn\externals\joblib\parallel.py

“详细级别:如果非零,则打印进度消息。超过 50,输出将发送到标准输出。消息的频率随着详细级别的增加而增加。如果超过 10,则报告所有迭代。”

此外, 词汇表(搜索“verbose”)是这样说的:

“目前 Scikit-learn 中的日志记录处理不是很一致,但是当它作为一个选项提供时,通常可以使用 verbose 参数来选择不记录日志(设置为 False)。任何 True 值都应该启用一些日志记录,但更大的整数(例如 10 以上)可能需要完整的详细信息。详细日志通常打印到标准输出。使用默认的详细设置,估算器不应在标准输出上产生任何输出。”

原文由 s6hebern 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题