有没有一种简单的方法来跟踪 joblib.Parallel 执行的整体进度?
我有一个由数千个作业组成的长时间运行的执行,我想在数据库中跟踪和记录这些作业。但是,要做到这一点,每当 Parallel 完成任务时,我需要它执行回调,报告剩余的作业数量。
我之前使用 Python 的 stdlib multiprocessing.Pool 完成了类似的任务,方法是启动一个线程来记录 Pool 作业列表中待处理作业的数量。
查看代码,Parallel 继承了 Pool,所以我想我可以使用相同的技巧,但它似乎并没有使用这些列表,而且我一直无法弄清楚如何“读取”它的内部状态任何其他方式。
原文由 Cerin 发布,翻译遵循 CC BY-SA 4.0 许可协议
为什么不能简单地使用
tqdm
?以下对我有用