celery处理10w级别的更新记录的任务，是创建10w个任务，还是创建一个任务扫表循环处理？各有何优势？

由于评论里不是很方便回答楼主的问题，就在这里做出评论里问题的回答了。
方案一：
增加celery的消费者，及将worker数量加大。
不建议，因为不可控因素较多，还可能达不到预期效果。
方案二（个人建议，可根据情况修改）：
自行增加判断标志位。
不知道楼主是怎样使用celery的，就假设通过redis完成的发布订阅任务操作了。

# 以定时任务的方式启动，没小时执行一次
@celery.task
def query_from_db():
  results = db.query
  for result in results:
    if redis.get(result.id):
      continue
    # 设置一个超时时间
    # update在一小时内成功，下次执行query_from_db任务时，仍会创建新的更新任务
    # update失败，超时后，redis删除result.id相应记录，即超时后会创建新的更新任务
    redis.set(result.id, 'something', two_hours)
    update_result.delay(result.id)
    
@celery.task
def update_result(result_id):
  result = db.query.get(result_id)
  rv = requests.get(.....)
  result.update(rv.json())
  redis.delete(result_id)

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

celery处理10w级别的更新记录的任务，是创建10w个任务，还是创建一个任务扫表循环处理？各有何优势？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？