多智能体强化学习如何处理决策（动作）不同步的问题？

发布于
2020-12-02

目前看了一些多智能体强化学习算法，如VDN、QMIX等，好像都是在Dec-POMDP模型上建立的，但是MDP相关的模型都要求一个联合动作空间，多个智能体的动作需要同时做出，但实际问题中，多个智能体的动作往往是不同步的，这种情况应该如何处理？

算法机器学习人工智能深度学习

阅读 3.6k

1 个回答

发布于
2020-12-25

没有动作也是可以当做一个动作吧，action-state，作为输入。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题