Spriteworld是一个基于python的RL环境,由一个可以自由移动的简单形状的二维竞技场组成。该环境是为文章“COBRA:基于数据有效模型的RL通过无监督对象发现和好奇心驱动的探索”(Watters等,2019)中介绍的COBRA代理开发的。环境的动机是为程序生成多对象场景提供尽可能多的灵活性,同时保留尽可能简单的界面。
Spriteworld精灵有各种形状,可以在位置,大小,颜色,角度和速度上不断变化。环境有遮挡但没有物理,所以默认情况下sprite会相互传递,但不会以任何方式碰撞或交互。可以通过动作空间引入交互,动作空间可以每个时间步更新所有精灵。例如,DiscreteEmbodied动作空间(请参阅spriteworld/action_spaces.py参考资料)实现了一种基本的物理形式,其中一个代理的身体精灵可以粘附并携带精灵。
有各种各样的动作空间,其中一些是连续的(如触摸屏),其他动作空间是离散的(就像一个采用不连续步骤的具体代理)。
GitHub地址:https://github.com/deepmind/s...
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。