OpenAI 发布了一个程序化生成环境，可以评价智能体泛化技能学习

阅读 1 分钟

0

OpenAI发布了用于评价强化学习智能体泛化技能学习的程序化生成环境——Procgen Benchmark。

Procgen Benchmark是一套由16个程序生成的类似游戏的环境，用于在样本效率和增强学习中的泛化做基准测试。

经验证明，不同的环境分布对于充分训练和评估强化学习智能体是至关重要的，从而促进程序内容生成的广泛使用。

然后，研究人员使用此基准来研究缩放模型大小的影响，发现较大的模型可以显著提高样本效率和泛化能力。

OpenAI博客：

https://openai.com/blog/procgen-benchmark/

论文地址：

http://t.cn/AigsB50N

本文系转载，阅读原文

https://www.qbitai.com/2019/12/9579.html

阅读 95发布于 2019-12-04

量子位

58 声望20k 粉丝

一家专注于人工智能与前沿科技领域的产业服务平台。

« 上一篇

亚马逊新一代数据中心处理器芯片，对标英特尔、AMD

下一篇 »

泰伯邀您一起洞见2020：探寻产业拐点·深度进化融合

引用和评论

推荐阅读

全员免费！GPT-4.1上线ChatGPT，首波实测：又快又没油腻感

量子位

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。