AI自己写代码让智能体进化!OpenAI的大模型有“人类思想”那味了( 二 )
文章图片
commit描述配合上提交前后代码对比的diff数据 , 就是AI绝佳的学习材料 。

文章图片
研究人员筛选出一些描述意图明确、修改的代码量不大的提交数据来训练一个GPT-3架构的AI模型 。
相当于让AI向人类程序员学习了如何有目的的修改一段代码 。
这篇论文所用的模型也不需要完全版GPT-3的1750亿参数那么大 , 最高7.5亿参数就足以 。

文章图片
由此得到了基础的AI模型 , 将在遗传算法中扮演变异算子的角色 。
接下来让AI自己设计新机器人的流程总共分三步 。

文章图片
第一步 , 先用经典的MAP-Elites算法生成一组初始机器人 。

文章图片
这是一种QD(质量多样性)算法 , 可以保证机器人行为不同且质量都很高 。

文章图片
第二步 , 用第一步产生的初始数据做预训练 , 让AI先学会设计出训练数据分布内的机器人 。
也就是开头处那张在网上惊艳了众人的动图 , 展示了AI如何一步步把无法移动的“方块”改造成双腿交替弹跳移动机器人 。

文章图片
第三步 , 再结合上强化学习算法做微调 , 让AI能根据不同地形条件生成能适应环境的机器人 。

文章图片

文章图片
最终 , 研究人员选取了从最初的三个种子进化而来的机器人做效果展示 。
可以看出它们的结构和移动方式都完全不同 。

文章图片
网友惊呼“思路清奇”这项研究一经公布 , 可谓是一石激起千层浪 。
许多网友都惊叹于这种“大模型+演进算法”结合的新奇方式:

文章图片
做过与之相关工作的研究人员也表示 , 从未想过能用大模型以diffs的形式来学习突变:

文章图片
【AI自己写代码让智能体进化!OpenAI的大模型有“人类思想”那味了】而除了对研究形式和本身的讨论之外 , 也有网友配上了这样图:

文章图片
Emmm……是有点那种味了 。
团队介绍这项研究的团队成员均来自OpenAI 。
论文一作是JoelLehman , 是一位机器学习科学家 。 其聚焦的领域包括人工智能安全、强化学习和开放式搜索算法 。

文章图片
与此同时 , JoelLehman此前基于对人工智能发展的思考合写过一本科学读物《为什么伟大不能被计划出来:客观的秘密》:

文章图片
而对于这项研究的下一步 , JoelLehman本人表示:
还有一个重要问题 , 就是模型能够多大程度上应用到其它环境中 。
GP中的突变功效现在可以通过ELM大幅提高 , 这将激发出一系列广泛的新应用和研究方向 。
- 苹果macntfs文件系统读写磁盘功能
- 一个手机号码只能注册一个华为账号|如何利用电子邮箱注册自己的华为账号
- 刘强东|夜半写给刘强东先生
- 很多人都想要自己组装一台电脑|华硕b360m主板分了多少种
- 55万人看《黑客帝国》没看明白,母体的源代码,其实是寿司食谱
- ssd|1TB SSD卖369元!梵想S500 Pro开箱体验:读写性能让人满意
- 足球|莫德里奇应中国球迷之邀吹魔笛 结果把自己逗笑了
- 【微服务】146:商品品牌业务后台Java代码编写
- 649元小米移动固态硬盘1tb发布:金属机身读写超2000m
- 节省两百元,自己动手更换小米手机后盖,师傅都夸我手艺好
