• 11
谷歌发布新款AlphaGo:自学成才,训练3天即可100:0碾压旧版
统计 阅读时间大约2分钟(511字)

2017-10-19 谷歌发布新款AlphaGo:自学成才,训练3天即可100:0碾压旧版

另外,AlphaGo Zero在功耗上比它的前几代也更低。

【AI星球(微信ID:ai_xingqiu)】10月19日报道 (编译:叶展盛)

今日,谷歌旗下专注于人工智能研究的部门DeepMind公布了新版的AlphaGo,这款程序的围棋学习完全是靠自己完成的。

这个系统的名字叫AlphaGo Zero,它学习的材料就是自己和自己下围棋的结果,并采用了一种名为增强学习的机器学习技术。Zero的训练是持续不断的,它会在自己和自己下围棋的过程中学习高级的概念,并挑选出有利的落子位置和顺序。

在三天的学习后,这个系统已经能打败AlphaGo Lee,也就是之前DeepMind打败韩国围棋高手李世石的系统,比赛结果为100:0。在29天的训练后,AlphaGo Zero已经能打败AlphaGo Master(也就是今年年初打败世界冠军柯洁的系统),比赛结果为89:11。

这个结果显示,当考虑到不同的技术的效率差别,人工智能领域需要学习的东西其实还很多。AlphaGo Master的设计方法和AlphaGo Zero非常相似,但是它一开始是利用人类棋手的数据训练,随后才开始自行学习的。

值得注意的是,AlphaGo Zero在这一周的训练中学习了几个关键概念,而且它学习的方法和人类不一样,比如围棋中的“征子”,也就是以形似楼梯的落子方法,它几乎是人类棋手的入门课程,但根据DeepMind在《自然》杂志上公布的,Zero是在训练后期才明白这个概念的。

另外,AlphaGo Zero在功耗上比它的前几代也更低。AlphaGo Lee需要使用数台机器,外加48块谷歌的张量处理单元以加快机器学习,再之前的版本AlphaGo Fan需要使用176块图形处理单元。AlphaGo Zero和AlphaGo Master只需要一台机器和四块张量处理单元。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×