拳打AlphaLee,脚踢AlphaMaster,全新AlphaZero实现自我学习
2017-10-20
据报道,《自然》杂志刊登了谷歌DeepMind团队的新成果,名为AlphaZero(暂译:阿尔法元)的机器系统仅训练3天就战胜了AlphaGo Lee,比分100:0,后者就是战败李世石的那套,经过40天训练后,Alpha Zero又以89:11战胜了Alpha Master,即横扫柯洁的那套。
据介绍,更令人震惊的是,Alpha Zero的设计理念和系统配置完全和Lee/Master不同,它不依托于人类的先验成果,完全靠自我对弈学习下棋。此前,Lee/Master都是用上千盘人类业余和专业棋手的棋谱进行训练。同时,Zero仅配置了4个TPU,Lee则是48个谷歌TPU计算单元。
对于这一进步,人类围棋现世界第一柯洁以及前世界冠军古力分别发表看法,柯洁称:“一个纯净、纯粹自我学习的alphago是最强的...对于alphago的自我进步来讲...人类太多余了。”
本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。