您现在所在的位置:主页 > 动态新闻 >
比佐为更强大 谷歌即将揭秘AlphaGo思路
发布日期:2021-12-09 16:57   来源:未知   阅读:

  在公众视线中,AlphaGo自从下完了与李世石的五盘棋之后就消失了。但事实上没那么简单,再过不久,AlphaGo及Deepmind团队通过与世界冠军古力、周鹤洋合作的方式,将通过发布新网站,来详解与李世石的五盘棋及AlphaGo自己对弈的三盘精选棋谱,用可视化的方式加入了AlphaGo在对弈过程中的分析及数据。或许今天的AlphaGo,要比动漫里面的Sai(佐为)更强大。

  前几个月科技界的媒体已经公布了AlphaGo的机器,由几个机架组成,在自然杂志公布的棋力上,这种分布式计算的AlphaGo有1920个CPU核心和280个GPU。不过看第二张图,谷歌的深度学习用的处理单元是定制的,那个螺丝显得工艺不是那么精致。就是这个机器,用更好的深度学习的方法和强大的计算能力,战胜了世界等级分第三的李世石九段。这个单元名字叫“张量处理单元”,(TensorProcessingUnit,TPU)。因此AlphaGo到底能否有个X86的版本,是未来的疑问。

  之前公众只是知道AlphaGo下围棋非常厉害,能赢世界冠军李世石就很说明问题。但是AlphaGo是如何思考的?这才是问题的关键。而即将放出的棋谱,则通过非常好的可视化形式,展现出来AlphaGo在对局过程中,机器认为李世石应该走的位置,并对其进行更深层次的计算。这次的研究员古力九段曾经发微博感慨过人工智能已经精进到了如此程度!

  有意思的是界面里面还会有AlphaGo对输赢的判断,即在后台的胜率分析,这个分析的准确性很高,因为结果也是随着胜率的一路走高,李世石出现了投子认负(当然第四盘出了bug是个意外,现在Deepmind团队表示更多训练之后已经没了这个问题)。有意思的是用户可以结合当时的各路直播来看当时人类的分析,与机器分析进行对比。比如第五盘,右下角下完之后感觉AlphaGo送了几个子,人类的高手普遍判断是形势上执黑的李世石稍好,但是机器的后台判断那时候AlphaGo的胜率是一直领先的,因为有一路爬回的手段。

  更为可怕的是此次Deepmind团队放出了三个机器自我对弈的棋谱,设定的机器每一步思考只有15秒的时间,但是从公布的棋谱看,似乎非常深奥,只能期待古力与周鹤洋这两位九段高手的理解了,因为对于AlphaGo,现在人类的棋艺已经难以企及它的高度,只能是从既有的围棋知识去做判断。

  欢迎扫码关注我们的公众号生活科技新知(lifeintech),上面会有很多独到内容哟!

  是第二次人机大战要开始了吗?并不是。而是谷歌的Deepmind团队,在对弈网站gokgs上,设置了一个对弈机器人!这个机器人不是别人,正是大名鼎鼎的AlphaGo!

  不过现在还都只是一些测试工作,并且工程师Aja黄,就是人机大战坐在李世石对面的那位Deepmind团队的人,在平台里面解释这只是做一些测试,没有谷歌的许可,是不可以开放这个AlphaGo机器人和KGS上的棋手对弈的,当然不止KGS,Deepmind团队在多个围棋对弈平台都布置有机器人。

  单机版、V20的AlphaGo到底会有多强?这需要谷歌的允许才会揭晓答案

  相比之下,这个对弈的机器人与几个月前人机大战的AlphaGo并不一样,是单机版的,CPU、GPU要少得多,因此搜索的线程更少,按理说棋力应该稍差,可问题是,这个版本和当时不同,当时李世石对弈的版本是V18,而这个是V20,也就是进化了两代,根据Deepmind团队的说法,如果一个版本的胜率对上一个版本要达到90%,才会被标注为一个全新版本,这已经进化了两次的V20到底有多强的棋力?相信一旦能正式上线与人对弈,全世界各路顶级职业棋手一定会排队与之对弈。

  今年3月的时候,谷歌来了中国,包括CEO皮查伊,也见了中国棋院的人以及棋圣聂卫平。这在当时让人产生联想,甚至一度传出来今年晚些时候在海南举办柯洁与AlphaGo的人机大战!世界排名第一VSAlphaGo!

  然而现在看这场比赛或许要泡汤,因为聂卫平这两天接受采访透露出来的意思是,人类棋手根本下不赢AlphaGo,绑一块一起下也下不赢,很可能就是非正式的打了退堂鼓。当然笔者是看热闹不嫌事儿大,当然希望有第二次人机大战。因为唯有如此,才能看看进化到V20或是更高版本的分布式AlphaGo到底强悍到了什么程度,人类最强的柯洁到底能不能赢,能赢几盘?

  其实围棋输了也没什么,中国象棋的电脑软件甚至让人一马也能赢,是人和电脑学习新套路,国际象棋卡斯帕罗夫输了两次之后,国际象棋界已经彻底服气,现在人根本下不过电脑。而到了围棋这里怎么就不肯正式的下一盘,输了也是人类智慧的胜利。人类普遍的共识是职业围棋早晚输给电脑,只是没想到居然这么快,这是难以承受的地方。

  人机大战AlphaGo在右下角脱先在上面还原成中国流布局,颠覆了以往局部定式的认知

  其实我反而觉得,围棋不可能像象棋、国际象棋那样容易的被穷举,因此AlphaGo的算法如果越强,那么人与之学习进步的空间也就越大,反而是推动人类围棋进步,比如很多定式机器改了走法,再比如对形势的判断等等,会产生大量根本性的理念与认知上的变革。围棋无止境,机器带着人加速进步难道是坏事吗?