

京东众筹绿色直通车——赴筹者联盟路演项目征集中。
了解详情可点击页面最下方“原文链接”。

今天是AlphaGo与李世石的人机大战的第一天。首局在经历了三个半小时后,李世石投子认输,AlphaGo执白186手中盘取胜。
在四个月前,很多人认为AlphaGo击败李世石基本不可能,有些人认为AlphaGo去年底击败了欧洲冠军樊麾,所以挑战(前)世界冠军应有希望。但是,樊麾只是职业二段(Elo 3000左右),而李世石是职业九段(ELO 3532)。这两位的差别是巨大的,完全不能混为一谈。但是经过这四个月AlphaGo进步很多。
首先我们先来了解一下此场对弈的比赛规则。
比赛规则
人类超一流大师对阵强大的AI,比赛在韩国首尔进行。双方在3月9日、10日、12日、13日、15日共进行5局比赛,获胜方赢得100万美元奖金,如果 AlphaGo赢了,奖金会捐赠给联合国儿童基金会(unicef)、STEM(科学、技术、工程、数学)教育和围棋等相关慈善团体。比赛采用中国规则,黑贴3又3/4子(黑贴7目半)。双方各有两个小时的布局时间,3次60秒的读秒。
那么AlphaGo是什么?
AlphaGo是其谷歌旗下的人工智能公司DeepMind开发的一款围棋人工智能程序,它将多种应激神经网络与人工智能技术结合在一起,从近万盘人类高手的棋局和3千万次自我对战重中总结经验,可以说它是一位老道而且经验十足的围棋“大师”。
去年10月,脸书开发的人工智能AlphaGo在与欧洲冠军樊麾进行了5盘对决,比赛的用时是每方1小时,1分钟读秒,并且樊麾不让子(曾经人机对抗时人类棋手都要让子),最终,樊麾以0:5落败,“阿尔法围棋”成为首款战胜职业棋手的计算机围棋软件。
AlphaGo如何运行?
深度学习人类大师的方式。
人机在国际象棋领域的对抗早已被世人熟知,但在围棋方面则完全不同。
在大多棋类游戏里,计算机可以通过“暴力穷举”的方式,演算出所有取胜的方案。在国际象棋里,平均每回合有35种可能,一盘棋可以有80回合。但围棋每回合有250种可能,一盘棋可以长达150回合,棋盘上的排列组合比宇宙中的原始原子还多。
但AlphaGo并不是通过暴力演 算的AI,研发团队为其加入了“策略网络”和“值网络”,让软件根据棋盘形势选出较有前途的方案进行计算。换句话说,就是让软件像人类一样思考。更可怕的是,策略网络可以模仿人类大师下棋,“人类或许一年能玩1000局,但机器一天就能玩数百万局,这还是保守估计。”研发团队表示。
AlphaGo进步的方法有两个:
(1)增加硬件:从Nature的文章可以看到:从1202个CPU到1920个CPU,AlphaGo的ELO只增加了28,而且线性地增加CPU,不会看到线性的ELO成长。若要达到364ELO积分的提升,需要的CPU将达到天文数字。当然,谷歌有钱有机器,但是纯粹加机器将会碰到并行计算互相协调的瓶颈(就是说假设有十万万台机器,它们的总计算能力很强,但是彼此的协调将成为瓶颈)。在几个月之内增加两个数量级的CPU并调节算法,降低瓶颈,应该不容易。
(2)增加学习功能:AlphaGo有两种学习功能,第一种是根据高手棋谱的学习,第二种是自我对弈,自我学习。前者已经使用了16万次高手比赛,而后者也在巨大机组上训练了8天。这方面肯定会有进步,但是要超越世界冠军可能不容易。最后,换一种分析方式:如果从过去深蓝击败世界冠军的“成长过程”来看,深蓝大约1993年达到职业大师水平,4年后才在一场六盘的比赛中击败世界冠军(大约500Elo积分点的提升)。

一个月前,搜狗CEO王小川在知乎发文称,这次对弈,谷歌人工智能AlphaGo将完胜职业围棋手李世石。“深度学习的魅力在于只要一个领域里能够建模,并有充足的数据,就能够在这个领域里让机器做到超越人、取代人。”他认为,“除了围棋,人工智能在其他博弈类的封闭游戏里,也会横扫一切,完胜人类。”
李开复则表示,“这次谷歌AlphaGo打败李世石或许比较悬,但是1-2年内AI会完胜人类。”
在围棋界,业内人士对于博弈结果的预测目前更倾向于相信棋手的实力。中国著名围棋教练余斌称,“这次谷歌AI想赢李世石不太可能,也许在2年后,5年后,最多10年,人工智能在围棋上就可以战胜人类。”
AlphaGo能否最终胜出尚留悬念,但是有一点我们不能否认,这次人机对战让我们看到了科技的进步让更多的“不可能”成为“可能”,它指数级的增长速度使以越来越大力量参与影响我们的社会分工和日常生活。
接下来的对战时间为:
第二场比赛:3月10日(周四)
第三场比赛:3月12日(周六)
第四场比赛:3月13日(周日)
第五场比赛:3月15日(周二)
于韩国时间下午 1 点(北京时间中午 12 点)举行。

了解“免费上众筹活动”请戳下方“阅读原文”

