【金嘉原创】当阿尔法狗已不是那只天真无邪的阿狗- 大数跨境

首页

【金嘉原创】当阿尔法狗已不是那只天真无邪的阿狗

金融小伙伴career

2016-03-28

导读：在我们的生活里有很多阿猫阿狗，他们欢脱可爱活蹦乱跳。如果让小编来说，它们为什么招你喜爱。回答两个字：因为蠢！萌！啊

在我们的生活里有很多阿猫阿狗，

他们欢脱可爱活蹦乱跳。

如果让小编来说，它们为什么招你喜爱。

回答两个字：因为蠢！萌！啊~

在你的脑海里它们

是这样的：

这样的：

或者这样的：

但是就在几天前，

有一只阿狗却让小编感！到！方！了！

近期与传奇围棋大师李世石的大战，

让这只阿狗扬名天下，

它的全名就叫：AlphaGo

在人类对于人工智能发展

还保持蔑视姿态的时候，

这只阿狗以4:1的压倒性胜利大败李世石。

人们再度把目光聚焦到了阿狗背后人工智能。

当阿狗不再蠢萌时，

它也从上面的蠢狗那样变成了……

下图这样：

（智商高低决定颜值！颜值！）

英俊棱角分明的面庞，

大家一定很好奇这个与众不同的帅阿狗

那么，在小编扒开阿狗的前世今生之前，

先大致把人工智能这个东西给大家捋一捋：

在1996年，

国际象棋冠军卡斯帕罗夫与 IBM“深蓝”电脑较量

对战的第一局虽然败给了“深蓝”

但最后卡斯帕罗夫还是以总比分 4:2 的结果，

实力碾压了人工智能。

人类的嘲笑姿态：你们这群愚蠢的机器人

然而，1997年， “ 深蓝 ” 与卡斯帕罗夫再战，

卡斯帕罗夫以1胜2负3平

败给了人工智能。。。

噢。。。人生大起大落实在是太刺激。

下面问题来了好多，当大家都在bigger高高地

聊着人工智能的时候……

神！马！是！人！工！智！能！

今天这只阿尔法狗又和当年的深蓝

有什么不一样！

在这里就要给各位看官科普一个概念，

强人工智能，弱人工智能。

强人工智能的观点让机器真正的思考,

弱人工智能的观点是让机器智能的行动。

举个栗子，微软小冰读心术就是

典型的弱人工智能，

微软小冰并不是真正的在猜你心里想什么，

而是表现出像在思考的样子，

实际上他只是利用数据库根据你的输入，

通过分类和归类，再排除和剪枝，

计算可能性最大的人物的概率，

逐步选出概率最大的人物。

↓（小冰和小编的不同就是：它没有我真心）

而今天的阿狗君和深蓝一个最大的不同是，

“深蓝”只会推理，不会学习。

深蓝君的硬盘内存了60万份棋谱，

可以在3分钟内从棋谱中“推导”出下一步。

说白了，它靠的就是“蛮荒之力”：

远超人类的检索能力和运算速度。

（好粗暴好粗暴……）

但阿狗不仅在搜索能力超过“深蓝”

还具备举一反三的学习能力：

最初它模仿人类玩家，

学习各种棋局；

接着它和同辈们进行比赛，

500场仅输一场；

棋艺更进一步之后，

它甚至开始和自己对弈。

对此小编的理解是

智商高度没有达到

又怎么能懂得那独孤求败的感受……

在海量数据的信息时代智能的重要因素

就是系统会不会随着经验演化，

随着次数越来越多数据越来越多，而越变越聪明。

机智的阿狗有着它的秘密武器：

Deep Learning深度学习

=好好学习天天向上

先来安利一下玩围棋需要多机智的脑瓜，

围棋棋盘是19x19路，

所以一共是361个交叉点。

普林斯顿的研究人员硬生生的算出

19x19格围棋的棋局数所有可能性

2081681993 8197998469 9478633344 8627702865 2245388453 05484256394568209274 1961273801 5378525648 4516985196 4390725991 60156281285460898883 1442712971 5319317557 7366203972 4706484093 5

（数据来源差评君）

共171位数。。。真的是soooooo长，

如果你还感受不到恶意的话……

没！关！系！

小编我为

有密集恐惧症选择恐惧症的你

准备了下面的精美图片：

小编我也很想知道！

阿狗你有密集恐惧症嘛？！！

你有选择困难症嘛？！！

于是，小编找了一张关于阿尔法狗的

（来自博士大神CKDD的辛苦制图）

高（bu）大（tai）上（dong）的原理图，

表达小编的机（zhuang）智（bi）高度

对于阿狗的聪明才智，

小编主要为大家准备了几个逼格重点

帮助大家更好地理解：

第一：正如上文我们所看到的，

围棋的搜索全部可能性十分庞大，

于是第一个Bigger词语就粗线

【深度卷积神经网络】：

我们可以简单理解成搜索，

简单说用于快速的观察围棋的盘面，类似于人观察盘面获得的第一反应。

下面越来越刺激哦……

在深度卷积神经网络下， AlphaGo是通过两个不同神经网络“大脑”合作来改进下棋。

一个叫策略网络，另一个叫价值网络。

大白话版：第一个是对高手棋谱的学习，

第二个是自我对弈。

这些网络通过反复训练来检查结果，

再去校对调整参数，

去让下次执行更好。

还不懂？再看看凝聚了

许多个知乎大牛的解释↓

第一大脑: 落子选择器（Move Picker)

是“策略网络(Policy Network)” ，

就是观察棋盘布局企图找到最佳的下一步。

团队通过在网络围棋对战平台上

与最强人类对手，

百万级的对弈落子去训练大脑。

这就是AlphaGo最像人的地方，

目标是去学习那些顶尖高手的妙手。

不是为了去下赢，

而是去找一个跟人类高手同样的下一步落子。

第二大脑：棋局评估器（Position Evaluator）

预测每一个棋手赢棋的可能，

在给定棋子位置情况下。

就是 “价值网络（Value Network)”，

通过整体局面判断来辅助落子选择器。

局面评估器是怎么看这个棋盘的。深蓝色表示下一步有利于赢棋的位置。

土豪看官可以看看由科普君翻译的Deepmind的官方介绍视频从而更好理解这两个大脑系统：

第二：蒙特卡洛搜索树（Monte-Carlo Tree Search）

介绍它的开头是：它……不是一棵树。

蒙特卡洛树搜索通过反复模拟

和采样对局过程(称为Rollout)

来探索状态空间。

简单来说就是自学成长：

AlphaGo不断与“自己”对战，

下了3000万盘棋局，

总结出经验作为棋局中的评估依据。

于是小编又从知乎上扒下来了一张图图。

无知的小编还是要把小编看过的这些

知乎大牛的链接Po给大家

因为时间空间因素

发扬大家自学能力（小编懒）

大家可以在以下地方深入了解：

DeepMind 研发的围棋 AI AlphaGo 系统是如何下棋的？

http://www.zhihu.com/question/41176911

AlphaGo 战胜李世石后，最让你害怕的是什么？

http://www.zhihu.com/question/41278642

大致八完逼格高高地阿尔法狗后，

身为金融人，我们应该看！向！何！方！

小编收到最多的问题是

阿狗能炒股做投资吗？

机智的小编细思了

三（hao）秒（duo）后（tian）……

觉得这个问题才学疏浅的小编并没有资格给看官们一个心满意足地答案。

但是小编在网上看到了两种的回答：

第一种是反对派，观点简要概括就是股市中掺杂了更多的人性。市场里面里面有散户、大户、机构等等的参与者，股市的表现是所有参与者的合力。甚至跟国家政策、环境气候等等等等诸多因素有关，因此市场无法判断也无需判断，假如Alphago能预测涨跌，那么它至少需要剖析市场参与者对当下走势的看法以及所要采取的行动。

第二种观点是支持派，观点简要概括就是，投资市场大量的数据人力无法全面兼顾，而阿狗这种数据快速学习和处理能力，能及时获取信息，对市场动态灵敏反应。

好像都很有道理的样子，阿狗毕竟目前不是为投资而生，这种预测的大业还是交给看官们。但我们可以看到DeepMind被谷歌收购，击败围棋只不过是一个开始，AlphaGo 的开发公司 DeepMind 在游戏、医疗、机器人以及手机方面都有规划。

阿尔法狗身后未来这几片蓝海的发展，

才是今天阿尔法狗带给我们，

去思考的东西。

↓↓↓ 点击"阅读原文" 【下载金融人士神器】

【声明】内容源于网络

金融小伙伴career

金融小伙伴致力于搭建一个金融垂直领域职业信息分享和交流公益平台，通过持续不断的公众号推文和线上线下活动，提供及时、全面、高效的行业招聘信息和职场提升经验。目前，我们已吸引了超过100万粉丝，在海内外金融学子和在职人士中均享有盛誉。

内容 0

粉丝 0

金融小伙伴career 金融小伙伴致力于搭建一个金融垂直领域职业信息分享和交流公益平台，通过持续不断的公众号推文和线上线下活动，提供及时、全面、高效的行业招聘信息和职场提升经验。目前，我们已吸引了超过100万粉丝，在海内外金融学子和在职人士中均享有盛誉。

总阅读0

粉丝0

内容0