海纳百川 :: 阅读主题 - (ZT) 揭秘AlphaGo:自学成才一个会推理的大脑

海纳百川

登录 \| 登录并检查站内短信 \| 个人设置	网站首页 \| 论坛首页 \| 博客 \| 搜索 \| 收藏夹 \| 帮助 \| 团队 \| 注册 \| RSS


	主题: (ZT) 揭秘AlphaGo:自学成才一个会推理的大脑

海纳百川首页 -> 驴鸣镇

阅读上一个主题 :: 阅读下一个主题

作者

(ZT) 揭秘AlphaGo:自学成才一个会推理的大脑

NABC60

加入时间: 2008/04/24
文章: 2900

经验值: 136653

标题: (ZT) 揭秘AlphaGo:自学成才一个会推理的大脑 (443 reads) 时间: 2016-3-11 周五, 上午3:12

作者：NABC60 在驴鸣镇发贴, 来自 http://www.hjclub.org

“(ZT)揭秘AlphaGo:自学成才一个会推理的大脑”

5个月前，战胜欧洲顶级棋手的AlphaGo，那时候的水平被中国棋院评价为，强业5水平，即职业的初级入门层次。到如今战胜李世石的一流九段水平。150天时间，AlphaGo进步可谓光速。虽然有不少观战棋手为人类顶级选手的落败找到了诸多理由，譬如没有发挥出实力、第一盘他更多的是在测试对手功力、第二局的争夺当会更加激烈刺激等云云。但正如负责解说的陈盈初段则反问道：焉知今天不是AlphaGo在测试小李？

用另一个评判标准Elo（围棋等级分）来看，可以算出去年年底AlphaGo的棋力是3168，而同期李世石的Elo大约是3532，目前排名第一的是中国棋手柯洁，李世石排在第4位。从这一数据指标来看，AlphaGo这几个月的成长确实非常惊人。舆论猜测：Deepmid应该改进了AlphaGo的神经网络。对樊麾的比赛中，他们使用了3000万个位置作为原始数据，来训练AlphaGo的价值网络；在对李世石的位置中，他们可以使用1亿个位置训练；另外，也投入了更大的运算量。

有关AlphaGo在这几个月的“进化程度”，谷歌官方并没有给出任何确切的介绍。但是有位名叫安德斯-可鲁夫的围棋游戏设计师给出了这样的猜测：深度学习。即机器通过深度神经网络，模拟人脑的机制来判断、学习、决策。AlphaGo首先习得了人类围棋大师3000万步的走法，之后自我博弈3000万局积累胜负经验，从而构成策略网络，给出落子选择；同时，在自我博弈的训练中形成全局观，构成评价网络，给出修正落子选择。如此循环往复的学习进阶，让AlphaGo可以与李世石分庭抗礼。

和1997年美国IBM公司的“深蓝”超级计算机不同，阿尔法狗并不是列举穷尽所有的可能，而是通过“经验”推理出最优解。

换言之，李世石昨天面对的不是叫做AlphaGo的计算机，也不是被网友调侃的一条狗，而是一个类人，它有着和人类一样的学习能力，而且学习效率更高、提升的速度远远快过人类。所以，它仅仅用了不到半年时间，就从勉强的职业入门水准飙升至职业最高水准。再给它几个月时间，AlphaGo岂不是要上天吗？

AlphaGo的学习能力有没有上限呢？显然这个问题，已经超过了人类的智力上限。英国曼彻斯特大学计算机科学教授凯文-柯伦认为，人类没有理由相信技术会有极限，特别是在AlphaGo这样的特定领域。而来自南京大学计算机系的周志华则认为，上限是客观存在的。周志华表示，“强化学习”奏效的关键，是两个模型都不错，而且有足够大的“差异”。当模型性能提升以后，其差异会显著下降，到了一定程度必然会使性能无法继续通过这种机制提升。其上限取决于高质量“有标记”样本的数量。

虽然人工智能的智力水平的顶峰高度依然存疑，但在情绪因素导致的失误方面，人工智能显然是无瑕疵的。AlphaGo的手下败将樊麾在复盘去年十月的那场人机大战时就表示，最大的问题在于人都会犯错，而机器犯错几率比人少得多。这样的现实，随着比赛的推进、时间的推移，人类选手会因为体力的消耗而更增添精神层面的负担。对人类选手来说，他们的形势不管好还是不好，都担心自己犯错，而根据“房间里的大象”原理，你心里想什么或者担心什么，现实世界就越会发生什么。

但如AlphaGo这样人工智能则完全没有这类概念。这就导致了人类选手的尴尬处境：在优势时，不认为自己能把握住优势；在劣势时，又认为自己一定会输。当年击败众多高手的李昌镐，被称为“石佛”，就是因为他心态好，比赛全过程面无表情，让对手感觉不到他的任何波动。但如今，谁能比AlphaGo更“石佛”呢？即使让人类“石佛”李昌镐对上机器“石佛”AlphaGo，一个是面无表情，另一个是连面都见不到，这样的对决，在心理因素层面，就是不对等的。而这样的不对等，又会诱发人类选手使出小聪明，试图戏耍机器，最终结果却是搬起石头砸自己的脚。

国际象棋一代棋王卡斯帕罗夫对此深有体会。他表示，早期的国际象棋程序有盲点以及一些可以利用的弱点，不禁使人想要去利用，而不是去下堂堂正正的棋。自己当年跟深蓝下的时候就忍不住这样做了。国际象棋和围棋，需要强大的专注力。可是如果老想着去骗电脑，自己的专注力就被破坏了，最后反而会骗了自己，下出疑问手。电脑越强大，这些疑问手就越会被惩罚。

面对一个既拥有超强学习能力和无敌定力的机器，似乎不用多久，十个李世石都无法战胜之。

作者：NABC60 在驴鸣镇发贴, 来自 http://www.hjclub.org

返回顶端

显示文章:

海纳百川首页 -> 驴鸣镇

所有的时间均为北京时间

您不能在本论坛发表新主题
您不能在本论坛回复主题
您不能在本论坛编辑自己的文章
您不能在本论坛删除自己的文章
您不能在本论坛发表投票
您不能在这个论坛添加附件
您可以在这个论坛下载文件

[ Page generation time: 1.286626 seconds ] :: [ 27 queries excuted ] :: [ GZIP compression enabled ]