海纳百川

登录 | 登录并检查站内短信 | 个人设置 网站首页 |  论坛首页 |  博客 |  搜索 |  收藏夹 |  帮助 |  团队  | 注册  | RSS
主题: (ZT) 揭秘AlphaGo:自学成才 一个会推理的大脑
回复主题   printer-friendly view    海纳百川首页 -> 驴鸣镇
阅读上一个主题 :: 阅读下一个主题  
作者 (ZT) 揭秘AlphaGo:自学成才 一个会推理的大脑   
NABC60






加入时间: 2008/04/24
文章: 2899

经验值: 136626


文章标题: (ZT) 揭秘AlphaGo:自学成才 一个会推理的大脑 (380 reads)      时间: 2016-3-11 周五, 上午3:12

作者:NABC60驴鸣镇 发贴, 来自 http://www.hjclub.org

“(ZT)揭秘AlphaGo:自学成才 一个会推理的大脑”

5个月前,战胜欧洲顶级棋手的AlphaGo,那时候的水平被中国棋院评价为,强业5水平,即职业的初级入门层次。到如今战胜李世石的一流九段水平。150天时间,AlphaGo进步可谓光速。虽然有不少观战棋手为人类顶级选手的落败找到了诸多理由,譬如没有发挥出实力、第一盘他更多的是在测试对手功力、第二局的争夺当会更加激烈刺激等云云。但正如负责解说的陈盈初段则反问道:焉知今天不是AlphaGo在测试小李?

用另一个评判标准Elo(围棋等级分)来看,可以算出去年年底AlphaGo的棋力是3168,而同期李世石的Elo大约是3532,目前排名第一的是中国棋手柯洁,李世石排在第4位。从这一数据指标来看,AlphaGo这几个月的成长确实非常惊人。舆论猜测:Deepmid应该改进了AlphaGo的神经网络。对樊麾的比赛中,他们使用了3000万个位置作为原始数据,来训练AlphaGo的价值网络;在对李世石的位置中,他们可以使用1亿个位置训练;另外,也投入了更大的运算量。

有关AlphaGo在这几个月的“进化程度”,谷歌官方并没有给出任何确切的介绍。但是有位名叫安德斯-可鲁夫的围棋游戏设计师给出了这样的猜测:深度学习。即机器通过深度神经网络,模拟人脑的机制来判断、学习、决策。AlphaGo首先习得了人类围棋大师3000万步的走法,之后自我博弈3000万局积累胜负经验,从而构成策略网络,给出落子选择;同时,在自我博弈的训练中形成全局观,构成评价网络,给出修正落子选择。如此循环往复的学习进阶,让AlphaGo可以与李世石分庭抗礼。



和1997年美国IBM公司的“深蓝”超级计算机不同,阿尔法狗并不是列举穷尽所有的可能,而是通过“经验”推理出最优解。

换言之,李世石昨天面对的不是叫做AlphaGo的计算机,也不是被网友调侃的一条狗,而是一个类人,它有着和人类一样的学习能力,而且学习效率更高、提升的速度远远快过人类。所以,它仅仅用了不到半年时间,就从勉强的职业入门水准飙升至职业最高水准。再给它几个月时间,AlphaGo岂不是要上天吗?

AlphaGo的学习能力有没有上限呢?显然这个问题,已经超过了人类的智力上限。英国曼彻斯特大学计算机科学教授凯文-柯伦认为,人类没有理由相信技术会有极限,特别是在AlphaGo这样的特定领域。而来自南京大学计算机系的周志华则认为,上限是客观存在的。周志华表示,“强化学习”奏效的关键,是两个模型都不错,而且有足够大的“差异”。当模型性能提升以后,其差异会显著下降,到了一定程度必然会使性能无法继续通过这种机制提升。其上限取决于高质量“有标记”样本的数量。

虽然人工智能的智力水平的顶峰高度依然存疑,但在情绪因素导致的失误方面,人工智能显然是无瑕疵的。AlphaGo的手下败将樊麾在复盘去年十月的那场人机大战时就表示,最大的问题在于人都会犯错,而机器犯错几率比人少得多。这样的现实,随着比赛的推进、时间的推移,人类选手会因为体力的消耗而更增添精神层面的负担。对人类选手来说,他们的形势不管好还是不好,都担心自己犯错,而根据“房间里的大象”原理,你心里想什么或者担心什么,现实世界就越会发生什么。

但如AlphaGo这样人工智能则完全没有这类概念。这就导致了人类选手的尴尬处境:在优势时,不认为自己能把握住优势;在劣势时,又认为自己一定会输。当年击败众多高手的李昌镐,被称为“石佛”,就是因为他心态好,比赛全过程面无表情,让对手感觉不到他的任何波动。但如今,谁能比AlphaGo更“石佛”呢?即使让人类“石佛”李昌镐对上机器“石佛”AlphaGo,一个是面无表情,另一个是连面都见不到,这样的对决,在心理因素层面,就是不对等的。而这样的不对等,又会诱发人类选手使出小聪明,试图戏耍机器,最终结果却是搬起石头砸自己的脚。

国际象棋一代棋王卡斯帕罗夫对此深有体会。他表示,早期的国际象棋程序有盲点以及一些可以利用的弱点,不禁使人想要去利用,而不是去下堂堂正正的棋。自己当年跟深蓝下的时候就忍不住这样做了。国际象棋和围棋,需要强大的专注力。可是如果老想着去骗电脑,自己的专注力就被破坏了,最后反而会骗了自己,下出疑问手。电脑越强大,这些疑问手就越会被惩罚。

面对一个既拥有超强学习能力和无敌定力的机器,似乎不用多久,十个李世石都无法战胜之。

作者:NABC60驴鸣镇 发贴, 来自 http://www.hjclub.org
返回顶端
阅读会员资料 NABC60离线  发送站内短信
    显示文章:     
    回复主题   printer-friendly view    海纳百川首页 -> 驴鸣镇 所有的时间均为 北京时间


     
    论坛转跳:   
    不能在本论坛发表新主题
    不能在本论坛回复主题
    不能在本论坛编辑自己的文章
    不能在本论坛删除自己的文章
    不能在本论坛发表投票
    不能在这个论坛添加附件
    可以在这个论坛下载文件


    based on phpbb, All rights reserved.
    [ Page generation time: 0.08925 seconds ] :: [ 23 queries excuted ] :: [ GZIP compression enabled ]