海纳百川
登录
|
登录并检查站内短信
|
个人设置
网站首页
|
论坛首页
|
博客
|
搜索
|
收藏夹
|
帮助
|
团队
|
注册
|
RSS
主题:
(ZT) 揭秘AlphaGo:自学成才 一个会推理的大脑
海纳百川首页
->
驴鸣镇
阅读上一个主题
::
阅读下一个主题
作者
(ZT) 揭秘AlphaGo:自学成才 一个会推理的大脑
NABC60
加入时间: 2008/04/24
文章: 2899
经验值: 136626
标题:
(ZT) 揭秘AlphaGo:自学成才 一个会推理的大脑
(380 reads)
时间:
2016-3-11 周五, 上午3:12
作者:
NABC60
在
驴鸣镇
发贴, 来自 http://www.hjclub.org
“(ZT)揭秘AlphaGo:自学成才 一个会推理的大脑”
5个月前,战胜欧洲顶级棋手的AlphaGo,那时候的水平被中国棋院评价为,强业5水平,即职业的初级入门层次。到如今战胜李世石的一流九段水平。150天时间,AlphaGo进步可谓光速。虽然有不少观战棋手为人类顶级选手的落败找到了诸多理由,譬如没有发挥出实力、第一盘他更多的是在测试对手功力、第二局的争夺当会更加激烈刺激等云云。但正如负责解说的陈盈初段则反问道:焉知今天不是AlphaGo在测试小李?
用另一个评判标准Elo(围棋等级分)来看,可以算出去年年底AlphaGo的棋力是3168,而同期李世石的Elo大约是3532,目前排名第一的是中国棋手柯洁,李世石排在第4位。从这一数据指标来看,AlphaGo这几个月的成长确实非常惊人。舆论猜测:Deepmid应该改进了AlphaGo的神经网络。对樊麾的比赛中,他们使用了3000万个位置作为原始数据,来训练AlphaGo的价值网络;在对李世石的位置中,他们可以使用1亿个位置训练;另外,也投入了更大的运算量。
有关AlphaGo在这几个月的“进化程度”,谷歌官方并没有给出任何确切的介绍。但是有位名叫安德斯-可鲁夫的围棋游戏设计师给出了这样的猜测:深度学习。即机器通过深度神经网络,模拟人脑的机制来判断、学习、决策。AlphaGo首先习得了人类围棋大师3000万步的走法,之后自我博弈3000万局积累胜负经验,从而构成策略网络,给出落子选择;同时,在自我博弈的训练中形成全局观,构成评价网络,给出修正落子选择。如此循环往复的学习进阶,让AlphaGo可以与李世石分庭抗礼。
和1997年美国IBM公司的“深蓝”超级计算机不同,阿尔法狗并不是列举穷尽所有的可能,而是通过“经验”推理出最优解。
换言之,李世石昨天面对的不是叫做AlphaGo的计算机,也不是被网友调侃的一条狗,而是一个类人,它有着和人类一样的学习能力,而且学习效率更高、提升的速度远远快过人类。所以,它仅仅用了不到半年时间,就从勉强的职业入门水准飙升至职业最高水准。再给它几个月时间,AlphaGo岂不是要上天吗?
AlphaGo的学习能力有没有上限呢?显然这个问题,已经超过了人类的智力上限。英国曼彻斯特大学计算机科学教授凯文-柯伦认为,人类没有理由相信技术会有极限,特别是在AlphaGo这样的特定领域。而来自南京大学计算机系的周志华则认为,上限是客观存在的。周志华表示,“强化学习”奏效的关键,是两个模型都不错,而且有足够大的“差异”。当模型性能提升以后,其差异会显著下降,到了一定程度必然会使性能无法继续通过这种机制提升。其上限取决于高质量“有标记”样本的数量。
虽然人工智能的智力水平的顶峰高度依然存疑,但在情绪因素导致的失误方面,人工智能显然是无瑕疵的。AlphaGo的手下败将樊麾在复盘去年十月的那场人机大战时就表示,最大的问题在于人都会犯错,而机器犯错几率比人少得多。这样的现实,随着比赛的推进、时间的推移,人类选手会因为体力的消耗而更增添精神层面的负担。对人类选手来说,他们的形势不管好还是不好,都担心自己犯错,而根据“房间里的大象”原理,你心里想什么或者担心什么,现实世界就越会发生什么。
但如AlphaGo这样人工智能则完全没有这类概念。这就导致了人类选手的尴尬处境:在优势时,不认为自己能把握住优势;在劣势时,又认为自己一定会输。当年击败众多高手的李昌镐,被称为“石佛”,就是因为他心态好,比赛全过程面无表情,让对手感觉不到他的任何波动。但如今,谁能比AlphaGo更“石佛”呢?即使让人类“石佛”李昌镐对上机器“石佛”AlphaGo,一个是面无表情,另一个是连面都见不到,这样的对决,在心理因素层面,就是不对等的。而这样的不对等,又会诱发人类选手使出小聪明,试图戏耍机器,最终结果却是搬起石头砸自己的脚。
国际象棋一代棋王卡斯帕罗夫对此深有体会。他表示,早期的国际象棋程序有盲点以及一些可以利用的弱点,不禁使人想要去利用,而不是去下堂堂正正的棋。自己当年跟深蓝下的时候就忍不住这样做了。国际象棋和围棋,需要强大的专注力。可是如果老想着去骗电脑,自己的专注力就被破坏了,最后反而会骗了自己,下出疑问手。电脑越强大,这些疑问手就越会被惩罚。
面对一个既拥有超强学习能力和无敌定力的机器,似乎不用多久,十个李世石都无法战胜之。
作者:
NABC60
在
驴鸣镇
发贴, 来自 http://www.hjclub.org
返回顶端
显示文章:
所有文章
1天
7天
2周
1个月
3个月
6个月
1年
时间顺序
时间逆序
海纳百川首页
->
驴鸣镇
所有的时间均为 北京时间
论坛转跳:
您
不能
在本论坛发表新主题
您
不能
在本论坛回复主题
您
不能
在本论坛编辑自己的文章
您
不能
在本论坛删除自己的文章
您
不能
在本论坛发表投票
您
不能
在这个论坛添加附件
您
可以
在这个论坛下载文件
based on phpbb, All rights reserved.
[ Page generation time: 0.08925 seconds ] :: [ 23 queries excuted ] :: [ GZIP compression enabled ]