图片: | |
---|---|
名称: | |
描述: | |
“‘阿尔法’打麻将能赢吗?”这并不是一个无厘头的问题,上海脑科学与人工智能重大项目首席科学家冯建峰认真思索后回答记者:“未必。”
除了可计算的数据之外,麻将更多地体现对弈时人的心理和情绪,还有运气,比如段子里提到的“人工智能扔出三筒又抓了三筒后会怎样?”
无论如何,顽强的李世石昨日最大限度地维护了人类在围棋领域的尊严。
终局之际,网络直播中讲解者们兴奋异常,他们甚至套用了“黄健翔语录”——“伟大的人类守护者!他继承了胜负师的光荣传统。
本因坊秀策、吴清源、李昌镐在这一刻灵魂附体!李世石一个人他代表了人类围棋悠久的历史和传统,在这一刻,他不是一个人在战斗,他不是一个人!”
目前比分3:1
15日收官之战
李世石VS“阿尔法”谁赢?
韩国棋手李世石在13日进行的“人机大战”第四盘终于迎来首胜。“阿尔法”认输后,现场媒体记者因为李世石的胜利而欢呼鼓掌。李世石接受采访时说: “今天我赢了一局大家就给予我如此热烈的祝贺,这是我以前所没有碰到的。但是今天的胜利意义非凡,拿什么我都不会去换的。这是珍贵的胜利。因为当初我说过要以4:1或5:0赢。”
由于“阿尔法”先胜3局,目前的对弈也只是人类为了挽回尊严而进行的战斗。虽然胜负已分,但在最危急关头绝杀对手,反败为胜,也才是围棋的魅力所在。
解棋
白78手凌空一“挖”,漂亮!
樊麾证实:“阿尔法”不是单机版
这是“神之一手”,这很可能是出乎计算机预料之外的一手,凭借这一步妙手,人类的代表——韩国天王李世石九段在韩国首尔举行的“人机大战”五番决胜第四局中,终于迎来一胜!此前,“阿尔法”3:0领先,使得本局在胜负上已经毫无意义,但对于人类而言,顶尖高手还是有可能击败机器的,这一点意义重大! “和前面几局一样,机器没有改变,还是原来的机器。今天李世石下得多好啊,那步挖确实绝妙!”本次比赛的裁判长樊麾二段赛后接受本报记者微信采访时如是说,打消了大家关于“第四局机器是不是用了单机版”的疑惑。
众所周知,“阿尔法”的单机版和联网版实力大不相同,而在13日的比赛中,它的表现似乎与前三局迥异。不过,就在李世石历尽艰辛终获一胜之后,DeepMind巩固学习小组负责人大卫·席尔瓦称,李世石的“神之一手”,可能点中了电脑此前不为人知的“BUG”——“衷心祝贺李世石九段,赢得漂亮。AlphaGo通过自我对局来进行学习,这样有可能会存在缺陷。我们不是职业棋手,正需要进行这场比赛,希望能寻找到这样的缺陷,发现 AlphaGo的极限。今天在棋盘中央就看到了,李世石下得非常漂亮,我们希望能促进AlphaGo的进步。期待周二的第五局比赛。”项目组老板哈萨比斯则称:正是李世石的妙手,导致电脑在后半盘崩溃。
赛后新闻发布会,人类代表李世石百感交集,他表示:“我想起赛前曾经说过会以5比0,或者4:1赢得比赛,如果之前我真的赢了三场,那么今天哪怕失利一场,也会是巨大的伤害。但正因为我输了三场,如今赢回一场,这一场胜利对我如此弥足珍贵,我不会拿它跟任何东西交换。是你们的鼓励和支持让我赢得这场比赛,非常感谢。”他还补充:下一局希望不猜先,主动执黑,“这样对我来说获胜更有意义。”
当被问到通过4盘对局是否发现了“阿尔法围棋”的弱点时,李世石说:“我觉得‘阿尔法围棋’有两个弱点:其一是它执黑时下得困难。其二是它遇到没想到的一手棋时应对能力下降。”
目前,“阿尔法围棋”团队已答应,李世石在第5局中将执黑。
质疑
成都本土高手仍持怀疑态度
“我希望,将来会有真相浮出水面”
正值“唐晓宏围棋会”搞活动,活动的焦点当然是“人机大战”,笔者正好了解本土业余高手们心中的真实想法。川籍唯一的一名业余7段唐晓宏直言不讳: “我其实很困惑,因为从棋的内容上看,个人认为‘阿尔法’的实力可能也就是业余6段,问题是,李世石的下法令人意外……”以第二局、第三局的内容为例,唐 7段为参加活动的业余棋迷们作了讲解,他甚至表示:“我简直不敢相信李世石会输给这台电脑,我希望,将来会有真相浮出水面。”资深业余6段何四祥也同意唐晓宏的观点,“如果电脑将来不和中国的柯洁九段一战,我觉得它这次的胜利就没有任何说服力。”
相对而言,业余棋界“老兵”龙霖6段要保守一点,不过他也表示——“前三局,李世石的招法确实令人不能理解。但是第四局,我们可能要反过来质疑‘阿尔法’,它今天的表现确实不敢恭维。”
无论如何,顽强的李世石最大限度地维护了人类在围棋领域的尊严。终局之际,网络直播中讲解者们兴奋异常,他们甚至套用了“黄健翔语录”——“伟大的人类守护者!他继承了胜负师的光荣传统。本因坊秀策、吴清源、李昌镐在这一刻灵魂附体!李世石一个人他代表了人类围棋悠久的历史和传统,在这一刻,他不是一个人在战斗,他不是一个人!”
约战
中国棋手柯洁非常振奋:“等对手来约战,它进步了也不怕”
李世石迎来首胜,中国棋手柯洁直言“非常振奋”,他同时说:“这也证明了我说的机器还没有到最完美的地步,但我之前再生气也无法反驳,李世石的胜利证明了这点,同时也证明了人类有其伟大之处。”
“人机大战”前三盘李世石被零封,直接宣告这场五番棋对决的失利,令职业棋手们不由感慨“阿尔法围棋”之强,但柯洁和李世石一样,都认为电脑未臻完美,在前一天李世石第三次认输后,柯洁还在深夜发微博称:“来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来得猛烈点吧!”
13日的第四盘棋,李世石从开始就处于劣势,就在很多人以为又是一场完败的时候,李世石78手一“挖”,成为全盘转折点。柯洁对此评论说:“这手棋很妙,但其实也并不是稳稳成立的,电脑系统可能在短兵相接的时候还是会出现漏洞,所以才会出现这样崩溃的局面。”
柯洁直言自己之前虽然生气于很多人说电脑下围棋完美,但却没法反驳,“毕竟人没赢过,所以我觉得还是要多试几盘棋,我们也帮电脑抓抓‘BUG’。”
李世石和“阿尔法围棋”的大战接近尾声,目前希望柯洁继续出战的呼声很高,柯洁表示,自己还是会等对手来约战,“就算过几个月它又进步了也不怕,因为本来就没有绝对公平。”
□深度观察
在吸收了围棋数千年来的众多棋谱后,阿尔法已经完成了自我学习。与它对弈更像是与围棋数千年的历史较量。况且,此次与李世石对阵的阿尔法是分布式而不是单机,处理器拥有1200个核心,如同李世石对阵20台电脑。“阿尔法”之父德米什·哈萨比斯赛后总结:
阿尔法故意放水输棋?
它误以为胜率达到70%
对于李世石战胜了相当于20台电脑的服务器版阿尔法,网上出现了多种观点看法,其中最有代表性的一种说法是“狗狗选择性放水”,甚至还有阴谋论表示,机器失利是因为被改代码。
职业棋手以及网友的质疑,正是来自于李世石下出阿尔法没有计算到的变化后计算机出现了混乱。观看的职业棋手们讨论认为,李世石走了一步电脑此前不曾想到的棋,阿尔法无法跳过这个问题,必须还去解决,这时候就给它的运算造成了极大的不便。
面对阿尔法的“恍惚”,甚至有网友开玩笑称,“难道阿尔法被黑客攻击了?”因为在几手并不正常的棋后,它又恢复了正常。
那么,阿尔法究竟有没有下放水棋的可能呢?对此,“阿尔法围棋之父”德米什·哈萨比斯赛后在社交网络上总结:“李世石下出白78后,阿尔法自我感觉良好,在程序的‘值网络’(用于评估电脑胜率)中,误以为胜率达到70%,直到第87步才反应过来。”
对于阿尔法是怎么实现“中盘认输”这个人类的行为等问题,哈萨比斯回答说:“首先‘阿尔法围棋’通过计算后,期待值比设定的程度低的话,它就会在显示器上表示‘认输’。Aja黄(人类替身)看到那个屏幕,替它认输。”
一个问题
阿尔法打麻将能赢?未必!
“阿尔法围棋”赢下这次五局三胜制的比赛。不少网友开玩笑地问:“阿尔法”下围棋赢了,那打麻将呢?
“人机大战”选择围棋,因为其变化繁复,背后的数据量堪称天文数字,被称为棋牌领域的“皇冠”。从数据量的角度讲,麻将无法与之匹敌。
“‘阿尔法’打麻将能赢吗?”这并不是一个无厘头的问题,上海脑科学与人工智能重大项目首席科学家冯建峰认真思索后回答记者:“未必。”
除了可计算的数据之外,麻将更多地体现对弈时人的心理和情绪,还有运气,比如段子里提到的“人工智能扔出三筒又抓了三筒后会怎样?”
“如果说围棋是一堂数学课,麻将就是一堂人生哲学课。”网友风趣的话多少折射出人工智能与人类智能的差距。“‘阿尔法’依赖的结构和算法只是模拟了人脑的一些初级功能,但是如情感、决策、注意力、创造性等它都没有涉及。”冯建峰说。
中国人工智能学会副理事长、东华大学校长蒋昌俊教授对记者说,“阿尔法”的本质还是以计算为核心,其所擅长的领域有三个条件:一是可以程式化表达的;二是需要具有明确的规则;三是搜索空间是有限的,可枚举的。
□一个人物
“阿尔法”之父如何炼成?
“国际象棋神童”“天才程序员”“人工智能游戏开发者”“认知神经学家”……这些华丽丽的标签都属于同一个人。他就是“人机大战”中人工智能程序“阿尔法围棋”的设计者、英国人德米什·哈萨比斯。
这名跨界奇才并非出自科学世家,哈萨比斯1976年出生在伦敦北部,是家中长子。父亲有希腊和塞浦路斯血统,“做过各种各样的工作”,包括写词和唱歌。母亲是华裔新加坡人,就职于约翰·刘易斯百货公司。
哈萨比斯是国际象棋“神童”,5岁开始参加英国国内比赛,13岁时就获得了国际象棋大师称号。也许是太过聪明,哈萨比斯自认“很容易感到无聊”。
16岁时,他进入剑桥大学计算机科学专业;17岁时,他设计出游戏《主题公园》,是最早包含人工智能元素的游戏之一。
得益于这款游戏数百万份的销量,哈萨比斯获得足够资金来完成学业。这也让他坚定了一个观念:人工智能将会有惊人发展。
2005年,哈萨比斯回归学术领域,在伦敦大学学院攻读认知神经科学博士学位,开创性地发现大脑中海马体与情景记忆间的关系。他的研究成果在2007年被顶级学术期刊《科学》评为“年度突破”。
2011年,哈萨比斯成立了后来开发出“阿尔法围棋”、被谷歌公司并购的人工智能研究公司“深度思维”。
为了能够达到职业围棋选手的水平,“阿尔法围棋”人工智能程序结合了“深度学习”和“蒙特卡洛树搜索”方法。“蒙特卡洛树搜索”是一种启发式的搜索策略,能够基于对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。这种技术也已经为业界所推广。华西都市报记者贾知若综合新华社、央视等