有人关注AlphaGo机器人打败围棋冠军高手的事件吗

按:本文作者为亮风台首席科学家凌海滨。近日来,国际顶级科学期刊《自然》(Nature)?[1]上关于电脑战胜职业围棋选手的报道引起了人们对人工智能的广泛关注,这是历史上电脑首次在公平竞赛的条件下战胜职业围棋选手。即将到来的AlphaGo和李世石九段的大赛更多是让人联想起当年深蓝和卡斯特罗夫的对奕。那么,既然已经有了电脑战胜国际象棋冠军的先例,为什么在围棋这个领域还会引起这么大的关注呢?其根本原因在于,从计算的角度来看,围棋比国际象棋难的远远不止是一两个数量级。象棋的棋盘上的位置只有围棋的大约六分之一,这就决定了围棋的计算复杂度(简单说来就是可能出现的不同棋局的总数)远超国际象棋,从目前人类实用中接触的数字来看,几乎是一个无穷大数。不太理解的朋友可以参考“一张纸如果能对折64次可以从地球伸到月球”的传说。换个角度来说,以目前计算机的能力而言,想穷举搜索或者尝试所有可能的棋局变化是完全不可能的。基于这个原因,虽然计算机已经在国际象棋领域战胜了人类,计算机在围棋上战胜人类一直被认为是一个尚需时日的事情。包括学术界和围棋界在内的大部分专业人士都没有想到这么快计算机就可以和专业棋手一决高下了。从目前的趋势看,无论这次AlphaGo能否战胜李世石,计算胜国际顶尖围棋选手只是早晚的事情。而这次举世瞩目的比赛其成败具有的更多的是象征性的意义。AlphaGo能够匹敌或战胜职业选手这一事实,对于人工智能乃至整个科技的发展,都是一个极为重要的标志和鼓舞。由此带来的技术突破和信心必将进一步推动人工智能尤其是机器学习在很多领域的应用。事实上,除了DeepMind的AlphaGo以外,其他的一些研究组也在计算机围棋方向取得了令人期待的进展,比如来自卡内基梅隆大学最近的工作?[2]。不出大家的意外,这次使AlphaGo大放光彩的核心技术是近年来蒸蒸日上的深度学习技术。自2006年Hinton再度引爆深度神经网络的热潮之后,深度学习在十年间几乎横扫所有人工智能相关的领域,在语音和视觉等领域的众多问题中频频取得突破性的进展。很多学者和工业界研发人员也从最初的谨慎怀疑态度转向积极跟进,进而推动了深度学习在理论和实践两方面的迅猛发展。就亮风台在增强现实领域的经验而言,尽管深度学习在实用时还需要克服一些诸如实时性的挑战,但我们亮风台已经在一些实际应用中(比如大规模图片识别和人脸分析)成功的使用了深度学习技术,并且期待在不久的将来会取得更好的结果和推广。下面就我个人的理解来对这次比赛下注。首先声明,虽然我们在科研和应用上都在使用深度学习的技术(如今想不用都难啊),我本人对于深度学习研究有限,所以下面观点仅仅是很主观的个人观点。总的来说,这次人机大赛,我觉得AlphaGo的胜率不高,感觉在30%以下。下面就几个方面解释一下我的理由。一、AlphaGo之前战胜的欧洲围棋冠军樊麾是职业二段,棋力和世界冠军的九段李世石有很大的差距。李世石本人认为“AlphaGo和我约差2子”?[4],也是符合围棋段位之间的基本差距的?[5]。这一观点得到了棋界诸多当前顶尖棋手的认同,参见?[6]。当然,由于机器学习的强大学习能力,AlphaGo是有可能在这次比赛前的时间内得到棋力上的飞速提高,理论上是有可能进步到顶尖棋手的能力。但是,这种提高并不是能够轻而易举实现的,参加下面的解释。二、深度学习毕竟还是要学习的,而学习是要样本和训练的。尽管AlghaGo可以很容易的获取大量历史上的棋局资料,但是李世石这样的顶尖棋手的棋局资料还是有限的。更重要的是,计算机棋手和顶尖专业棋手的对局资料非常稀少。之前零星的几次疑似AlphaGo和高手在网上的比赛和即将进行的比赛差距还是太大,应该不足以弥补这个训练样本上的缺陷。三、反过来从棋手的角度来看,顶尖的专业棋手对于机器棋手的行棋方式和漏洞可能更为敏感也有更强的应对方式。比如,很多高手都指出了在AlphaGo-樊麾棋局中的一个明显失误?[6](这个嘛,只有业余11级水平的我其实没有看懂),这样的漏洞相信不会被李这样的高手放过的。当然,人也有状态不稳定和犯糊涂的时候,不过高手发生这种状况的概率是很低的。四、确实存在一种可能:AlphaGo可以通过头一局或两局迅速学习和调整。不过我个人感觉即使如此也不太容易达到击败李世石的水平,中间差距还是有些大,更多的样本才会更可靠一些。一个参考是当年深蓝和卡斯特罗夫的第一次比赛?[7]。总结一下来说,基于深度学习的技术使得计算机战胜专业棋手,虽然比大多数人预料的要早,并不是完全意外的。作为人工智能领域的从业者,我们应该更多的感到鼓舞,并期望从相应的技术泛化中汲取指引我们前进的知识和经验,使我们能在具体的应用领域上不断前进。参考资料:1.&&Google&AI&algorithm&masters&ancient&game&of&Go,&Deep-learning&software&defeats&human&professional&for&first&time.&&Elizabeth&Gibney,&Nature,&20162.&&Better&Computer&Go&Player&with&Neural&Network&and&Long-term&Prediction,&&Yuandong&Tian&and&Yan&Zhu,&International&Conference&on&Learning&Representations&(ICLR),&2016.3.&&Reducing&the&dimensionality&of&data&with&neural&networks.&&Hinton,&G.&E.&and&Salakhutdinov,&R.&R.,&Science,&2006.4.&&Deep&Blue&versus&Garry&Kasparov,&&Wikipedia围棋遭遇变革时代 你的AlphaGo又会在哪里?_围棋高手柯洁的老师是谁-河南头条网
围棋遭遇变革时代 你的AlphaGo又会在哪里?
围棋遭遇变革时代 你的AlphaGo又会在哪里?
哈萨比斯(左一)与众棋手们合影
柯洁与哈萨比斯拥抱
  新浪科技 李根发自乌镇  3:0!柯洁局中落泪,河南头条网消息:赛后哽咽,说AlphaGo太完美,完美到没有希望可言。  AlphaGo没有给柯洁任何希望,没有再给围棋圈任何机会。  作为人类围棋世界积分等级排名第一的选手,柯洁的失利,可以说是整个人类围棋对抗机器的完全失利。如果在此之前尚存侥幸,那自此以后已经再无可能。  这是人类棋手最坏的时代。  AlphaGo出现之前,围棋是人类智力竞技的代表,棋手是一群生活在现实和精神双重空间的人物,重荣誉、强尊严,就在DeepMind首次宣布击败人类职业二段选手樊麾时,外界听到最多的恐怕是划清界限。  棋圣聂卫平甚至还留下了那句:我们不认识他,那个叫樊麾的棋手给围棋丢了脸。  这也是中国棋手们最坏的时代。  在柯洁、连笑、唐韦星、周睿羊等一大批当红国手成长起来之前,发源于中国的围棋,制霸权很长时间控制在李昌镐李世石等韩国选手手中。常昊、古力都成零星闪耀,但群星璀璨直至近几年才真正到来。  特别对于柯洁来说,97年出生,不满20岁,已经拿到了至今为止最高的世界排名等级分,成为了全球围棋排名最靠前的人——如果AlphaGo没有出现,谁也无法料到这个不世诞生的少年会统治围棋世界多少年。  AlphaGo打破了人类循环往复几千年的进化之路。  但这可能也正是围棋迎来最好时代的原因。  在AlphaGo对李世石下出“开创新一手”后,棋圣聂卫平起身向AlphaGo致敬,并且给了AlphaGo新的地位:阿老师。不仅昭雪樊麾李世石,还率先给AlphaGo新定位。  这种定位也得到棋手们认可。与AlphaGo激战两盘后,柯洁一度将最新最强版的AlphaGo逼至极限,而他自李世石比赛以来的进步,几乎全部来自对AlphaGo的研究。  哈萨比斯在乌镇向新浪科技透露了该秘密,他表示和柯洁的比赛早已约定,之所以在1月份通过网络和众棋手进行了60盘比赛,很大程度上是给柯洁积累素材和研究学习。  可以佐证的是,柯洁此次在乌镇屡屡下出了之前唯有AlphaGo才会使用的招式,甚至在趣味赛观战时,柯洁还在具体着式上和AlphaGo惊人相同——此前其他棋手并不认为柯洁的方案行得通,直至AlphaGo呼应了柯洁。  第一场比赛后,新浪科技问及AlphaGo对他的意义。  柯洁回答说,AlphaGo就像围棋上帝,已然不能被击败,但改变了他这样棋手的人生,以及对人生的看法。柯洁说AlphaGo让自己知道,没有什么棋是不可以下的,可以大胆去创新,开拓自己的思维,去自由地下每一盘棋。  有个“恒定”而“不败”的对手总是好的。  聂卫平认为当前和柯洁对战的AlphaGo至少职业二十段,这是人类过去、现在和未来都难以企及的新高度,即便是当前的AlphaGo,也能为围棋带来更多的想象空间,更何况不断强化学习中的AlphaGo下一刻都只会更强。  被AlphaGo最早击败的人类选手樊麾则这样看待事情。他说在与李世石的比赛后,AlphaGo还进行了50盘自我对局,他在乌镇向其他棋手展示过部分棋谱,得到的结论是:这样的对局仿佛来自未来。  “围棋的进步让我们棋手感到激动和欣喜,这也是我加入了AlphaGo的原因。”樊麾解释称。  当然,除了围棋的进步和追求,对于围棋产业的变革也实属利好。  首先是有了更多人对围棋的关注。  哈萨比斯表示,在AlphaGo击败李世石后,全世界关注围棋、学习围棋的人数并不减反增,围棋棋盘的销售数据明显得到提升,越来越多青少年因为人机大战关注到这项古老的智力竞技中,并通过AlphaGo的报道感受到其中魅力。  有人曾质疑,在机器无法被击败的时代,这样的竞技运动还有何意义。但不言自明的是,人类并没有因为汽车的发明停止赛跑。  就在乌镇围棋峰会最后对局的现场,一群桐乡北港小学的小学生来到现场,他们有些初入门围棋,有些根本不了解,但这样历史性的事件可能会在未来展现硕果:谁又知道人类围棋的新高度,是否会来自他们中的某一个呢?  其次,这次人机围棋大战或许也会改变中国围棋国手们的现实处境。  在AlphaGo对战李世石之前,排名世界第一的中国围棋国手柯洁籍籍无名。在AlphaGo对战柯洁之后,连笑周睿羊唐韦星等中国围棋国手获得了更多关注。  更加现实的情况是,即便随着柯洁等黄金一代崛起,中国围棋水平已经领导世界,但在国内,代表最高水平的围甲比赛,竟还会出现拖欠工资的丑闻,而且并非个例孤例的是,通过微博发声讨薪的棋手,是全球排名第一的柯洁。  棋手们拥有高深玄远的精神世界,但在现实世俗的应对上显得无可奈何。  而且就整个围棋产业的商业模式来看,在AlphaGo出现之前,围棋产业赖以发展的驱动主因是“教育”。一个知名棋手比赛之外的出路是道场教学,从学生的学费赚得生活所需,然而哪怕是这样的模式,也并非每一个棋手都能复制。  如果不具备聂卫平这样的影响力和知名度,又怎能通过“道场”支撑起职业生涯之后的个人生活发展。  所以AlphaGo的出现值得庆幸,至少柯洁这样的棋手获得更多关注,被当做超级明星,拥有更多商业回报的可能。  就在第二局和AlphaGo下出前所未见的激战后,柯洁和棋手们在当日晚间进行了简单庆祝。席间偶遇媒体后,一向以个性著称的天才围棋少年,对记者们恭敬致谢,说感谢让更多人通过报道关注比赛、了解围棋。  实际上,第二局虽然输掉了比赛,输掉了总比分,但柯洁看到希望,他知道如果在“失去胜负悬念”的第三局打出精彩对决,舆论、关注度以及整个围棋的境况都会有根本不同——这让他紧张、焦虑、心态失衡,最终落泪现场。  但AlphaGo只是围棋的挑战和机遇吗?显然不是,这只是一个人工智能时代的开端。  在乌镇围棋峰会现场,DeepMind、Google等团队正在向世界展示一个AI进击、AI相伴的未来。  除了下围棋的AlphaGo,还会有治疗分析医疗CT照的“AlphaGo”,帮助医生分析糖尿病倾向的“AlphaGo”日益精进,医生将拥有更加聪明的工具。  另外,在翻译、金融、速记等领域,人工智能也在产生革命性变化——职业变革将再现工业革命一幕。  在华尔街,资深股票分析师Hugo已经因人工智能丢掉了年薪百万的工作。与乌镇相隔千里之外的大洋彼岸,他通过微信告诉新浪科技,人工智能程序更快、更精准、不吃不喝,没有人力成本可言,而且也无年老力衰之忧。  Huge现在正在研究如何将半生所学与人工智能结合,他正在学习了解机器学习算法,力图通过跨界,把人工智能作为自己经验发挥的基础工具,做更多机器尚不能思考和计算的事情。  这样的职位危机显然还未大规模展现。  医生、金融、记者、甚至教师…之前传统意义上的好工作正在被人工智能侵袭,有人已经敏锐感知,有人则还置身潮水而不觉大势转改。  值得一提的是,戏剧性的一幕仍然出现在乌镇,就在柯洁和朋友结束聚会回酒店的途中,石桥之上,有人正在通过手机观看柯洁大战AlphaGo的视频报道。  他不知道那个视频中的围棋少年正在他面前走过,对于即将影响到个体命运的科技趋势,他也像大部分关注这场对决的人一样,浑然不觉。  AlphaGo就这样在围棋领域落幕了吗?AlphaGo就这样结束了吗?  或许不会。更多的“AlphaGo”正在发生,每个人都会遭遇自己的“AlphaGo”,早晚而已。  AlphaGo的故事才刚刚开始,人工智能的潮水终将把人类带向一个崭新的世界。
1.本网站所转载的作品,目的在于传递更多信息,并不代表本网站赞同其观点和对其真实性负责。
2.如因作品内容,版权和其他问题需要同本网站联系的,请邮件联系我们
2017年首虎被老王秒杀:幕后暗藏哪些意味?
[公告]四川路桥:2017年5月工程中标公告
Copyright (C) 2015 河南头条网
All rights reserved. 渝ICP备号-1AlphaGo之父:关于围棋 人类3000年来犯了一个错
来源:观察者网
原标题:AlphaGo之父:关于围棋,人类3000年来犯了一个错
  4月10日,“人机大战”的消息再次传出,关于人类和AI的对抗再次牵动世界的神经。
  “我会抱必胜心态、必死信念。我一定要击败阿尔法狗!”对于5月23日至27日与围棋人工智能程序AlphaGo(阿尔法狗)的对弈,目前世界排名第一的中国职业九段柯洁放出豪言。
  然而,AlphaGo(阿尔法狗)之父却说,“我们发明阿尔法狗,并不是为了赢取围棋比赛。”
  据澎湃新闻4月13日报道,近日,AlphaGo之父杰米斯?哈萨比斯(Demis Hassabis)在母校英国剑桥大学做了一场题为“超越人类认知的极限”的演讲,解答了世人对于人工智能,对于阿尔法狗的诸多疑问――
  过去3000年里人类低估了棋局哪个区域的重要性?阿尔法狗去年赢了韩国职业九段李世石靠哪几个绝招?今年年初拿下数位国际大师的神秘棋手Master究竟是不是阿尔法狗?为什么围棋是人工智能难解之谜?
杰米斯?哈萨比斯,Deep Mind创始人, AlphaGo之父
  杰米斯?哈萨比斯,Deep Mind创始人,AlphaGo(阿尔法狗)之父, 4岁开始下象棋,8岁时在棋盘上的成功促使他开始思考两个至今令他困扰的问题:第一,人脑是如何学会完成复杂任务的?第二,电脑能否做到这一点?
  17岁时,哈萨比斯就负责了经典模拟游戏《主题公园》的开发,并在1994年发布。他随后读完了剑桥大学计算机科学学位,2005年进入伦敦大学学院,攻读神经科学博士学位,希望了解真正的大脑究竟是如何工作的,以此促进人工智能的发展。2014年他创办的公司Deep Mind被谷歌收购, 公司产品阿尔法狗在2016年大战围棋冠军李世石事件上一举成名。
  哈萨比斯在当天的演讲中透露了韩国棋手李世石去年输给阿尔法狗的致命原因,他最后也提到了阿尔法狗即将迎战的中国棋手柯洁,他说,“柯洁也在网上和阿尔法狗对决过,比赛之后柯洁说人类已经研究围棋研究了几千年了,然而人工智能却告诉我们,我们甚至连其表皮都没揭开。异曲同工,柯洁提到了围棋的真理,我们在这里谈的是科学的真理。”
世界围棋冠军柯洁即将迎战阿尔法狗
  澎湃新闻现场聆听了AlphaGo(阿尔法狗)之父在剑桥大学历时45分钟的演讲,干货满满,请不要漏掉任何一个细节:
  非常感谢大家今天能够到场,今天,我将谈谈人工智能,以及DeepMind近期在做些什么,我把这场报告命名为“超越人类认知的极限”,我希望到了报告结束的时候,大家都清晰了解我想传达的思想。
  1、你真的知道什么是人工智能吗?
  对于不知道DeepMind公司的朋友,我做个简单介绍,我们是在2010年于伦敦成立了这家公司,在2014年我们被谷歌收购,希望借此加快我们人工智能技术的脚步。我们的使命是什么呢?我们的首要使命便是解决人工智能问题;一旦这个问题解决了,理论上任何问题都可以被解决。这就是我们的两大使命了,听起来可能有点狡猾,但是我们真的相信,如果人工智能最基本的问题都解决了的话,没有什么问题是困难的。
  那么我们准备怎样实现这个目标呢?
DeepMind现在在努力制造世界上第一台通用学习机,大体上学习可以分为两类:一种就是直接从输入和经验中学习,没有既定的程序或者规则可循,系统需要从原始数据自己进行学习;第二种学习系统就是通用学习系统,指的是一种算法可以用于不同的任务和领域,甚至是一些从未见过的全新领域。大家肯定会问,系统是怎么做到这一点的?
  其实,人脑就是一个非常明显的例子,这是可能的,关键在于如何通过大量的数据资源,寻找到最合适的解决方式和算法。我们把这种系统叫做通用人工智能,来区别于如今我们当前大部分人在用的仅在某一领域发挥特长的狭义人工智能,这种狭义人工智能在过去的40-50年非常流行。
  IBM发明的深蓝系统(DeepBlue)就是一个很好的狭义人工智能的例子,他在上世纪90年代末期曾打败了国际象棋冠军加里?卡斯帕罗夫(GaryKasporov)。如今,我们到了人工智能的新的转折点,我们有着更加先进、更加匹配的技术。
1997年5月,IBM与世界国际象棋冠军加里?卡斯帕罗夫对决
  2.如何让机器听从人类的命令?
  大家可能想问机器是如何听从人类的命令的,其实并不是机器或者算法本身,而是一群聪明的编程者智慧的结晶。他们与每一位国际象棋大师对话,汲取他们的经验,把其转化成代码和规则,组建了人类最强的象棋大师团队。但是这样的系统仅限于象棋,不能用于其他游戏。对于新的游戏,你需要重新开始编程。在某种程度上,这些技术仍然不够完美,并不是传统意义上的完全人工智能,其中所缺失的就是普适性和学习性。我们想通过“增强学习”来解决这一难题。在这里我解释一下增强学习,我相信很多人都了解这个算法。
  首先,想像一下有一个主体,在AI领域我们称我们的人工智能系统为主体,它需要了解自己所处的环境,并尽力找出自己要达到的目的。这里的环境可以指真实事件,可以是机器人,也可以是虚拟世界,比如游戏环境;主体通过两种方式与周围环境接触;它先通过观察熟悉环境,我们起初通过视觉,也可以通过听觉、触觉等,我们也在发展多感觉的系统;
  第二个任务,就是在此基础上,建模并找出最佳选择。这可能涉及到对未来的预期,想像,以及假设检验。这个主体经常处在真实环境中,当时间节点到了的时候,系统需要输出当前找到的最佳方案。这个方案可能或多或少会改变所处环境,从而进一步驱动观察的结果,并反馈给主体。
  简单来说,这就是增强学习的原则,示意图虽然简单,但是其中却涉及了极其复杂的算法和原理。如果我们能够解决大部分问题,我们就能够搭建普适人工智能。这是因为两个主要原因:首先,从数学角度来讲,我的合伙人,一名博士,他搭建了一个系统叫&AI-XI&,用这个模型,他证明了在计算机硬件条件和时间无限的情况下,搭建一个普适人工智能,需要的信息。另外,从生物角度来讲,动物和人类等,人类的大脑是多巴胺控制的,它在执行增强学习的行为。因此,不论是从数学的角度,还是生物的角度,增强学习是一个有效的解决人工智能问题的工具。
  3.为什么围棋是人工智能难解之谜?
  接下来,我要主要讲讲我们最近的技术,那就是去年诞生的阿尔法狗;希望在座的大家了解这个游戏,并尝试玩玩,这是个非常棒的游戏。
  围棋使用方形格状棋盘及黑白二色圆形棋子进行对弈,棋盘上有纵横各19条直线将棋盘分成361个交叉点,棋子走在交叉点上,双方交替行棋,以围地多者为胜。围棋规则没有多复杂,我可以在五分钟之内教给大家。
  这张图展示的就是一局已结束,整个棋盘基本布满棋子,然后数一下你的棋子圈出的空间以及对方棋子圈出的空间,谁的空间大,谁就获胜。在图示的这场势均力敌的比赛中,白棋一格之差险胜。
白棋以一格之差险胜
  其实,了解这个游戏的最终目的非常难,因为它并不像象棋那样,有着直接明确的目标,在围棋里,完全是凭直觉的,甚至连如何决定游戏结束对于初学者来说,都很难。围棋是个历史悠久的游戏,有着3000多年的历史,起源于中国,在亚洲,围棋有着很深的文化意义。孔子还曾指出,围棋是每一个真正的学者都应该掌握的四大技能之一(琴棋书画),所以在亚洲围棋是种艺术,专家们都会玩。
  如今,这个游戏更加流行,有4000万人在玩围棋,超过2000多个顶级专家,如果你在4-5岁的时候就展示了围棋的天赋,这些小孩将会被选中,并进入特殊的专业围棋学校,在那里,学生从6岁起,每天花12个小时学习围棋,一周七天,天天如此。直到你成为这个领域的专家,才可以离开学校毕业。这些专家基本是投入人生全部的精力,去揣摩学习掌握这门技巧,我认为围棋也许是最优雅的一种游戏了。
  像我说的那样,这个游戏只有两个非常简单的规则,而其复杂性却是难以想象的,一共有10170 (10的170次方) 种可能性,这个数字比整个宇宙中的原子数次方)都多的去了,是没有办法穷举出围棋所有的可能结果的。
  我们需要一种更加聪明的方法。你也许会问为什么计算机进行围棋的游戏会如此困难,1997年,IBM的人工智能DeepBlue(深蓝)打败了当时的象棋世界冠军加里?卡斯帕罗夫,围棋一直是人工智能领域的难解之谜。我们能否做出一个算法来与世界围棋冠军竞争呢?要做到这一点,有两个大的挑战:
  搜索空间庞大(分支因数就有200),一个很好的例子,就是在围棋中,平均每一个棋子有两百个可能的位置,而象棋仅仅是20. 围棋的分支因数远大于象棋。
  二、比这个更难的是,几乎没有一个合适的评价函数来定义谁是赢家,赢了多少;这个评价函数对于该系统是至关重要的。而对于象棋来说,写一个评价函数是非常简单的,因为象棋不仅是个相对简单的游戏,而且是实体的,只用数一下双方的棋子,就能轻而易举得出结论了。你也可以通过其他指标来评价象棋,比如棋子移动性等。
  所有的这些在围棋里都是不可能的,并不是所有的部分都一样,甚至一个小小部分的变动,会完全变化格局,所以每一个小的棋子都对棋局有着至关重要的影响。最难的部分是,我称象棋为毁灭性的游戏,游戏开始的时候,所有的棋子都在棋盘上了,随着游戏的进行,棋子被对方吃掉,棋子数目不断减少,游戏也变得越来越简单。相反,围棋是个建设性的游戏,开始的时候,棋盘是空的,慢慢的下棋双方把棋盘填满。
  因此,如果你准备在中场判断一下当前形势,在象棋里,你只需看现在的棋盘,就能告诉你大致情况;
  在围棋里,你必须评估未来可能会发生什么,才能评估当前局势,所以相比较而言,围棋难得多。也有很多人试着将DeepBlue的技术应用在围棋上,但是结果并不理想,这些技术连一个专业的围棋手都打不赢,更别说世界冠军了。
  所以大家就要问了,连电脑操作起来都这么难,人类是怎样解决这个问题的?其实,人类是靠直觉的,而围棋一开始就是一个靠直觉而非计算的游戏。所以,如果你问一个象棋选手,为什么这步这样走,他会告诉你,这样走完之后,下一步和下下一步会怎样走,就可以达到什么样的目的。这样的计划,有时候也许不尽如人意,但是起码选手是有原因的。
  然而围棋就不同了,如果你去问世界级的大师,为什么走这一步,他们经常回答你直觉告诉他这么走,这是真的,他们是没法描述其中的原因的。我们通过用加强学习的方式来提高人工神经网络算法,希望能够解决这一问题。
  我们试图通过深度神经网络模仿人类的这种直觉行为,在这里,需要训练两个神经网络,一种是决策网络,我们从网上下载了成百万的业余围棋游戏,通过监督学习,我们让阿尔法狗模拟人类下围棋的行为;我们从棋盘上任意选择一个落子点,训练系统去预测下一步人类将作出的决定;系统的输入是在那个特殊位置最有可能发生的前五或者前十的位置移动;这样,你只需看那5-10种可能性,而不用分析所有的200种可能性了。
  一旦我们有了这个,我们对系统进行几百万次的训练,通过误差加强学习,对于赢了的情况,让系统意识到,下次出现类似的情形时,更有可能做相似的决定。相反,如果系统输了,那么下次再出现类似的情况,就不会选择这种走法。我们建立了自己的游戏数据库,通过百万次的游戏,对系统进行训练,得到第二种神经网络。选择不同的落子点,经过置信区间进行学习,选出能够赢的情况,这个几率介于0-1之间,0是根本不可能赢,1是百分之百赢。
  通过把这两个神经网络结合起来(决策网络和数值网络),我们可以大致预估出当前的情况。这两个神经网络树,通过蒙特卡洛算法,把这种本来不能解决的问题,变得可以解决。我们网罗了大部分的围棋下法,然后和欧洲的围棋冠军比赛,结果是阿尔法狗赢了,那是我们的第一次突破,而且相关算法还被发表在《自然》科学杂志。
  接下来,我们在韩国设立了100万美元的奖金,并在2016年3月,与世界围棋冠军李世石进行了对决。李世石先生是围棋界的传奇,在过去的10年里都被认为是最顶级的围棋专家。我们与他进行对决,发现他有非常多创新的玩法,有的时候阿尔法狗很难掌控。
  比赛开始之前,世界上每个人(包括他本人在内)都认为他一定会很轻松就打赢这五场比赛,但实际结果是我们的阿尔法狗以4:1获胜。围棋专家和人工智能领域的专家都称这具有划时代的意义。对于业界人员来说,之前根本没想到。
  4.棋局哪个关键区域被人类忽视了?
  这对于我们来说也是一生仅有一次的偶然事件。这场比赛,全世界28亿人在关注,35000多篇关于此的报道。整个韩国那一周都在围绕这个话题。真是一件非常美妙的事情。对于我们而言,重要的不是阿尔法狗赢了这个比赛,而是了解分析他是如何赢的,这个系统有多强的创新能力。
  阿尔法狗不仅仅只是模仿其他人类选手的下法,他在不断创新。在这里举个例子 ,这是第二局里的一个情况,第37步,这一步是我整个比赛中最喜欢的一步。在这里,黑棋代表阿尔法狗,他将棋子落在了图中三角标出的位置。为什么这步这么关键呢?为什么大家都被震惊到了。
图左:第二局里,第37步,黑棋的落子位置 图右:之前貌似陷入困境的两个棋子
  其实在围棋中有两条至关重要的分界线,从右数第三根线。如果在第三根线上移动棋子,意味着你将占领这个线右边的领域。而如果是在第四根线上落子,意味着你想向棋盘中部进军,潜在的,未来你会占棋盘上其他部分的领域,可能和你在第三根线上得到的领域相当。
  所以在过去的3000多年里,人们认为在第三根线上落子和第四根线上落子有着相同的重要性。但是在这场游戏中,大家看到在这第37步中,阿尔法狗落子在了第五条线,进军棋局的中部区域。与第四根线相比,这根线离中部区域更近。
  这可能意味着,在几千年里,人们低估了棋局中部区域的重要性。
  有趣的是,围棋就是一门艺术,是一种客观的艺术。我们坐在这里的每一个人,都可能因为心情好坏产生成千上百种的新想法,但并不意味着每一种想法都是好的。而阿尔法狗却是客观的,他的目标就是赢得游戏。
  5.阿尔法狗拿下李世石靠哪几个绝招?
  大家看到在当前的棋局下,左下角那两个用三角标出的棋子看起来好像陷入了困难,而15步之后,这两个棋子的力量扩散到了棋局中心,一直延续到棋盘的右边,使得这第37步恰恰落在这里,成为一个获胜的决定性因素。
  在这一步上阿尔法狗非常具有创新性。
  我本人是一个很业余的棋手,让我们看看一位世界级专家Michael Redmond对这一步的评价。 Michael是一位9段选手(围棋最高段),就像是功夫中的黑段一样,他说:“
  这是非常令人震惊的一步,就像是一个错误的决定。”在实际模拟中,Michael其实一开始把棋子放在了另外一个地方,根本没想到阿尔法狗会走这一步。像这样的创新,在这个比赛中,阿尔法狗还有许多。在这里,我特别感谢李世石先生,其实在我们赢了前三局的时候,他下去了。
2016年3月阿尔法狗大战世界围棋冠军李世石,以4:1的总分战胜了人类
  那是三场非常艰难的比赛,尤其是第一场。因为我们需要不断训练我们的算法,阿尔法狗之前打赢了欧洲冠军,经过这场比赛,我们知道了欧洲冠军和世界冠军的差别。理论上来讲,我们的系统也进步了。
  但是当你训练这个系统的时候,我们不知道有多少是过度拟合的,因此,在第一局比赛结束之前,系统是不知道自己的统计结果的。所以,其实第一局,我们非常紧张,因为如果第一局输了,很有可能我们的算法存在巨大漏洞,有可能会连输五局。但是如果我们第一局赢了,证明我们的加权系统是对的。
  不过,李世石先生在第四场的时候,回来了,也许压力缓解了许多,他做出了一步非常创新性的举动,我认为这是历史上的创新之举。这一步迷惑了阿尔法狗,使他的决策树进行了错误估计,一些中国的专家甚至称之为“黄金之举”。
  通过这个例子,我们可以看到多少的哲理蕴含于围棋中。这些顶级专家,用尽必生的精力,去找出这种黄金之举。其实,在这步里,阿尔法狗知道这是非常不寻常的一步,他当时估计李世石通过这步赢的可能性是0.007%,阿尔法狗之前没有见过这样的落子方式,在那2分钟里,他需要重新搜索决策计算。
  我刚刚已经提到过这个游戏的影响:28亿人观看,35000相关文章的媒体报道,在西方网售的围棋被一抢而空,我听说MIT(美国麻省理工学院)还有其他很多高校,许多人新加入了围棋社。
第四局里,李世石第78步的创新之举
  我刚才谈到了直觉和创新,直觉是一种含蓄的表达,它是基于人类的经历和本能的一种思维形式,不需要精确计算。这一决策的准确性可以通过行为进行评判。在围棋里很简单,我们给系统输入棋子的位置,来评估其重要性。阿尔法狗就是在模拟人类这种直觉行为。创新,我认为就是在已有知识和经验的基础上,产生一种原始的,创新的观点。阿尔法狗很明显的示范了这两种能力。
  6.神秘棋手Master究竟是不是阿尔法狗?
  那么我们今天的主题是“超越人类认知的极限”,下一步应该是什么呢?从去年三月以来,我们一直在不断完善和改进阿尔法狗,大家肯定会问,既然我们已经是世界冠军了,还有什么可完善的? 其实,我们认为阿尔法狗还不是完美的,还需要做更多的研究。
  首先,我们想要继续研究刚才提到的和李世石的第四局的比赛,来填充知识的空白;这个问题其实已经被解决了,我们建立了一个新的阿尔法狗分系统,不同于主系统,这个分支系统是用来困惑主系统的。我们也优化了系统的行为,以前我们需要花至少3个月来训练系统,现在只需要一周时间。
  第二,我们需要理解阿尔法狗所采取的决定,并对其进行解释;阿尔法狗这样做的原因是什么,是否符合人类的想法等等;我们通过对比人类大脑对于不同落子位置的反应以及阿尔法狗对于棋子位置的反应,以期找到一些新的知识;本质上就是想让系统更专业。
  我们在网络上与世界顶级的专家对决,一开始我们使用了一个假名(Master),在连胜之后被大家猜出是阿尔法狗。这些都是顶级的专家,我们至今已赢了60位大师了。如果你做个简单的贝叶斯分析,你会发现阿尔法狗赢不同对手的难易也不一样。而且,阿尔法狗也在不断自我创新,比如说图中右下角这个棋子(圆圈标处),落在第二根线里,以往我们并不认为这是个有效的位置。实际上,韩国有的团队预约了这些游戏,想研究其中新的意义和信息。
阿尔法狗自我创新,落在第二格线的旗子
  柯洁,既是中国的围棋冠军,也是目前的世界围棋冠军,他才19岁。
  他也在网上和阿尔法狗对决过,比赛之后他说人类已经研究围棋研究了几千年了,然而人工智能却告诉我们,我们甚至连其表皮都没揭开。他也说人类和人工智能的联合将会开创一个新纪元,将共同发现围棋的真谛。异曲同工,柯洁提到了围棋的真理,我们在这里谈的是科学的真理。
红遍网络的神秘棋手Master日在腾讯围棋对弈平台赢了柯洁
Master执白中盘胜柯洁,Master就是AlphaGo的升级版
  那么围棋的新纪元是否真的到来了呢?围棋史上这样的划时代事件曾经发生过两次,第一次是发生在1600年左右的日本,20世纪30-40年代的日本,日本一位当时非常杰出的围棋高手吴清源提出了一个全新的关于围棋的理论,将围棋提升到了一个全新的境界。大家说如今,阿尔法狗带来的是围棋界的第三次变革。
  7.为什么人工智能“下围棋”强于“下象棋”?
  我想解释一下,为什么人工智能在围棋界所作出的贡献,要远大于象棋界。如果我们看看当今的世界国际象棋冠军芒努斯?卡尔森,他其实和之前的世界冠军没什么大的区别,他们都很优秀,都很聪明。但为什么当人工智能出现的时候,他们可以远远超越人类?
  我认为其中的原因是,国际象棋更注重战术,而阿尔法狗更注重战略。如今世界顶级的国际象棋程序再不会犯技术性的错误,而在人类身上,不可能不犯错。
  第二,国际象棋有着巨大的数据库,如果棋盘上少于9个棋子的时候,通过数学算法就可以计算出谁胜谁败了。计算机通过成千上万的迭代算法,就可以计算出来了。因此,当棋盘上少于九个棋子的时候,下象棋时人类是没有办法获胜的。
  因此,国际象棋的算法已经近乎极致,我们没有办法再去提高它。然而围棋里的阿尔法狗,在不断创造新的想法,这些全新的想法,在和真人对决的时候,顶级的棋手也可以把其纳入到考虑的范畴,不断提高自己。
  就如欧洲围棋冠军樊麾(第一位与阿尔法狗对阵的人类职业棋手)所说的那样,在和阿尔法狗对决的过程中,机器人不断创新的下法,也让人类不断跳出自己的思维局限,不断提高自己。大家都知道,经过专业围棋学校里30多年的磨练,他们的很多思维已经固化,机器人的创新想法能为其带来意想不到的灵感。我真的相信如果人类和机器人结合在一起,能创造出许多不可思议的事情。我们的天性和真正的潜力会被真正释放出来。
  8.阿尔法狗不为了赢取比赛又是为了什么?
  就像是天文学家利用哈勃望远镜观察宇宙一样,利用阿尔法狗,围棋专家可以去探索他们的未知世界,探索围棋世界的奥秘。
  我们发明阿尔法狗,并不是为了赢取围棋比赛,我们是想为测试我们自己的人工智能算法搭建一个有效的平台,我们的最终目的是把这些算法应用到真实的世界中,为社会所服务。
  当今世界面临的一个巨大挑战就是过量的信息和复杂的系统,我们怎么才能找到其中的规律和结构,从疾病到气候,我们需要解决不同领域的问题。这些领域十分复杂,对于这些问题,即使是最聪明的人类也无法解决的。
  我认为人工智能是解决这些问题的一个潜在方式。在如今这个充斥着各种新技术的时代,人工智能必须在人类道德基准范围内被开发和利用。本来,技术是中性的,但是我们使用它的目的和使用它的范围,大大决定了其功能和性质,这必须是一个让人人受益的技术才行。
  我自己的理想是通过自己的努力,让人工智能科学家或者人工智能助理和医药助理成为可能,通过该技术,我们可以真正加速技术的更新和进步。
  (特约撰稿 刘秀云 本文作者系英国剑桥大学神经学博士生,AlphaGo之父哈萨比斯在剑桥大学的校友,文章小标题系编者所注)
(责任编辑:杨晨虹)
&&&&&&</div
中国人哪来这么多钱?[]
客服热线:86-10-
客服邮箱:}

我要回帖

更多关于 人工智能打败围棋冠军 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信