泰坦机器人和阿尔法狗下象棋棋能赢吗?

阿尔法狗是什么意思 谷歌阿尔法机器人棋谱全面剖析
时间: 10:56:30来源:作者:佚名(0)
阿尔法狗是什么意思?阿尔法围棋(AlphaGo)其实是一款围棋人工智能程序,由Google旗下DeepMind公司的戴维?西尔弗、艾佳?黄和戴密斯?哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。虽然神经网络在几十年前就有了,直到最近才形势明朗。这是因为他们需要大量的“训练”去发现矩阵中的数字价值。对早期研究者来说,想要获得不错效果的最小量训练都远远超过计算能力和能提供的数据的大小。但最近几年,一些能获取海量资源的团队重现挖掘神经网络,就是通过“大数据”技术来高效训练。两个大脑AlphaGo是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以我们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。第一大脑: 落子选择器 (Move Picker)AlphaGo的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。你可以理解成“落子选择器”。(落子选择器是怎么看到棋盘的?数字表示最强人类选手会下在哪些地方的可能。)团队通过在KGS(网络围棋对战平台)上最强人类对手,百万级的对弈落子去训练大脑。这就是AlphaGo最像人的地方,目标是去学习那些顶尖高手的妙手。这个不是为了去下赢,而是去找一个跟人类高手同样的下一步落子。AlphaGo落子选择器能正确符合57%的人类高手。(不符合的不是意味着错误,有可能人类自己犯的失误)更强的落子选择器AlphaGo系统事实上需要两个额外落子选择器的大脑。一个是“强化学习的策略网络(Policy Network)”,通过百万级额外的模拟局来完成。你可以称之为更强的。比起基本的训练,只是教网络去模仿单一人类的落子,高级的训练会与每一个模拟棋局下到底,教网络最可能赢的下一手。Sliver团队通过更强的落子选择器总结了百万级训练棋局,比他们之前版本又迭代了不少。单单用这种落子选择器就已经是强大的对手了,可以到业余棋手的水平,或者说跟之前最强的围棋AI媲美。这里重点是这种落子选择器不会去“读”。它就是简单审视从单一棋盘位置,再提出从那个位置分析出来的落子。它不会去模拟任何未来的走法。这展示了简单的深度神经网络学习的力量。更快的落子选择器AlphaGo当然团队没有在这里止步。下面我会阐述是如何将阅读能力赋予AI的。为了做到这一点,他们需要更快版本的落子选择器大脑。越强的版本在耗时上越久-为了产生一个不错的落子也足够快了,但“阅读结构”需要去检查几千种落子可能性才能做决定。Silver团队建立简单的落子选择器去做出“快速阅读”的版本,他们称之为“滚动网络”。简单版本是不会看整个19*19的棋盘,但会在对手之前下的和新下的棋子中考虑,观察一个更小的窗口。去掉部分落子选择器大脑会损失一些实力,但轻量级版本能够比之前快1000倍,这让“阅读结构”成了可能。第二大脑:棋局评估器 (Position Evaluator)AlphaGo的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是论文中提到的“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。(局面评估器是怎么看这个棋盘的。深蓝色表示下一步有利于赢棋的位置。)局面评估器也通过百万级别的棋局做训练。Silver团队通过 复制两个AlphaGo的最强落子选择器,精心挑选随机样本创造了这些局面。这里AI 落子选择器在高效创建大规模数据集去训练局面评估器是非常有价值的。这种落子选择器让大家去模拟继续往下走的很多可能,从任意给定棋盘局面去猜测大致的双方赢棋概率。而人类的棋局还不够多恐怕难以完成这种训练。增加阅读这里做了三个版本的落子选择大脑,加上局面评估大脑,AlphaGo可以有效去阅读未来走法和步骤了。阅读跟大多数围棋AI一样,通过蒙特卡洛树搜索(MCTS)算法来完成。但AlphaGo 比其他AI都要聪明,能够更加智能的猜测哪个变种去探测,需要多深去探测。(蒙特卡洛树搜索算法)如果拥有无限的计算能力,MCTS可以理论上去计算最佳落子通过探索每一局的可能步骤。但未来走法的搜索空间对于围棋来说太大了(大到比我们认知宇宙里的粒子还多),实际上AI没有办法探索每一个可能的变种。MCTS做法比其他AI有多好的原因是在识别有利的变种,这样可以跳过一些不利的。Silver团队让AlphaGo装上MCTS系统的模块,这种框架让设计者去嵌入不同的功能去评估变种。最后马力全开的AlphaGo系统按如下方式使用了所有这些大脑。1. 从当前的棋盘布局,选择哪些下一步的可能性。他们用基础的落子选择器大脑(他们尝试使用更强的版本,但事实上让AlphaGo更弱,因为这没有让MCTS提供更广阔的选择空间)。它集中在“明显最好”的落子而不是阅读很多,而不是再去选择也许对后来有利的下法。2. 对于每一个可能的落子,评估质量有两种方式:要么用棋盘上局面评估器在落子后,要么运行更深入蒙特卡罗模拟器(滚动)去思考未来的落子,使用快速阅读的落子选择器去提高搜索速度。AlphaGo使用简单参数,“混合相关系数”,将每一个猜测取权重。最大马力的AlphaGo使用 50/50的混合比,使用局面评估器和模拟化滚动去做平衡判断。随着他们使用插件的不同,AlphaGo的能力变化和上述步骤的模拟。仅使用独立大脑,AlphaGo跟最好的计算机围棋AI差不多强,但当使用这些综合手段,就可能到达职业人类选手水平。(AlphaGo的能力变化与MCTS的插件是否使用有关。)工程优化:分布式计算,网络计算机去提升MCTS速度,但这些都没有改变基础算法。这些算法部中分精确,部分近似。在特别情况下,AlphaGo通过更强的计算能力变的更强,但计算单元的提升率随着性能变强而减缓。优势和劣势我认为AlphaGo在小规模战术上会非常厉害。它知道通过很多位置和类型找到人类最好的下法,所以不会在给定小范围的战术条件下犯明显错误。但是,AlphaGo有个弱点在全局判断上。它看到棋盘式通过5*5金字塔似的过滤,这样对于集成战术小块变成战略整体上带来麻烦,同样道理,图片分类神经网络往往对包含一个东西和另一个的搞不清。比如说围棋在角落上一个定式造成一个墙或者引征,这会剧烈改变另一个角上的位置估值。就像其他的基于MCTS的AI, AlphaGo对于需要很深入阅读才能解决的大势判断上,还是麻烦重重的,比如说大龙生死劫。AlphaGo 对一些故意看起来正常的局也会失去判断,天元开盘或者少见的定式,因为很多训练是基于人类的棋局库。我还是很期待看到AlphaGo和李世石9段的对决!我预测是:如果李使用定式,就像跟其他职业棋手的对决,他可能会输,但如果他让AlphaGo陷入到不熟悉情形下,他可能就赢。不服来战这个机器人下棋没输过
下棋机器人可以“一心二用”,一边下五子棋一边下象棋饮水鸟消防无人机现代快报记者 顾炜 摄  “阿尔法狗”与李世石的围棋大战,曾经轰动全世界。会下棋的机器人真的有那么神奇?  今天,2016年全国科技活动周暨省第二十八届科普宣传周将在南京理工大学开幕。现场,各种高科技法宝纷纷亮相。会下棋的机器人,一机会同下五子棋和象棋两种,还会出大招;月球车不仅能在地面优雅地“行走”,还能“拿”起矿泉水;饮水鸟一上一下,不停地摆动着身体,它虽然制作简单,但能预测天气……  现代快报记者 胡玉梅  下棋机器人从没输过  现场的“创新屋”内,会下棋的机器人吸引了很多人围观。“它和前段时间"阿尔法狗"相比怎么样?”很多观众围着它,向一旁的工作人员询问。细细看去,下棋机器人通体白色,整个身子就像一只机器手。它长相虽然有些“呆萌”,但下棋速度可不慢。棋盘在玻璃柜子里,机器人就在柜子内和对手下棋,而对手则在外面通过触摸屏和它对弈。  现场的技术人员介绍说,这台下棋机器人诞生已经有些时间了,“阿尔法狗”下的是围棋,是人工智能机器人;而这个会下棋的机器人下的是五子棋和象棋,是通过程序输入制作而成。“从诞生以来,它下棋没输过,是一个专家型的选手。”而现代快报记者也注意到,一盘棋下来,和机器人下棋的市民宣告落败。  “饮水鸟”能预测天气  在江苏省物理学会的柜台上,蛇形摆、饮水鸟,各种奇特小物件,吸引了来参观的市民。  饮水鸟,是两只造型很犀利的小鸟,它们中间放了一个小小的水槽。“这个饮水鸟,可以一直喝一直喝,直到水槽里的水没有了为止。”南京大学物理学院高惠滨老师介绍,饮水鸟之所以能不停喝水,和水管里放了一丢丢乙醚有关。乙醚是挥发性的,饮水鸟喝水的时候,上面的乙醚慢慢变成液体,鸟的头就重了,就去喝水了。  这个“饮水鸟”有什么作用呢?高惠滨对现代快报记者说,可以用它来预报天气。“通过饮水鸟喝水的速度,可以知道南京的天气如何。”高惠滨说,如果天气干燥炎热,饮水鸟喝水的速度就快,因为乙醚挥发会加快;如果湿度重,下雨天,就会变慢,因为乙醚挥发慢。
(责任编辑: HN666)
05/13 07:2305/13 07:2205/12 14:4405/12 10:0905/11 21:1205/11 06:4405/09 13:1505/06 09:47
新闻精品推荐
每日要闻推荐
社区精华推荐
精彩焦点图鉴
  【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。阿尔法狗为什么不用机械臂而用人肉臂下棋? - 知乎71被浏览<strong class="NumberBoard-itemValue" title="2分享邀请回答3添加评论分享收藏感谢收起362 条评论分享收藏感谢收起李世石:我再也不想跟“阿尔法狗”下棋了|人工智能|阿法狗|李世石_新浪科技_新浪网
李世石:我再也不想跟“阿尔法狗”下棋了
李世石成为达沃斯论坛焦点
  来源:
  在今年3月进行的围棋人机大战中,阿尔法狗(AlphaGo)最终以4:1战胜了韩国名将李世石九段,引起了全世界的广泛关注,也让神经科学和深度学习等概念进入了公众的视野。
  本届达沃斯也专门针对这一世纪大战举办了一场研讨会议,以探讨计算机程序战胜围棋世界冠军的科技和社会意义。
  会议邀请了当事人李世石,以及两位人工智能的专家与学者——Vicarious公司联合创始人兼首席技术官Dileep George和耶鲁大学生物伦理学跨学科中心学者Wendell Wallach参与讨论。会议的主持人是上海科技大学创业与管理学院院长李玫。
  这场分论坛引起了众多参会者的关注,开始前30分钟现场便已排起了长龙,最终除了与会者只允许5家媒体进入会场旁听,有幸成为了这5家媒体中的一家。
为见李世石,达沃斯会场排起长龙
  会议一开始,主持人李玫便针对“人工智能”的定义向嘉宾们抛出疑问,而嘉宾们对此意见不一。
  Dileep George认为能够通过数据了解并认识世界,通过不同的学习模型掌握解决问题的技巧,就称得上“人工智能”。而Wendell Wallach则认为,能够从数据中学习是人工智能的一大特征,但因为目前机器还不能在复杂的环境中感知事物,要达到真正的人工智能还有一定的距离。
  真正对“人工智能”有直观认识的,毫无疑问是曾直接跟阿尔法狗对峙的李世石。在问到当时对战阿尔法狗的感受时,李世石表示最大的感受是“惊讶”。
  “围棋有很多不确定的因素,机器的局限性是很多的,在下棋过程中也会出现漏洞,因此之前观看阿尔法狗跟樊麾的比赛让我以为计算机达不到围棋选手的最高水平。结果大家都知道:我输了。”李世石回忆道。
  由于人与人对弈时或多或少会有情感流露,面对毫无情感而言的阿尔法狗,也让李世石有更大的心理压力,从而困难重重。
  “人会有心理上的摇摆,即使知道准确的答案,在下子那一刻还是有可能会选择另一条路,考虑其他的选择。但阿尔法狗不会有任何的动摇,这就是我所面对的最大困难。”李世石表示,人与机器对弈会处于非常不利的局面,譬如如果对战三局,棋手通常每局都会采用不一样的开局,而阿尔法狗则不会有任何变化。
  “面对毫无感情的对手是非常难受的事情,这让我有种再也不想跟它比赛的感觉。”李世石无奈地承认,如果再有机会跟阿尔法狗对弈,情况一定也会非常艰难。
  不过面对背后数以百计的CPU、GPU以及众多科学家支撑的阿尔法狗,李世石并未感到不公平,他认为自己最大的失误,在于对深度学习这个领域没有足够的了解,而轻视了对手。
  “在看过阿尔法狗跟樊麾的比赛后,我一直认为自己会赢,但没想到短短六个月阿尔法狗的棋艺竟然有了如此大的进步,让我非常吃惊。”在每次对战之前,李世石都会在自己脑海里进行很多演练,但因为上场的对手不是人类,让他感觉非常生疏。
  回顾那几局比赛,李世石认为自己还是有机会战胜阿尔法狗,他觉得由于自己对阿尔法狗的实力判断失误,导致自己没有发挥出应有的实力。“但是谁知道这几个月里面它又有了怎样的长进?”李世石依然表达了他的疑虑。
  阿尔法狗在比赛中曾经有过不按套路的表现,如果按照人类的定义,这或许就是机器所表现出来的“创意”。
  不过三位嘉宾均认为“创意”对人和对机器的定义是不一样的,因为双方的认知范围并不一致。“阿尔法狗甚至可能不知道自己在下棋。”李世石说。
  在阿尔法狗取得令人赞叹的成就后,人工智能将会对我们的生活带来什么样的影响?Wendell Wallach认为,这表明,机器学习的能力越来越重要,比如机器能识别图像的能力,就为人们带来了人脸识别、无人驾驶、天气预测等方面的应用,深度学习在医疗领域也将有广泛的应用。
  Wendell Wallach同时也指出,人工智能在社会伦理上将面临一些进退两难的困境。比如面对即将发生的交通事故,无人驾驶的人工智能应该挽救乘客还是挽救路上的人?人们接受问卷调查普遍认为应该做出“挽救更多生命”的选择,但被问到会不会买这样的无人驾驶车,大部分人的答案却是不买。这显示人们对人工智能依然持有不信任的态度。
  李世石认为人工智能未来在围棋领域的发展则简单得多:“人工智能在发展,但人也在发展。”他认为,虽然在围棋领域人类将越来越难战胜人工智能,但因为人工智能是可预知的,能够非常准确地完成自己的任务,他愿意让人工智能指导自己的女儿学下围棋。
  最后主持人李玫总结道,人们常常不由自主地将人工智能放在人的对立面,譬如认为人们的工作将被机器替代,但实际上培养下一代,让人类跟随技术一起成长,将人类的能力跟机器的能力融合起来,才能产生超级智力,解决更多的问题。
在这一事件发生后,市场上对陈天桥抄底Lending Club的行为评价褒...
资本与经理人的较量,后者从无胜算,哪怕如乔布斯那样的天才,也...
此次高通诉魅族背后,反映出的是我们部分主流手机厂商的创新战略...
于海南文昌航天发射场首飞成功,意味着我国载人航天工程空间实验室任务的序幕正式拉开。
名人借助直播推销力让人们看到,“网络达人直播+电商”或许是一门好生意。}

我要回帖

更多关于 阿尔法狗的机器人 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信