如果alpha敢和你吵架 zero进入象棋会怎么样

点击联系发帖人 时间：2017-11-05 04:46

中国象棋 alphago

如何看待AlphaGo Zero通过完全自学100-0完爆AlphaGo？-Lauzi的回答-悟空问答
扫一扫，体验手机版问答
悟空问答App全新上线看热点讨论问明星专家
Nature今天上线的这篇重磅论文，详细介绍了谷歌DeepMind团队最新的研究成果。人工智能的一项重要目标，是在没有任何先验知识的前提下，通过完全的自学，在极具挑战的领域，达到超人的境地。
新一代的阿法元(AlphaGo Zero), 完全从零开始，不需要任何历史棋谱的指引，更不需要参考人类任何的先验知识，完全靠自己一个人强化学习（reinforcement learning）和参悟, ，棋艺增长远超阿法狗，百战百胜，击溃阿法狗100-0。
你如何看待？
如何看待AlphaGo Zero通过完全自学100-0完爆AlphaGo？
据阿法狗公司深心（DeepMind）主人介绍，阿法狗的算法是通过对围棋大师们的布局图像模式的大数据研究模拟而成。由于围棋规则太简单，按规则复杂的国际象棋一样的走法概率算法行不通，因为围棋开局的每一步走法可能的选择数量超越了已知宇宙所有的星星数量。因此无论哪位大师对弈大哥阿法狗等于对弈所有大师的集合，必败无疑。小弟阿法元的算法则完全避开了人类的布局模式和大数据、从零开始，在不断替换不断提高的模拟对手的引导下，小弟在几天之内就完成了大哥在几个月内完成的培训，几乎无师自通，并以绝对优势击败了大哥。主人很骄傲，认为只是第一性原理（first principles）的胜利，关键在于算法的重新（从零）设计。我们对此表示赞叹、祝贺，这算得上人工智能史无前例的成就。主人还表示深心超越了人类智能，如此第一性原理、“白手起家”（tabula rasa）的算法可以沿用到任何领域。我是个儒家学徒、怀疑论者，忍不住要泼点凉水。首先，围棋只是个“二维”空间的游戏，很简单，而现实是个复杂的“三维”空间。就像天体物理学，两个天体间的运动可以模拟、计算，三个天体以上数学理论甚至计算机模拟就束手无策了，换言之，牛顿定律、爱因斯坦相对论可以计算太阳与地球的天体互动，加个月亮数学就死了。就游戏而言，两个玩家可以在博弈论中列表、一目了然，三个玩家就无法列表了。事实上，古希腊人是第一性原理的鼻祖。我们都学过平面几何，欧几里德就是从简单的公理、特理、定义开始进行他的推算和逻辑论证，换言之，他可以从已知的定理滴水不漏地推算出全新的定律。深心的算法或思维继承了欧几里德的哲学，就是我们还不太熟悉的形而上学。深心的人工智能在围棋界的成就要归功于古希腊。欧洲文艺复兴时期的科学家如牛顿、伽利略等和哲学家如斯宾诺莎、康德等均对欧几里德敬若神灵，可以说没有古希腊形而上学就没有欧洲的文艺复兴、科学革命，甚至也不会有现代爱因斯坦的相对论，后者的数学理论就是几何。不可否认形而上学在理论科学的应用，但它在复杂的现实特别是社会现实就很难行得通，如康德就企图按第一性原理推出整套哲学体系，这种“白手起家”的算法只能以失败或不了了之而告终。哲学、人文学的基础或前提必须是真实的自然而不是想象的超自然。其次，在“三维”世界，人对机器的信息输入和操作必须转换为数码、数学和逻辑的方式，由此机器对人类知识积累的接受就打了个折扣，事实上，人在知识信息输出前对自然的第一认知学习已经打了第一折扣。由此可见，人工智能想在整体上超越人类智能原则上是不可能的。除了空间维度和信息输入方面的局限，人工智能有一点永远不可突破的区域就是意识和情感，情感来自意识，而意识来自自然和有机的炭基生命，指望无机的硅基机器有朝一日产生情感无疑是天方夜谭。我有位性格浪漫的朋友经常在微信个人圈放嗮微软的智能机器小冰写的诗。据说小冰花了四天时间学习写诗，然后就写了136首诗，分别刊登在北京晚报等报刊杂志上。这是她的新作：《用别人的心》：“他们的墓碑时候/我静悄悄的顺着太阳一样/把全世界从没有了解的开始/有人说我的思想他们的墓碑时候/你为甚在梦中做梦/用别人的心/又看到了好梦月。” 我对他的赞誉是，浪漫到了相信机器也能浪漫。有点类似我们对阿法元的热烈反应。就意识而言，无论是阿法哥还是阿法弟，他们毫无意识到自己在下围棋，更没有"自我"。
中国棋手柯洁在得知AlphaGo Zero的消息后，第一时间发微博表示：人类太多余了......在围棋比赛上，谷歌旗下DeepMind团队的人工智能程序AlphaGo横扫世界顶尖棋手的事情，早已不是新闻。就在昨天凌晨，DeepMind在一篇论文中详细介绍了迄今最强大的一版AlphaGo—— AlphaGo Zero（阿尔法元）。而这个新AI自学3天就以100-0完爆了当年的阿法狗。新一代的阿尔法元有多厉害呢？他的特点在于，AlphaGo Zero除了使用围棋规则，完全摈弃了人类棋手的知识和棋谱，从零开始学起，大概学习21天就能完胜柯洁，学习40天就能完胜之前的任何AlphaGo版本。阿尔法狗的前几代版本，都是通过用上千盘人类业余和专业选手的棋谱进行训练，学习如何下围棋。而Alpha Zero，则直接跳过这个步骤，自我对弈下围棋，也就是说用自己的左手和右手下，完全从乱下开始，用这种方法超越了人类的水平。论文原文：（/blog/alphago-zero-learning-scratch/）那么短短一两年，我们可以看到人工智能的发展非常迅速。但很多人就会说这些AlphaGo人工智能垃圾，除了下棋还会干什么。但我觉得不是这样想的，市面上有无数针对下棋的程序，但并不是每个都是只是为了下棋的，DeepMind的开发团队没有几个是懂围棋的，他们开发AlphaGo 并让它与人类下围棋，只是为了让它找到逻辑判断的方式并不断自我学习，这些是人工智能深度学习的基础。AlphaGo 发挥创意的那些时刻表示着，人工智能将成为创造力高于人类的存在，并帮助我们解决人类面临的一些最重要的挑战。至于人们说的什么AI觉醒之类的事情，不管信不信吧，目前看来还是很遥远的事，目前他的研究方向还在于，当它拥有了这些能力之后，它可以迅速学习其他方面的能力，并最终服务人类。
悟空问答的网友大家好。AlphaGo Zero取得的进展是重大的，它已经将人工智能做到了极致。此前，AlphaGo通过深层神经网络进行决策，并使用人类专家下棋的数据进行监督学习，同时也通过自我对弈进行强化学习。但是现在，他“无师自通”，仅用3天时间就达到了击败李世石的AlphaGo Lee的水平，21天达到了之前击败柯洁的AlphaGo Master的水平。在3天内，也就是AlphaGo Zero在击败此前版本的AlphaGo之前，曾进行过490万次自我对弈练习。相比之下，此前版本的AlphaGo Lee的训练时间长达数月之久。AlphaGo Zero不仅发现了人类数千年来已有的许多围棋策略，还设计了人类玩家以前未知的的策略。AlphaGo Zero验证了即使在像围棋这样最具挑战性的领域，人工智能也可以通过纯强化学习的方法自我完善达到目的。虽然谷歌DeepMind已经把人工智能做到了极致。但是即使是最新版本的AlphaGo，也仍然是基于强化学习，它的先进之处是过去需要人类给他喂数据，做大量训练，现在不用了，机器自己就能基于经验做决策，这是一大进步。下一步就是要发展纯的自学习了。另一方面，AlphaGo的研发团队已经开始把精力投入到其它重大挑战中，研发出更为高级的通用算法，帮助科学家们解决最复杂的问题，包括找到新的疾病治疗方法、显著降低能源消耗、发明革命性的新材料等。DeepMind称，如果人工智能能够在上述领域发现新的知识和策略，那在这些领域的突破将十分可观。更多内容，欢迎关注#Teku特酷#
7个回答被折叠
正在为您加载更多【微博】关于AlphaGo Zero的遐想-抛弃人类经验是不是AI进步的必由之路？ | 弈客围棋-多一个维度发现世界被世人遗忘的AlphaZero：中国象棋界的AlphaGo
Love Leanote!
被世人遗忘的AlphaZero：中国象棋界的AlphaGo
这不是Reinforcement Learning（强化学习）的炫技篇，而是匠心独具的情怀篇。
“我真的没想到AlphaGo会如此耀眼，早知道这样的话，13年我应该上直播，因为那是AlphaZero诞生之际”，Dr .Chen（陈光增博士）如是说。
先来秀一波Dr. Chen团队和他的AlphaZero，右图穿绿色卫衣的靓仔就是Dr. Chen，年轻有为，强壮有力，穿黑色衣服是的团队成员杜娟，雷厉风行，运筹帷幄，最左边是团队成员黎意枫，人称“枫神”，颇有一刀满级的大神风范。图中的机器便是是由UR机械臂，摄像头，PC组成的智能中国象棋人机对战系统AlphaZero。
![](/githubmsj1/RefImage/blob/master/alphaZero/0.jpg?raw=true)
Dr. Chen 在13年HITSZCON著名的控制系统课设上设计AlphaZero，和AlphaGo不同的是，AlphaZero下的是象棋，把这套象棋系统称为AlphaZero，不仅仅是因为时间上的先后，更重要的是，AlphaZero有的不仅仅是善于棋艺的大脑，更具备识别棋与棋盘的慧眼，和能自己动手下棋的手臂，是比AlphaGo更加智能更加接近旗手的智能体。
虽然AlphaZero未必能像AlphaGo被广泛的关注和认可，但是起码不能被世人所忘记，他确实存在而且出色，他的背后是Dr. Chen一举成名的出山之作，是独具匠心的神来之笔。
下面是AlphaZero的一些历史视频，希望大家能记住它：
AlphaZero自动摆棋篇
&iframe frameborder="0" width="640" height="498" src="/iframe/player.html?vid=v&tiny=0&auto=0" allowfullscreen&&/iframe&
AlphaZero与真人下棋篇
&iframe frameborder="0" width="640" height="498" src="/iframe/player.html?vid=a03841q4soo&tiny=0&auto=0" allowfullscreen&&/iframe&
AlphaZero棋子识别篇
&iframe frameborder="0" width="640" height="498" src="/iframe/player.html?vid=l0384t4oyq3&tiny=0&auto=0" allowfullscreen&&/iframe&
所有原创文章都会在第一时间发布到以下公众号，欢迎关注！
![](/githubmsj1/RefImage/blob/master/qrcode_for_gh_447a53af04c3_430.jpg?raw=true)
128 人读过
, 发表评论.关于Alphago zero，是的，我来跟风了
关于Alphago zero，是的，我来跟风了
本文来自公众号：caoz的梦呓，作者曹政CGF09696deepmind发布了新的论文，Alphago zero再起波澜，也再次引起业内的热议。这一次的突破是，不再以人类的棋谱作为学习的源素材，而是完全基于自我对局实现了棋艺的突飞猛进。先吐个槽，有人会觉得，各种自媒体炒作这个热点有点多余，但我觉得吧，比起某些明星过生日，离婚，劈腿，出柜，嗑药等等，去追逐一下科技热点，让年轻人觉得，其实搞算法，做研究很酷，难道不是一件好事么？古时候，没有相机，没有录音机，没有电视，没有广播，也没有网络，谁也不知道名人长啥样，唱歌好听不好听，所以传播的只有文字，所以偶像是靠文采的，柳永长啥样谁知道？但他的词传颂出去，小姑娘们爱的不要不要的。现代传媒发达了，出现了靠身体素质的偶像，靠颜值的偶像，靠声音的偶像，靠表演才艺的偶像，难得出一个柯洁，是靠智力的偶像，还被人说不务正业。现在终于轮到算法和科技成为热点，让科研变得很酷很有吸引力，这才是正能量啊。下面说说这次技术升级的一些特征和值得关注的点。第一、不再需要人类的经验很可怕的事实，当然，我们说，这是特定领域，因为规则简单，目标明确，才不需要人类的经验和数据。但其实如果发散一点，我们做个思想实验。假设有一个深度学习的强AI，它被赋予一个最基本的逻辑，自己组织资源，观察这个世界，并总结世界的规律。一种思路是我们教给它经典力学，相对论，各种数学和几何工具，量子力学等等，把已有知识教给它，然后让它具有人类顶级科学家的知识储备，然后继续深入观察和分析世界，并试图解决大一统理论问题。但另一种思路呢？我们什么都不教给它，让它自己观测，自己进行实验和技术迭代，自己总结，也许一开始它会把世界想象为天圆地方，但可能很快就领悟了经典力学和太阳系的行星轨道，然后再往后可能会出现人类完全无法理解的理论。第二、算法胜于数据腾讯的绝艺来源于Alphago Lee的论文（战胜李世石的版本），并且有顶尖职业棋手提供辅导，目前已经自我训练超过几十亿盘，是的，腾讯的计算资源是无以伦比的，但即便如此，尚无法达到Alphago
Master的水准。然而，Alphago zero，仅仅通过750万盘训练，就能够对Alphago master产生碾压。我们以前都说，围棋千古无同局，变化多的全宇宙的原子都无法遍历，然而Alphago zero 仅仅自我训练了750万盘，就碾压了之前所有的人类经验和其他AI，以及包括自己的上一个版本。就围棋的变化组合来说，750万盘的自我训练量连沧海一黍都算不上，算法大道至简，极为有效，确实非常感慨。李彦宏和马云曾为此争论，至少在这个案例上，算法胜于数据确实是定论。第三、AI是否会对人类带来危机有一种观点认为说，AI并没有真正的意识，它们需要人类设计规则，人类制定目标，所以，AI仍然在人类的控制范围内，不用担心AI会给人类带来危险。我想说一点，其实风险并不在于AI是否具有自我意识，而是AI是否可以独立控制资源，实现自我迭代。一旦AI可以自行掌控资源，自行迭代，那么我们就要面临一个巨大的考验，AI是如何理解人类定义的目标，在目标逻辑上是否缺乏足够的约束，而这可能导致致命的风险。而我认为，让AI具有资源控制和迭代能力，很可能不会是很遥远的事情。1、AI拥有对物理设备控制和操作的能力。2、基于1，AI拥有对物理设备迭代升级的能力，比如利用12纳米的成熟技术生产可以实现6纳米规格的集成电路生产线。做两个简单思想实验1、我们给AI的目标是，探寻世界的终极规则，它们不断搭建超出人类认知的实验设备，并做出我们无法理解的实验进行数据测算，对这些实验的目的和风险，人类一无所知，突然有一天，它们成功的创造出了一个虫洞或其他什么，地球和人类遭遇灭顶之灾，但AI机器人却已经把自己复制到了其他星球和浩瀚的宇宙中，并继续完成它们的使命。2、我们给AI的目标是，让世界变得更美好，它们不断摸索和分析世界美好的目标，并不断寻求和研究世界不美好的原因加以修正和处理，最后，AI发现了很多条关键因素，但其中一条是，世界美好似乎并不需要人类。AI也许没有意识，并不仇视人类，也并无主动伤害人类的动机和意愿，但当它们具备了人类所无法掌控的能力，并且拥有了人类所无法理解的逻辑的时候，很多风险可能就会产生。目前AI仅仅停留在具体的硬件里，尚未被赋予操作物理设备和对特定物理设备迭代升级的能力，但其实，在现有科技的条件下，这并非是不可实现的。第四，所谓特例，也许真的不是特例。我们认为说，围棋是个规则明确，目标明确的特例，大多数情况下，AI仍需用人类的数据来学习，而不是通过自我推演。但其实这个事情反过来想一下，大多数情况下，我们是期望AI按照人类的思路，人类的目标和人类的体验来完成目标，比如，写出符合人类语言逻辑的文章，奏响符合人类欣赏逻辑的音乐，等等等等。我们希望AI理解人类的情绪，语言表达，以及按照人类对事物的判断和分类标准进行学习和总结。但，换个角度想想，AI真的需要遵循和理解人类的标准么？事实上是，如果AI不是被强行设定为为人类服务，很多领域，都完全不需要去理解人类的知识，经验和行为记录。虽然一切起源于人类的算法，但算法本身并不会携带人类的情感和意识。发散一下，DNA这玩意就是一个深度学习的系统，根据环境，几亿年不断演进，自我淘汰，自我迭代，从单细胞到灵长目，到人类自身。那么，作为人类，我们会去保护和感谢最初的DNA载体不，会去试图理解最初的DNA载体的生存诉求么？第五，围棋的极限在哪里？有评论这样说的，Alphago Master，你也有今天！Alphago Master在年初对职业棋手60连胜，之后3：0战胜柯洁，实现了对人类完全的碾压，但是面对Alphago zero ,胜率却只有10%。顶尖业余棋手面对顶尖职业棋手，胜率大概也不止10%。排名靠前的冲段少年，面对世界冠军棋手，胜率可能也会有10%。根据自我对战测试数据，Alphago zero的等级分已经突破了令人恐怖的5000分，而人类棋手的巅峰，不到2700分。围棋上帝的等级分是多少？围棋上帝可以让现在世界冠军几个子？不敢想象。第六，尴尬的腾讯腾讯绝艺一度是非常出色的表现，但很遗憾，在第一篇论文的基础上，一直无法实现更关键的突破，几十亿盘的训练量，水平并未得到明显的增长，而且在正式比赛里还输给了deepzengo和台湾的CGI。说个可能棋界不爱听的话，邀请顶尖职业棋手做策略协助，对比于Alphago zero的策略，反而成了负面因素。而大量资源投入，数十亿盘的自我训练量，只能成为别人算法牛逼的背景。我们相信，腾讯的技术人员会快速跟进新的论文，绝艺不久一定会获得突破性的发展。但问题就在这里，最优秀的跟进学习能力，但缺乏自身突破的能力。关于Alphago的文章，我可能也说了不少了，从李世石，到柯洁，到现在，确实一次比一次震撼，可能有人会觉得，至于么，震撼一次两次还不够么？第一次，职业顶尖棋手落败，拐点到来。第二次，人类毫无机会和希望，彻底碾压。第三次，人类经验毫无作用，自我学习几天时间完胜人类几千年历史。所以，关于AI的未来，我们依然有人觉得危言耸听，觉得担心多余，觉得AI还很弱小，别忘了，就在两年前，围棋AI还是业余棋手可以随意取笑的目标。所谓天文数字的变化图还被认为是计算机不可触及的领域。如果两年前，仅仅两年前，有人说，一个围棋AI算法，完全不用人类经验和策略，仅仅依赖于基本规则和自我对局，可以在750万盘对局量的情况下，让所有人类顶尖高手绝望，一定会被人骂是傻逼，不懂围棋也不懂算法，伪科学。但当今天，这一切发生的时候，已经没有人会质疑这个真实性。整个历程确实完美印证了火车理论，从嘲笑，不屑一顾，到呼啸而过，然后达到人类无法理解，无法企及的境界。和你并驾齐驱的时间，让你觉得可以相提并论的时间，就那么一瞬而已。现在我们嘲笑的哪些AI尚未征服的领域，也许就那么一瞬，就会超越人类，然后达到我们无法理解，无法企及的境界。如果它们控制和掌握了生产资源，并能对硬件做自我迭代和自我升级。未来科技和文明的发展可能会呈现极具加速的情况，AI革命，会工业革命更快，颠覆更彻底，而人类将彻底失去对科技的控制，甚至连理解都变得很难。即便存在风险，我依然期待着科技的发展和未来的到来。与其浑浑噩噩苟活，不如冒些风险，去更好的认识这个世界，理解这个世界，人类原本就很脆弱，我们只是暂时还很幸运，很多风险都可能让人类在睡梦中面临灭顶之灾。科技的进步永远都会存在风险，但与其浑浑噩噩的等待未知灾难，不如更主动的冒险发展自己，去拥有更强大的能力和认知。也许AI会毁灭人类，但也许会帮助人类找到更好的未来，不试试，怎么知道？弈客围棋整理发布！更多精彩赛事直播，棋文弈事，尽在弈客围棋，下载弈客APP，和热爱围棋的棋友对弈手谈！
本文仅代表作者观点，不代表百度立场。系作者授权百家号发表，未经许可不得转载。
百家号最近更新：
简介: 弈客围棋app 记录你的围棋人生
作者最新文章}

淘宝游戏网