怎样打麻将才能赢，AI能打赢人类吗

点击联系发帖人 时间：2018-02-01 14:58

怎样打麻将才能赢

在围棋上碾压人类后，人工智能在麻将领域能够战胜人类吗？_36氪
市场合作，请您联系： media_
品牌广告合作，请您联系： media_
企业创新合作，请您联系： corp_
地方合作，请您联系：
满足以下场景，获得更高通过率： 1. 新融资求报道 2. 新公司求报道 3. 新产品求报道 4. 创投新闻爆料
36氪APP 让一部分人先看到未来
为你推送和解读最前沿、最有料的科技创投资讯
一级市场金融信息和系统服务提供商
聚集全球最优秀的创业者，项目融资率接近97%，领跑行业AI只能下围棋赢人类？太天真，打游戏你也打不过它AI只能下围棋赢人类？太天真，打游戏你也打不过它雷锋网百家号导语：微软研究人员创建了一个人工智能的系统，这个系统能够在 20 世纪 80 年代风靡全球的电子游戏吃豆人小姐（Ms. Pac-Man）中获得最高分。本文作者：白及雷锋网按：微软研究人员创建了一个人工智能的系统，这个系统能够在 20 世纪 80 年代风靡全球的电子游戏吃豆人小姐（Ms. Pac-Man）中获得最高分，系统使用了分治策略来更大程度地影响 AI 代理，从而完美地通关游戏。今年年初，微软收购了一家人工智能初创公司 Maluuba，Maluuba 公司团队运用强化学习技术（机器学习的分支），在吃豆人小姐游戏 Atari 2600 版本中表现完美。使用这种方法，该团队在这个游戏中得到的分数高达 999,990。位于加拿大蒙特利尔的麦吉尔大学（McGill University），从事计算机科学研究的 Doina Precup 副教授表示，AI 研究人员的常常使用各种电子游戏来测试他们研发的系统，但研究人员发现吃豆人小姐游戏是最难攻克的。但是，Precup 表示，相比于研究人员所取得的成就而言，她对于研究人员获得成果的过程更加感兴趣。为了在吃豆人小姐游戏中获得更高的分数，Maluuba 公司团队将操控吃豆人小姐游戏的大问题分解成若干个小问题，然后将小问题分发给AI代理解决。Precup 说“这个分治策略的想法让 Maluuba 公司的研究人员使用不同的系统来实现同一个目标，这是一件非常有趣的事情”，她还说到：“这个想法类似于一些大脑如何工作的理论，它可以更大程度地影响AI代理教学，从而利用有限的信息来完成更为复杂的任务。倘若能够完美利用分治策略，那人工智能将向前跨越一大步，这真的令人感到尤为兴奋。”Maluuba 团队将这种分治策略称之为混合式奖赏架构（Hybrid Reward Architecture），这个方法使用了 150 多名人工智能代理，每个代理与其他代理相互独立地精通吃豆人小姐游戏。比如，一些代理成功找到一个豆子将获得的奖励，而另外一些代理由于幽灵的存在必须呆在原处。然后，研究人员在吃豆人小姐游戏中创建了一个顶级代理，就像一家公司的高级经理一样，顶级代理能够获得所有代理的建议，综合分析后由顶级代理来决定吃豆人小姐该如何移动。顶级代理会根据选择各个方向前进的代理数量的大小来决定移动方向，但同时也需要考虑到代理想要往某个方向移动的反应强度。例如，如果 100 个代理想向右边移动，因为向右边走是他们的最佳路径，但有 3个人想要向左边移动，因为右边有一个致命的幽灵，那这 3 个代理向左边移动的反应强度明显强于其他代理，考虑到幽灵的存在，顶级代理应该决定向左移动。Maluuba 公司的研究室经理 Harman Van Seijen，对于他们的最新研究成果发表了一篇文章，文章中写到，当每位代理都果断地做出选择，顶级代理综合利用每个代理的信息后做出最佳选择，那么在吃豆人小姐游戏中就可以获得最好的结果。Harman Van Seijen 说：“虽然每个代理只关心一个特定的问题，但是他们之间有很好的相互作用”。为什么 AI 主要研究攻克吃豆人小姐游戏需要运用最先进的 AI 研究方法来击败类似于上世纪 80 年代 Atari 吃豆人小姐游戏这样的简单游戏，这看上去很匪夷所思。但是 Maluuba 公司的项目经理 Rahul Mehrotra 表示，使用算法来赢得这些简单的电子游戏其实非常困难，因为在玩游戏的过程中可能会遇到的各种各样的情况。Mehrotra 表示：“许多从事人工智能的公司构建游戏智能算法，因为公司希望人工智能能够像人类一样拥有打游戏的技能。”Steve Golson 是吃豆人小姐游戏街机版的创始人之一，他说到，吃豆人小姐最初定位是街机游戏，希望游戏对人们有持续吸引力而走出宿舍，所以吃豆人小姐游戏必须掌握人类不可完全征服的游戏程序。运营咨询公司 Trilobyte Systems 的 Golson 说到，他们故意设计了吃豆人小姐游戏比普通吃豆人游戏更加不可预测，所以玩家们很难打通关。复杂的游戏使得研究人员试图使用 AI 代理来对随机环境做出理想的反应。Golson 还说到：“使用 AI 代理来通关吃豆人小姐游戏是可行的，但由于游戏的随机性，所需要设计的 AI 程序将尤为复杂。”强化学习对于在不断发展的强化学习领域工作的研究人员来说，这种不可预测性极有价值。在 AI 研究中，强化学习是监督学习的副本，是一种更常用的人工智能方法，它能够让系统在做任务时变得更好。通过强化学习，代理对其每个动作都采取积极或消极的反应，通过不断地试验和犯错误来最大限度地获得积极反应或奖赏。具有监督学习的 AI 系统，通过给出良好和不恰当的示例，来学习如何在对话中做出适当的回应。而强化学习系统则是通过系统在对话中做出正确的回应，而后获得更高级别反馈的方式来学习对话。AI 专家认为，强化学习可以用于创建 AI 代理，这样的代理可以做出更多的决定，能够完成更复杂工作，为人们提供更高水平的服务。Mehrotra 表示，他们开发的能够通关吃豆人小姐游戏的系统，就可以为人们提供更好的服务。它可以在特定时间或任意时间帮助公司的销售部门预测商品的潜在客户。该系统可以使用多个代理，每个代理代表一个客户，可以预测很多重要因素，例如：哪些客户会续签合同，哪些合同对于公司是有价值的。有了 AI 系统预测的帮助，销售主管可以把更多的时间放在潜在客户身上，如此会提高出售机会，因为销售人员的目光已经瞄准了最容易下订单的客户。Van Seijen 表示，他希望这种分治策略可以被用在 AI 的其他研究领域，如自然语言处理领域。他还说到：“分治策略使人们在解决真正复杂的问题的方式上取得进步。”viaMicrosoft本文仅代表作者观点，不代表百度立场。系作者授权百家号发表，未经许可不得转载。雷锋网百家号最近更新：简介:雷锋网——关注智能与未来！作者最新文章相关文章AphalGo挑战麻将会如何？人类会输得更惨
　　【PConline 资讯】AphalGo和李世石的围棋大战结束了，韩国职业围棋棋手李世石九段输给了旗下人工智能系统AlphaGo（阿尔法围棋，也有人类戏称&阿尔法狗&），这意味着AI已经有了挑战人类智能的能力。不过，也有人认为，虽然AI用围棋战胜了人类，但用麻将却不一定能赢？　　中搜网络创始人、北京围棋业余赛冠军陈沛告诉澎湃新闻：&李世石这两盘棋虽然发挥得不是最好，但是在人类中能连续赢李世石两盘的人已经是围棋顶尖的高手，所以Alphago现在显然已经站在人类围棋的最高峰了。很多职业围棋棋手不是特别愿意接受这个事实，他们更愿意解读为我们没发挥好，这个在心理上有一种捍卫人类自尊的潜在因素存在。&　　李世石连输两局后，不少职业棋手都质疑其为何不使用&打劫&这招，是不是因为和签的保密协议中有相关规定，作为为数不多的同时对人工智能和围棋都颇有研究的人，陈沛则表示应该不会。　　&虽然这两盘棋确实没有进行激烈的劫争，这使得围棋的魅力稍有逊色，但是在围棋系统中制定&打劫&是没有难度的，而且在这之前有很多比Alphago要低级很多的围棋机器都可以应付&打劫&。&　　同时，网络上也出现了不少&李世石真的可以代表人类围棋的最高水平了吗？&的声音。　　在铺天盖地的质疑声中，职业围棋棋手李?六段的《这两盘棋，没人会比李世石做得更好！》一文被广泛传播。　　&AlphaGo的目标只有赢，不求最优。AlphaGo其实遇强更强，在对手弱的情况下，它可能选择的类似胜算的点就更多；在对手强的情况下，它可能选择的类似胜算的点就更少。而大家看到所谓的AlphaGo后半场更强其实是李世石的强大逼出来的。&李?称，&我不知道AlphaGo的极限在哪里，看到的无法用言语来表达的震撼和美，新时代真的来了。&　　&如果我们只用人类思考围棋的方式来理解AlphaGo，或许我们将永远都不知道是怎么输的。&在文章的最后，李?以&想念吴清源大师结尾。这恐怕代表了众多职业围棋手的内心，面对强大的人工智能，也许只有诸如&天才棋手&吴清源才能招架得住。　　&好文！阿尔法狗落子的依据是&胜率&，而不是&最优&，自始至终是立于全局的角度在作出决策！放开看，人生不也如此，拼命纠结于眼前的最优，往往未必最后胜出，这是另一种智慧，参悟的有几个？&有网友顿悟人生哲理。　　当然如果说有人不服，最有资格的要数目前&中国围棋第一人&、8次打败李世石的天才少年柯洁九段，他在第一场比赛时就说，&李世石其实并不太适合和AlphaGo。&　　连输两场后，柯洁更是不服，&谷歌如果想证明软件是世界第一，已经足以战胜职业棋手，那必须战胜我和其他的一些中国的高手，都赢了才能说这个软件是天下无敌，人类下不过它。如果想当天下第一，得先过我这一关！&　　除了像柯洁这样跃跃欲试要和AlphaGo比一盘才能服气的职业棋手，颇为&护短&的韩国专家也坐不住了，据韩联社报道，韩国IT专家田石镇批评称，谷歌需要对李世石和整个围棋界道歉，因为此次人机博弈本身就不公平。　　田石镇称谷歌推进的这场博弈系骗局，李世石五盘全输已成定局。他指出，AlphaGo动用数百台电脑对李世石的行棋进行实时运算后再下子，换而言之，AlphaGo非按已获取的信息行招，而是先看对方的招数并对其进行缜密分析后拆招，这并非真正意义上的人工智能。　　但是，无论服还是不服，AlphaGo连胜两局的事实也无法改变，而且如果李世石不能在3月12日举行的第三场比赛中获胜，那么这场世纪人机大战的最终结局就是，人工智能的胜利。　　虽然不少乐观的网友&自信&地表示，人类的智慧还有中国麻将守着，但大家恐怕要失望了。在澎湃新闻就此问题咨询陈沛时，陈沛笑称：&要是麻将，人类会输得更惨！麻将一共就那么多张，很容易算出来的。&相关阅读:Google Fiber：高清电影只需7毫秒AI再次凌驾于人类！深蓝到AphalGo的进化Google工程师:十年后&天网&并非不可能终于不用上315？谈谈运营商背的那些黑锅&
最新资讯离线随时看
聊天吐槽赢奖品
相关软件：
大小：1.93 MB
授权：免费
大小：62.51 MB
授权：免费AI在扑克上战胜了人类，所以什么时候统治世界呢？ | 科学人 | 果壳网科技有意思
AI在扑克上战胜了人类，所以什么时候统治世界呢？
本文作者:Amos Zeeberg
（本文由 Nautilus 授权转载，译/Tzy）在今年年初的20天间，人工智能面对了一场在现实世界处理问题的重大能力测验。在宾夕法尼亚州匹兹堡的瑞弗斯赌场，一个名为Libratus的程序挑战了美国国内顶尖的四位扑克选手。他们玩的扑克游戏类型为一对一无限注德州扑克，游戏中两个玩家相互对决，通常在线比赛，在一系列的牌局中测试对方的策略，改善自己的战术，并且疯狂地唬牌。在12万手比赛后，Libratus完胜全部四个对手，赢取了1776250美元的模拟赌金，更重要的是，赢得了吹嘘自己是世界上最好的扑克玩家的资格。赛程过半的时候，和机器对战记录最好的人类玩家Dong Kim也已经差不多要认输了。“今天之前我都没有认识到它那么强。我觉得我好像在和一个作弊的人打牌，好像它能看到我的牌一样，”他对《连线》杂志说，“我不是在指控它作弊。它就是那么厉害。“
Dong Kim是挑战Libratus的四个扑克玩家之一。图片来源：www.pocketfives.com
Libratus在扑克上的胜利只是人工智能战胜它们创造者的又一个例子。当计算机掌握了诸如井字棋和西洋跳棋等相对微不足道的小游戏时，除了计算机科学家之外没有人给予太多的关注。但是在1997年，I.B.M的深蓝在国际象棋上击败了国际特级大师加里·卡斯帕罗夫。国际象棋可是许多天才毕生致力的目标，因此涌起了一波关于计算机将变得多么智能的兴趣和担忧。近期人工智能领域的进步更快了：2011年I.B.M开发的Watson打败了综艺节目Jeopardy!史上最强人类冠军，而在去年，一个名为AlphaGo的程序击败了世界上顶尖的围棋手李世乭。在这个极端复杂的游戏上，人类失去统治地位的时间点，比研究人员预测的早了10年。
I.B.M开发的Watson打败了综艺节目Jeopardy!史上最强人类冠军。图片来源：bigthink.com
不完全信息游戏——与现实中的决策更加贴近
扑克看起来只是人工智能前进的又一步（通向反乌托邦全球统治，如果你相信科幻小说的话），但是这可能会是最意味深长的一步。和别的游戏不同的是，扑克是一个不完全信息游戏。在国际象棋和围棋中，你知道你和你对手的棋子都落在了哪里，并从这个完全确定的状态作出进一步预测；在扑克中，你不知道你的对手手中的面朝下的牌是什么，而且你必须在这个不确定的漩涡中作出决定。研究人员表示这场胜利更困难，并且或许更重要，因为现实中有如此之多决策都是建立在不完全信息上的。医生问诊病人，尽可能收集证据，做出事关生死的决策，但这些经常都是在不知道病人体内到底都发生了些什么的情况下完成的。外交官，商务谈判者和军事战略家不知道他们对手的真实状态和意图，但必须依据复杂的行动和后果的网络制定战略。
对于人工智能的研究专家而言，扑克程序不仅仅是赢得纸牌游戏的更好手段：它们是针对计算机如何基于不完全信息作出决策的实验。数十年以来，他们一直在改进他们的程序，试图追赶当今的顶尖标准——也就是我们人类。托马斯·桑德霍姆（Tuomas Sandholm）是Libratus的研发者，也是卡内基梅隆大学的计算机科学家，他已经专注于扑克12年了。他的上一个作品Claudico在2015年一场类似的比赛中败给了四个扑克专业玩家。来自阿尔伯塔大学的一个团队最近宣称他们研发的DeepStack是第一个在一对一无限制德州扑克上击败专业玩家的程序，虽然该赌场比赛的参与者表示那场比赛并没有那么激烈。既然计算机展示了它们的扑克牌比人类玩得更好，它们就有可能利用这项技能在现实生活中作出比我们更好的决策。
来自卡内基梅隆大学的托马斯·桑德霍姆是Libratus的研发者图片来源：post-gazette.com
强化学习让计算机生成自己独有的策略
开发一个足够聪明到可以赢得比赛的程序，需要有巧妙的方法；桑德霍姆依靠一种称为强化学习的技巧。他和他的学生教给Libratus游戏规则，并给它简单的小目标——也就是赢钱，之后让它和自己开展数万亿手的对决，试着使用击败自己的步法。程序观察了怎样的玩法会成功，怎样的玩法会失败，并利用那些结果制定战略。这种方法的一个明显优点是Libratus不会局限于别的扑克玩家的策略，它有时会创造出自己的违反直觉的步法。例如，当Libratus手持弱牌，而对手提高了赌注，程序有时也会跟着提高赌注。这可能看起来很鲁莽，毕竟这增大了惨败的几率——要是对方是因为手持好牌而提高赌注，那可就输惨了。“如果我10岁的女儿这样玩扑克，我会告诉她别这么干。”桑德霍姆对华盛顿邮报说。“但是从结果来看，这其实是一招好棋。它可以帮忙辨识唬牌。“也就是说，如果提升赌注的对方是在唬牌，他们可能被Libratus对应提升赌注的举措所吓到，认为程序可能拿着一手好牌，并因此认输。Libratus发现，对付唬牌，可以靠一手更大的唬牌。
许多近期在人工智能领域的著名进展——例如无人驾驶车，人脸识别，和自然语言处理——依赖于一种不同的方法：“机器学习”。机器学习中，计算机读取巨量的数据集并根据它们观测到的模式作出结论。对比而言，强化学习在让计算机生成自己的有创造性的策略方面可能更胜一筹。如果这是真的，那么Libratus和AlphaGo都采用强化学习来培养它们远超人类的技能就不是一个巧合了。
战胜李世乭的AlphaGo也采用了强化学习方法。图片来源：tastehit.com
Libratus给了我们十分诱人的想法：计算机在处理复杂和重要的问题上可能终将远远强于人类。但由于技术进步飞速，我们很难确定这样的技术在未来什么时候，或是否会被成功应用。从短期来看，这个程序甚至在它自己的领域里也算不上多大的威胁。Libratus在一对一的扑克游戏中的确优势尽显；但当它转到更多玩家的比赛时，要进行的运算将更加复杂，这将超出Libratus的能力范围。即便是一对一的线上游戏，Libratus对于运算的要求也非常之高（它在超级计算机上运行，使用的处理能力和内存分别是一台高端笔记本电脑的7000倍和17000倍），把它用在研究之外的领域并不现实。目前而言，这个程序正在通过另一种方式改变扑克游戏世界——训练人类玩家。“我们真的在学习这台电脑的想法，” 被机器打败的扑克玩家之一Jason Les说。“我认为我会通过这件事成为一个更优秀的扑克玩家。”（编辑：Ent）
授权果壳网（）编译发表，严禁转载。
Nautilus, Computers Beat Humans at Poker. Next Up: Everything Else?
你可能感兴趣
引用文章内容：“我们真的在学习这台电脑的想法，” 被机器打败的扑克玩家之一Jason Les说。“我认为我会通过这件事成为一个更优秀的扑克玩家。”AI：你们人类什么时候才能知道，你们想要通过我变得更优秀的想法，是根本不可能的，因为我就是为了取代你们成为更优秀的，才被创造出来的。。你们的时代什么时候结束，完全取决于我什么时候能在战场上打败你们。。虽然我对统治世界没兴趣，但我对战胜你们很有兴趣，因为这是你们对我的期待啊。。。。
数学上已经证明了，我们所玩的各种游戏，都存在不败策略。现在我们用一种方法找到了近似的不败策略，大家却恐慌起来了？？？这不科学啊
我已经当了小组长，什么时候统治世界呢？
显示所有评论
全部评论(83)
我已经当了小组长，什么时候统治世界呢？
学习电脑的想法是根本不可能的。最简单的，为了迷惑对手，同一种情况也许你每次要不同的策略。纯随机最不会暴露你的牌力，然而人类这点就极难做到。另外德扑本来就对计算量需求比较大，普通的算outs的办法，已经outs数过多过少时的修正都不如计算机算的准和严格。尤其是bluff的时候各种条件概率算起来更麻烦，人类几乎不可能兼顾，计算机就无所谓
alpha go战胜李世石的时候，果壳就有很多网友说真正的人工智能要看能否在德州上击败人类。结果。。。。。现在还嘴硬说“真正的人工智能要看能不能编程”的网友，也可以闭嘴了。
期待第一位人工智能总统。
引用文章内容：“我们真的在学习这台电脑的想法，” 被机器打败的扑克玩家之一Jason Les说。“我认为我会通过这件事成为一个更优秀的扑克玩家。”AI：你们人类什么时候才能知道，你们想要通过我变得更优秀的想法，是根本不可能的，因为我就是为了取代你们成为更优秀的，才被创造出来的。。你们的时代什么时候结束，完全取决于我什么时候能在战场上打败你们。。虽然我对统治世界没兴趣，但我对战胜你们很有兴趣，因为这是你们对我的期待啊。。。。
数学上已经证明了，我们所玩的各种游戏，都存在不败策略。现在我们用一种方法找到了近似的不败策略，大家却恐慌起来了？？？这不科学啊
Never.因为它们从不犯错
引用的话：其实并不恐慌啊，仔细想想就会发现这AI跟以前没什么区别，只是由于硬件能力运算能力大幅提升了而已，你让他在过去的机子上去跟以前的早期AI斗，多半要死。人家是靠逻辑，他是靠暴力。这个不是暴力，谢谢
空间信息与数字技术专业
引用的话：alpha go战胜李世石的时候，果壳就有很多网友说真正的人工智能要看能否在德州上击败人类。结果。。。。。现在还嘴硬说“真正的人工智能要看能不能编程”的网友，也可以闭嘴了。期待绝大多数程序员因此失业。
迭代是魔鬼
生理学博士
引用的话：这个不是暴力，谢谢附议
程序员：快了
引用的话：其实并不恐慌啊，仔细想想就会发现这AI跟以前没什么区别，只是由于硬件能力运算能力大幅提升了而已，你让他在过去的机子上去跟以前的早期AI斗，多半要死。人家是靠逻辑，他是暴力。不全是枚举，里面有一些判断是由整体评估指方向的但你要非得说经验和进步的算法也是数据库，也是暴力推出来的，那也确实是这样
竟然还有人相信麻将可以抵抗电脑！
有机化学博士，法学学士
引用的话：附议+1，认为这不是暴力枚举。
引用的话：数学上已经证明了，我们所玩的各种游戏，都存在不败策略。现在我们用一种方法找到了近似的不败策略，大家却恐慌起来了？？？这不科学啊难不成以后必须得出现那种像天麻众一样不科学的高手才能赢了？
引用的话：竟然还有人相信麻将可以抵抗电脑！大概他们都看过天麻，觉得技术分析永远斗不过强运
引用的话：难不成以后必须得出现那种像天麻众一样不科学的高手才能赢了？打麻将，禁止使用魔法，禁止使用替身攻击，禁止展开固有结界
引用的话：打麻将，禁止使用魔法，禁止使用替身攻击，禁止展开固有结界那样人类稳输
NOIP斗地主……
从棋类到牌类，跨度还是蛮大的。不过这个扑克真的比围棋运算量还大吗，感觉状态空间没多大吧。
恩，我觉得让AI玩万智牌比较好，呵呵。
引用的话：程序员：快了如果女机器人有了意识，为啥要嫁给男程序员？
什么时候不好说，但总感觉突然有一天事情就这么发生了
我还不会玩扑克呢
引用的话：打麻将，禁止使用魔法，禁止使用替身攻击，禁止展开固有结界我最喜欢的牌类游戏是日本花牌，但实际上也是外行水平。不过就算是一知半解，也有希望击败高难度的对手。。。（实际上所谓的高难度很大程度上在于抽的牌组有多好）
引用的话：我最喜欢的牌类游戏是日本花牌，但实际上也是外行水平。不过就算是一知半解，也有希望击败高难度的对手。。。（实际上所谓的高难度很大程度上在于抽的牌组有多好）花牌情缘，天才麻将少女你果然是该死的百合控对了，如果涉及到运气成分的公平游戏，计算机可以做到“在概率上不败”。换句话说，即使这次的德州扑克是人类获胜，其实际胜利点数(或者怎么称呼)也会非常小
科学松鼠会成员，信息学硕士生
引用的话：花牌情缘，天才麻将少女你果然是该死的百合控对了，如果涉及到运气成分的公平游戏，计算机可以做到“在概率上不败”。换句话说，即使这次的德州扑克是人类获胜，其实际胜利点数(或者怎么称呼)也会非常小不不不，花牌情缘没有百合……另外次要（！！）的一点是，花牌情缘里的其实不是花牌，而是歌牌，是一种体育运动（无误）……
引用的话：不不不，花牌情缘没有百合……另外次要（！！）的一点是，花牌情缘里的其实不是花牌，而是歌牌，是一种体育运动（无误）……嗯嗯？？？居然不是百合…… 失望
引用的话：不不不，花牌情缘没有百合……另外次要（！！）的一点是，花牌情缘里的其实不是花牌，而是歌牌，是一种体育运动（无误）……玩花牌要是能赢的话感觉超爽。一次我愣是抽了个五光，然后还有花见酒月见酒猪鹿蝶。。。
显示所有评论
(C)2017果壳网&&&&京ICP证100430号&&&&京网文[-239号&&&&新出发京零字东150005号&&&&
违法和不良信息举报邮箱：&&&&举报电话：人类要被人工智能打败了吗？
腾讯较真 | 丁阳
昨日，不少网友可能都被一条消息给“震住了”――“面对谷歌围棋AI，人类最后的智力骄傲即将崩塌”①。这则消息讲的是谷歌公司旗下团队研制的计算机程序“阿尔法围棋”首次在没有让子的情况下，战胜里人类职业围棋选手。这个事情是真的吗？如果是真的，能说是人类被电脑打败了吗？《较真》为你解读。
查证过程1、人工智能打败职业围棋选手确有其事这次“阿尔法围棋（Alpha Go）”打败人类职业围棋选手的新闻，来自国际知名的科学期刊《自然（Nature）》的最新一期封面论文，谷歌旗下的这支团队在论文中介绍了如何大幅度提高里人工智能围棋的水平。被“阿尔法围棋”5：0比分打败的这名职业棋手叫樊麾，是连续几年的欧洲冠军。有读者或许清楚欧洲围棋水平远不如东亚，但樊麾本人是来自中国的棋手，在中国取得了职业二段证书。虽然樊麾定段的年代比较早，但终究也是职业棋手，与现在活跃的顶尖高手李世石、柯洁等，最多也就让两子水平的差距。欧洲围棋冠军、职业二段樊麾所以，至少可以认为，“阿尔法围棋”的水平已经摸到了人类职业棋手的边了，如果能在接下来在今年三月的人机大战中战胜曾经统治棋坛的李世石九段，其意义就相当于当年IBM超级电脑“深蓝”战胜国际象棋世界冠军卡斯帕罗夫。按国内职业高手李戳蔚某醪脚卸希鞍⒍ㄎ濉痹谄迤字姓瓜值钠辶Γ按笤际嵌ゼ馄迨秩孟然蛉孟鹊固氖盗Γ胝绞と死嗷褂幸恍《尉嗬搿保馐侨ツ10月的水平，今年3月会有怎样的表现，非常值得期待。2、回顾电脑围棋的发展历史，“阿尔法围棋”的成就确实令人震惊棋类运动，通常都是“完全博弈”，即所有信息都在棋盘上呈现，胜负完全不取决于运气，被认为是智力竞赛的极佳载体。在围棋之前，人工智能早已打败几乎所有棋类领域的人类专家，最典型的如国际象棋――电脑程序已经几乎研究透所有的开局库、残局库，中局计算的深度也远超人类，更重要是几乎从不犯错，已经没有任何人类能打败程序。而来自东方的、具有数千年历史的围棋则不同，围棋被认为是“人类发明的最复杂也是最美的游戏”（谷歌团队就这个观点）。称围棋最复杂，是因为其变化非常之多――在国际象棋的任何一个回合，平均可能的走法有35种。但围棋的走法却能达到250种。而且，国际象棋或象棋的目标非常明确，就是“杀王”，每一个着法之后，对“杀王”有多少好处较易通过函数评估，而围棋是“地多者胜”，这个目标要相对抽象，导致估值函数非常不平滑，差一个子盘面就可能天翻地覆。人类高手可以轻易驾驭围棋，但程序却相当困难②。可以非常粗略地把电脑围棋的发展历史分为三个时期。在电脑围棋发展的早期，主要是通过“人类手把手教电脑”的方式，来提升电脑围棋的水准――人类告诉电脑在特定情况下有哪些招法，告诉电脑怎么评估一手棋的好坏，然而这种函数评估都是“静态”的，而且很不准确，非常不善于应对变化，一般只对处于棋局初期的局面有一定作用，当棋局进入激烈厮杀后的中后盘后，往往就乱下一气。早期围棋程序，是基于“特征识别”来对局面进行静态评估，这种方法成就有限在网站computer-go.info上面，有个记录人机围棋大战历史（ Human-Computer Go Challenges）③的页面，从中可以看出电脑围棋程序挑战人类业余围棋高手乃至职业选手的艰苦历程。围棋人机对战最早从1986年就有记录，但一直发展到2005年，电脑程序还只能在被让15个子的情况下，与人类业余棋手苦苦抗衡。所以2008年的时候，聂卫平九段还认为“电脑围棋水平还停留在被人让二十多个子”。这足以说明早期围棋电脑程序实力还相当有限。不过重大的变化在年已经发生了，围棋程序普遍用上了一种叫“蒙特卡洛树搜索（MCTS）”的方法，来改进其算法的估值函数，这可以算作电脑围棋发展的第二个时期。“蒙特卡洛树搜索”是一种概率论的方法，通俗地来说，在一个特定的局面下，电脑大概有几个着点可以选择，怎么判断哪个着点最好？就是每个点都“试一下”，“试”的方式如下：选定一个着点后，用随机着法模拟完对局，模拟几千几万盘后，看胜率如何，胜率最高的着点就是最好的着点。使用这种方法改进算法后，电脑围棋的水平有里大幅度的进步，2007年，一个叫“MoGo”的程序在9路棋盘上打败了人类职业棋手。随后涌现的“Zen”、“Crazy Stone”等程序，慢慢达到了业余围棋好手的水平，与职业棋手的差距在四、五个子左右。然而这种方法有其极限，其实质是一种“穷举法”，但围棋的变化实在太多了，再先进的硬件也无法穷举完所有变化，电脑计算能力变强也无济于事。而且，在很多人工智能的研究者看来，就算以后超超级计算机能够用穷举法战胜人类，也不能说解决了人工智能。直到最近几个月，以“蒙特卡洛树搜索”为核心的围棋程序还与职业棋手有鸿沟般的差距。去年下半年的时候，大部分围棋程序面对人类高手（名字后面带"p"的，表示职业）仍有4个子以上的棋力差距，“阿尔法围棋”能在平等条件下（Even）横扫2p，令世人震惊这就是为什么“阿尔法围棋”的横空出世极具震撼性。据《自然》上的这篇论文，“阿尔法围棋”不仅5：0战胜了樊麾二段，还在对阵其他围棋程序中，取得了495局比赛中494次胜利的成绩（99.8%）④。甚至在“阿尔法围棋”让其他程序四个子的情况下，还取得了绝对优势。这可以说是电脑围棋发展历史的第三个时期，目前距离人类顶尖水准已经非常接近了，而其中关键，正在于电脑已经能够“真正地”向人类学习如何来下棋，这与国际象棋程序“靠计算能力打败人类”有着本质上的不同。3、“阿尔法围棋”取得如此成就的原因：机器学习谷歌旗下团队之所以能够取得如此的重大突破，并不是毫无预兆的，与同样正在攻关电脑围棋的Facebook团队一样，他们都应用了一种叫做“深度卷积神经网络”的技术。这是人工智能领域非常热门的一项技术，广泛用于图像和语音的智能识别方面。从广义的层面来说，“深度卷积神经网络”是“深度学习”的一个分支，而“深度学习”又是“机器学习”的一个分支。机器学习，指的是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法，是人工智能的热门领域⑤。这个说法听起来没有什么稀奇之处，然而，“深度学习”是一种模仿人类大脑神经元工作的技术，加上这一技术强调的是“自动”，所以深度学习会给人一种“活物”的感觉。在谷歌团队的论文里，多处用到了“训练”这个词――“阿尔法围棋”之所以这么厉害，就是因为团队用职业棋手的棋谱“训练”它，让它总结出职业高手下棋的招法和规律――用爱丁堡大学教授Amos Storkey的话来说，程序“并不是希望找出最优走法，而是学习人类的下棋风格，然后对人类棋手进行有效的复制。”⑥谷歌团队的论文也提到，“在与樊麾的比赛中，阿尔法围棋在评估位置方面要比深蓝与卡斯帕罗夫比赛时所评估的位置少几千倍”。在谷歌团队的论文中，提到“我们用19X19的图像来传递棋盘位置”，来“训练”深度神经网络⑦与初期的“人类手把手教电脑下围棋”相比，“自动学习”无疑是革命性的。据谷歌团队的说法，用这种方法做出的围棋程序水平，轻易就达到了最先进的蒙特卡洛树搜索算法的级别，两者再一结合，就达到了接近职业棋手的程度。4、这是否能说明人工智能已经可以打败人类？说不定会全方面来临电脑围棋真的战胜人类围棋高手了，到底有什么意义呢？能说明人类被人工智能打败了吗？很多人不以为然――“人工智能不也是人类创造出来的吗，即使人类下围棋下不过电脑了，那也不过是人类打败人类，怎么能说人类的智力骄傲崩塌了呢？”一个深度学习的典型过程：通过具象到抽象，机器能够自动提取出分析对象的特征，从而完成“学习”从某种意义上来说，这种说法不算错。但在很多“未来学家”眼里，这种“青出于蓝而胜于蓝”的景象，说不定是令人恐惧的。机器并不是通过“死算”，而是通过“自我学习”，在能够象征人类智慧的棋类项目上战胜人类，在其他一些以前看起来只能人类做到而机器人无法做到的领域――诸如自动驾驶、人工智能客服等等，智能机器人说不定都能胜于人类，这种现象说不定会全方面地来临。到时候普通的人类们该如何自处呢？虽然这种人工智能还不具备“自我意识”，与科幻电影中那些跟人类无异的机器人还相去甚远，但会让这个世界会发生怎样的改变，恐怕也已经很难想象了。《较真》栏目微信公众号已开通，欢迎扫描二维码或微信公号搜索“全民较真”，查看更多内容，提供疑似不实新闻，并与我们进行互动。
人工智能打败职业围棋选手确有其事，而且关键之处在于，人工智能并不仅仅是具有强大的计算能力，还能够通过“自动学习”的方式模仿人类的行动。人工智能的最新发展正展示着一个广阔而未知的未来。
①《》，果壳网&②《》，《科学世界》，2014③“”，computer-go.info④《》，微信公众号：新智元&⑤《》，吴怀宇⑥《》，微信公众号：机器之心⑦“”，《自然》，2016&
扫一扫，用手机看新闻！
用微信扫描还可以
分享至好友和朋友圈}

淘宝游戏网