的“牌手”棋，现实中有吗

点击联系发帖人 时间：2018-01-08 06:45

王牌棋手烟油

当前位置：
阿尔法狗打败人类棋手不算啥人工智能玩扑克更有难度
ASI是否会导致人类的终结还有待观察，但人工智能最近在扑克界取得了很大的突破。
《终结者》、《我，机器人》和《A．I．》只是过去四十年中反映人工智能发展超过人类并导致人类毁灭这一主题的众多电影中的几个例子。《美国新闻与世界报道》的Jeff Nesbit表示，虽然这种情况在近期内发生的可能性仍然不大，但是很多人认为这个主题里的第一部分——人工智能会超过人脑的水平，达到超级人工智能水平（artificial superintelligence，ASI）——这一情况将会在未来三十年内的某个时刻实现。ASI是否会导致人类的终结还有待观察，但人工智能最近在扑克界取得了很大的突破。AI与扑克大战30年为何现在才全面碾压人工智能与扑克的“战斗史”可追溯到1984年，那一年，Mike Caro创建了一款名为Orac的基础扑克人工智能软件以征战World Series of Poker（世界扑克系列赛，世界扑克比赛中一项最权威、最受尊重的赛事。WSOP与WPT，EPT并称世界三大扑克赛事）。可以说，人工智能与扑克的“战争”已经打了30多年。从那时起，人工智能在扑克领域的发展势头非常迅猛，最近的一份信息图以视觉化的方式提供了扑克领域人工智能研究进展的深度介绍和统计概览，同时提供了到目前为止研究提炼出的见解。对人工智能而言打败牌手比打败棋手更难几个月前，几个在线扑克网站的社论撰稿人和社区经理Josh Wardini在PokerSites博客上发表了题为《扑克和人工智能：机器对人类的兴起》的信息图。Wardini提供了在过去30年中扑克和人工智能之间关系的介绍。人工智能应用于策略游戏是最流行的方向。在过去二十年中，人工智能在各种游戏中击败了人类，包括国际象棋、围棋和《危险边缘》（译注：哥伦比亚广播公司益智问答游戏节目）。在过去十年中，大部分研究已转向创造会玩扑克的人工智能程序。你可能会问的一个问题是：为什么是扑克？国际象棋大师Garry Kasparov在2010年发文指出了国际象棋和扑克的区别：国际象棋100％的信息博弈——两个玩家都会同时获知相同的数据信息——与计算机敏感的计算能力相比，玩扑克牌可以隐藏自己的牌，其中有很多变量和不确定性，概率、以假象迷惑对手的心理层面因素、风险管理等在扑克牌中十分关键。似乎是扑克完全基于人类心理活动的方面令其在面对计算机时显得无懈可击。一台机器可以很容易地计算出每一手牌的可能性或者概率，但在面对低概率同时却是高赌注的时刻，人工智能却并不占优势。Wardini认为，大学的人工智能部门是因为扑克的复杂性而对这种游戏进行研究的。像许多现实生活中的情况一样，“扑克要处理很多不完善信息”，并且人工智能的目标是解决反映在扑克中的问题。Carnegie Mellon University （卡内基梅隆大学，CMU）博士生及人工智能研究员Noam Brown表示，在不限注的德州扑克单挑比赛中有10的163次方（10后面接着有163个零）不同的游戏情况，假设启动堆栈为20，000个芯片，那么即使是最强的计算机也不可能计算所有可能的情况。人工智能在扑克上取得突破 Libratus战胜顶级职业牌手人工智能在扑克领域的研究主要来自University of Alberta（阿尔伯塔大学），University of Auckland（奥克兰大学）和前面提到的CMU。CMU在扑克界赫赫有名，其推出了两款人工智能程序Claudico和Libratus，并在最近挑战了一些顶级的扑克玩家。虽然Claudico获得了多场胜利，但在2015年，Claudico被一个由Doug Polk、Bjorn Li、Dong Kim和Jason Les四名玩家组成的团队击败，但Claudico也一路获了多场胜利。Doug Polk曾对《PokerNews》表示，Claudico“使用了一个非常复杂的策略，包括许多大大小小的赌注”，但还是存在一些漏洞。经过改进迭代的Libratus，在2017年1月挑战了四名顶级职业扑克玩家，Kim和Les回归了第二场战役，Jimmy Chou和Daniel McAulay加入了他们的团队。最后，Libratus击败了这一组世界级的德州扑克职业选手，并且是以每100手14倍大盲（译者注：缩写为14bb／100，意为玩100手牌，平均能赢对手14倍大盲注）完胜顶级人类玩家团队。在Libratus对人类玩家12万手牌的不限注德州扑克挑战赛后，Libratus从四名职业玩家手中赢得了1，766，250美元的筹码。Dong Kim在比赛结束后接受了《PokerNews》Sarah Herring的采访。他表示，“对于我们来说真的很难玩。我们会提出一个策略，这个策略可能在当天效果不错，然后是第二天它就会带来新的东西。我们则没有为此做好准备，所以总体来说是真的、真的很艰难。”为什么会这样？Libratus会进行自我纠正，它每天晚上分析自己的打法，纠正错误，并在第二天使用不同的策略，但这不是全部。不同于之前的Claudico，Libratus依赖于一种算法，该算法使用了数百万内核小时计算，这样大量计算的实现要依靠的Pittsburgh Supercomputing Center（匹兹堡超级计算中心，PSC）“Bridges”源才变得有可能，它没有使用固定的内置策略。它也会随机化自己的行为，使对手难以破译它是否在虚张声势。最令人惊讶的是，Libratus不仅仅是一个人工智能在扑克领域的应用程序，而是可以应用于任何不完善的信息系统，有无数潜在的应用可能。Kim承认他的这个没有血肉对手的能力令人印象深刻。“人工智能玩得很好，我认为它有世界级的水平。”当被问及他自己在打牌的时候可以使用哪些Libratus的策略时，Kim解释说，人工智能程序的混合策略使其难以对抗。Kim表示，“有很多很好的东西，我都想要在我自己打牌的时候融会进来，但真的很难做到。Libratus有一些真的非常好的策略，但也是一个混合的策略，所以当你用一个策略用得太多了一点，那么你的这一点就会非常容易被人利用，所以一般来说模仿或模拟很难，让我们拭目以待吧。”Libratus经常在其压倒性的打法中使用超额下注。Kim表示，“它使用超额下注比任何人都多。如果是一个人类玩家，那么说实在的，我们会认为这个家伙完全是一个技术拙劣的玩家，因为他用这招用得太多了。”“实际上，当它超额下注的时候，它其实是在虚张声势。是的，它就是在大张旗鼓地虚张声势。”CMU的研究员Brown，在2016年3月向《PokerNews》解释称：“这并不令人惊奇（Libratus会虚张声势），因为电脑正在做的是模拟数以万亿计手的牌，它对虚张声势的看法和我们并不一样。它所做的只是反复地遇到这种情况，它注意到即使没有很好的牌，仍然可以通过下注赚到更多的钱。”人工智能战胜人类牌手的关键因素是什么？虽然大多数扑克玩家不会很快就与人工智能正面交锋，但是看看人工智能如何打败人类玩家所使用的技巧倒是很有价值的。是什么让诸如Libratus之类的人工智能程序表现得这么好？在玩扑克时有一些情绪本身并不是坏事——在某些情况下甚至可能是有益的——从某种意义上来说，在这个游戏中，将成功的职业玩家和不赚不赔或者是亏钱的业余爱好者区分开来的一个重要特征就是模仿人工智能的能力。虽然大多数职业玩家和扑克教练都不会这样说，但他们告诉有抱负的专业人士，在这个游戏中成功的关键是在游戏中做出决定时不要考虑钱。2016年，Andrew Robl在《PokerNews》发表的一篇文章中，他表示要想成为一个成功的扑克玩家，应该具备六个特征，其中五个可以说是符合Libratus这样的人工智能程序：经验、智力、欲望和学习的意愿（除掉欲望部分）、控制情绪的能力以及进行了次数多到令人想吐的比赛。不过，第六个特征只适用于人类——社交和人际交往技能。人工智能在这部分的表现是糟糕的——至少在目前是这样。在情绪控制方面，人工智能相比于人类拥有明显的优势，包括偏见和疲劳因素在内。而当Libratus在连续落败的时候，它不会生气或者是感到沮丧，更不会殴打对手或者是在后面的对抗中状态不佳。在经历了漫长的一整天磨砺之后，它不会感到精力不济，更不会因此犯下错误。因此它是更好的玩家。在同Libratus进行了对抗之后，Kim的一个评论凸显出了人工智能与人类之间的关键区别：“我们并没有想到会输这么多，这是非常艰难的部分……这并不一定是因为人工智能本身。而是不断地输，队伍的士气非常低落。”同时，Libratus不断根据经验调整策略，始终如一地发挥最佳水平。人工智能无法感觉到钱的价值，这让它们能够免受风险的影响，并且总是能够实现“正确的”游戏理论最优（GTO策略），即使在风险回报比例非常糟糕的情况下也是如此。这导致它们会大量使用虚张声势的战术。Libratus无论风险如何，都会做出最好的决定，它们没有资金管理的概念，也不需要支付账单，这也有助于它们做到这一点。战胜人类牌手也只是开始Libratus的共同创始人Tuomas Sandholm在Carnegie Mellon（卡内基．梅隆）的一份出版物中评估了人工智能的胜利产生的影响。他表示，“人工智能根据不完美的信息进行策略推理的能力现在已经超过了人类。”Polk在接受《PokerNews》采访时回应了这种情绪，他注意到的Claudico的漏洞在Libratus中被修复了。“对于我来说，现在事情已经很清楚了，人类在不限注德州扑克单挑比赛中落后于形势变化，我认为这种情况将继续以其他形式发生。”CMU的计算机科学系主任Frank Pfenning表示，融入虚张声势是一个关键概念，因为没有这项能力就无法取胜。他说道，“开发一个能够成功做到这一点的人工智能程序是科学前进的一个巨大进步。想象一下，有朝一日你的智能手机能够为你要买的新车谈判得到最优惠的价格。这还只是开始。”通过人工智能训练牌手看起来我们可以从这些会玩扑克的人工智能程序身上学到很多东西，但是不要矫枉过正——有一些扑克技巧，我们人类比机器更好。虽然人工智能非常擅长通过模拟数万亿手牌来实现游戏理论最优（GTO策略），但是由于针对特定对手，人工智能可获得手牌的样本数量有限，在对个人对手采用针对弱点的策略的能力较差。Brown表示，“这是一个积极的研究领域，如何利用对手有限数量的样本。我们不知道为什么人类玩家非常精于此道，这可能是人工智能的一个重要的薄弱环节。”虽然扑克玩家可能会因为担心没有情绪的人工智能会赚走他们所有的钱而感到担心震惊，但这些程序的发展实际上可以对他们的盈亏情况产生积极的影响。Wardini提到存在“人工智能模拟和培训软件可以帮助人类”，包括帮助玩家开发一种“平衡的、没有漏洞可被利用的方法”并采用“更好的决策”来提高他们的游戏水平。
本文由入驻OFweek公众平台的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。
用户名/邮箱/手机：
忘记密码？
用其他账号登录： QQ
请输入评论
最新活动更多 &&
四川省/成都市
广东省/深圳市
广东省/深圳市
广东省/深圳市
北京市/海淀区
广东省/深圳市
广东省/深圳市
广东省/惠州市
广东省/广州市
江苏省/无锡市
*文字标题：
*纠错内容：
联系邮箱：
*验证码：围棋之后，德州扑克也被人工智能攻克了！下一个会是麻将吗？-ZAKER新闻
每日经济新闻
你有没有想过，未来某一天，称霸各种竞技、棋牌游戏的都不再是人类，而是 AI（人工智能）？据科技网站 TechRepublic 报道，虽说位于匹兹堡的河流赌场与 " 科技突破 " 有些不搭，但本周二（1 月 31 日），它确实见证了卡耐基梅隆大学的 AI 系统 Libratus 将 4 位德州扑克顶级选手斩落马下。" 我真的觉得它在钻我空子 "据凤凰科技报道，Libratus 是卡耐基梅隆大学计算机科学教授尚德洪姆与博士生布朗共同打造的，在为期 20 天的赛程中，它们一共进行了 12 万手牌的比赛，最终 Libratus 战胜了四位人类顶尖高手。" 这是 AI 开辟的新疆界，" 尚德洪姆在赛后的新闻发布会上说道。" 也是 AI 在游戏比赛中获得的里程碑式突破。"▲图片来源：卡耐基梅隆大学Libratus 的成功主要在于不断学习，每结束一天的比赛，它都能学到人类牌手的技巧并有所提升。" 每天比赛结束后，Libratus 内置的原算法就会分析对手的漏洞和技巧，并将其融入到 Libratus 未来的牌路之中。" 尚德洪姆说道。而 Libratus 的方式与此前人机扑克大赛的思路有所不同，此前研究人员主要寻找对手的破绽并针对相应破绽进行各个击破。Libratus 则正相反，它寻找破绽的目的是要补漏，防止自己也出现同样的破绽。1 月 30 日傍晚，完成了 3 万手比赛的 Jimmy Chou 就曾筋疲力尽地告诉媒体，" 这太难了。它（Libratus）不仅不留空子给我钻，而且我真的觉得它在钻我空子 "。在现实生活中或许比 AlphaGo 更有用Libratus 的胜利是 AI 逐步统治棋牌类游戏的又一里程碑，1997 年时 IBM 的深蓝电脑在国际象棋比赛中击败世界冠军卡斯帕罗夫，去年 AlphaGo 则成功在围棋比赛中摘冠，而此前这项运动被认为是直觉的游戏。与深蓝电脑纯靠计算能力有所不同的是，AlphaGo 拥有强化学习的能力。Libratus 的胜利还象征着 AI 的另一个巨大突破，因为德州扑克与围棋预设的挑战不同，它信息缺失的特性是此前 AI 从未触碰过的。▲图片来源：视觉中国杜克大学计算机教授科尼特兹也认为 AI 击败德州扑克顶级选手是个巨大突破。" 扑克是一个有关不完美信息的游戏，它与现实世界的战略决策更加息息相关，而这种特性在商业、政治、安全甚至社交生活中都能发挥直观重要的作用。"新南威尔士大学 AI 教授瓦尔斯也同意这一观点。" 从某些角度来看，德州扑克的难度甚至要超越国际象棋和围棋，因为它的信息缺失非常严重。你不知道对手拿了什么牌或者即将打出什么牌，这就意味着变数的增多。此外，在扑克比赛中，选手们还会动用心理战虚张声势来影响对手的判断。"值得注意的一点是，虽然 Libratus 用的依旧是传统的树形搜索、抽象和游戏战略分析等 AI 技术，但我们现在并未完全了解 Libratus 的工作方式。"AI 的进步可不止在深度学习上。" 瓦尔斯补充道。同时，瓦尔斯认为我们不能高兴的太早，因为 AI 并未彻底统治扑克界，眼下的比赛还是一对一，如果有更多选手加入进来，德州扑克的难度将会成倍增加。想在多人比赛中获胜，AI 恐怕还得多历练几年。此外，Libratus 与 AlphaGo 有相同的毛病，那就是它们只专精于一个领域。因此人类不必担心它们的觉醒，因为除了玩扑克和下围棋，它们什么都不会。围棋和德州扑克之后，人工智能的下一站会是哪个游戏？不少正在家里搓着麻将的中国网友认为，麻将会是 AI 无法攻破的堡垒，但果真如此吗？带着 AI 去打麻将，就能百战百胜？在许多人看来，麻将只要手气足够好，不需要技术也能赢。大部分人也常常将自己的胜利或失败，归于手气，也就是运气够不够好。但运气真的是麻将游戏中的一切吗？一局人类看起来必输的牌，让 AI 来接管，结果会不会有所不同？▲图片来源：视觉中国每经小编（微信号：nbdnews）在此向大家分享一篇深入解读的文章。以下文字摘自微信号 " 百度大脑 "（发布于去年 12 月 8 日）：诚然，麻将是一种运气成分占比非常高的竞技棋牌项目，技艺再强的高手，也有输给菜鸟的可能性。但同时不可否认的是，麻将中 " 技艺高低 " 也是明显存在的。麻将技艺的高低，不仅仅存在于高手和菜鸟之间。即使是顶尖高手，日本竞技麻将的高手段位中，在经过大量场数的竞技之后，顶尖选手之间的分数差距，同样可以稳定地被拉开，竞技水平被显著地区分开来。所以在麻将领域，研究出一个具有极高竞技水准的 AI，是完全有可能的。麻将 AI 的策略是怎样的？相比于棋类这样在大多理论上可遍历（通过计算机模拟出每一种可能的情况）的 " 完全信息动态博弈 "，棋牌类项目，因为很多情况下，你都不能知道对方手上的手牌，也不知道接下来会摸到什么牌，所以更多的情况是属于无法遍历的 " 非完全信息动态博弈 "。也就是说，相比于棋类 AI，力求 " 将对手逼入必输的岔路口 " 这个博弈目标不同，麻将 AI 的策略则更多地增加自己得点的期望值，尽量让自己有更大的可能性和大牌，同时尽量避免对手的大牌点炮。而麻将的打牌策略，显然是有最优解的。每圈弃牌的 14 个选择里，我们总可以找到我们当前认为最好的选择，而高等的选手，和高级的 AI 要做的，就是尽量能多思考几回合。当代的计算机棋手大多采用的是 " 蒙特卡洛树 " 搜索算法，策略是选择或迫使对手选择一个分支，这个分支下的所有的结局都是自己胜。AlphaGo 就是蒙特卡洛算法和深度学习的结合。让自己有更大的可能性和大牌，就需要通过手牌和弃牌池里的牌，计算自己进张（摸到有效牌）和鸣牌（吃、碰、杠），使自己手牌有进展的概率，进而计算自己和牌得分的期望值。这对于 AI 设计来说实际上是很简单的。让 AI 避免对手的大牌点炮相对更难，一方面麻将 AI 需要通过大量的牌谱数据库，来获得通过对方打出的弃牌来分析其牌型的能力。这样可以让 AI 拥有在几圈之前，就开始弃掉别家需要的关键牌的能力。百战百胜的麻将 AI 距离我们有多远？因为竞技麻将这项运动的小众性，麻将 AI 目前处于一个相当缺乏发展的阶段。目前还没有可以完全战胜所有人类的麻将 AI，但这其中主要的原因是缺乏相关的研究。大多麻将 AI 都还停留在游戏厂商的 AI 上，计算强度非常有限，无法与棋类 AI 动辄就在超级计算机上进行运行相比。但麻将运动中，可执行的打法数量，实际上是远小于围棋的。因为毕竟手上只有 14 张手牌，一共也只有 136 张的总牌数。所以实际上麻将的复杂度，AI 运行所需要的计算量，实际上也是比 AlphaGO 这样的围棋 AI 要少很多的。并且麻将有着相对明确的目标，有着相对少的和牌牌面，所以麻将 AI 实际上完全可以储存大量的牌谱，然后在运算的时候，只要寻找对自己有用的牌即可，这样可以减少很多的计算量。目前最强的麻将 AI，是东京大学开发的日麻 AI —— " 爆打 "。" 爆打 " 在日本最大的线上麻将平台，天凤上进行了 1.3 万多场比赛，最高达到过七段的成绩，这意味着「爆打」比 96% 以上的麻将玩家都取得了更好的成绩。▲日麻 AI " 爆打 " 对战两位天凤六段选手和一位八段选手，自摸。除了麻将之外的其他棋牌 AI实际上，除了麻将之外，很多中国民间喜闻乐见的棋牌项目，对于开发 AI 来寻找最优解的能力，相比棋类 AI 程序来说，都要简单得多。其面对的问题，同样是因为这些项目中都包含了运气成分，这使验证 AI 的有效性变成了一个相当难的问题。相反，麻将还是这些项目中相对规范化程度非常高的一个，至少在日本，有着非常完善的 ranking（排名）机制与平台。而因为验证 AI 有效性很麻烦，所以也导致了这类 AI 开发的相对滞后。而这样的 AI 的作用是什么？除了他们可以用来研究算法本身之外，棋牌 AI 所伴随的棋牌类竞技规范化，也是一个很重要的事情。但同时，我们还可能会看到的是，伴随着棋牌类竞技项目的赌博，可能也会开始依赖于 AI 催生出一个全新的产业。斗地主、桥牌、德州扑克 && 在未来我们都有希望看到这些项目对应的 " 最强 AI"，永远能找到最优解的 AI 出现。很多人都想不通，为什么人类要研究一个仅仅是用来下围棋的 AI，更不必说 " 打麻将 " 这件事，如今在中国完全不被当做一个 " 正经 " 竞技项目。但他们很难意识到的是，AI 实际上代表了人类对这个世界，孜孜不倦的探求，和挑战自我的精神。用来 " 打麻将 " 的 AI，我们创造它的动机，当然不是让我们可以利用其功能，在麻将场上百战百胜。而是我们通过麻将 AI 这件小事，使人类的智慧之光，得以在广袤的世界中延伸，直到洒满每一角落。这是我们要探究这个世界上一切未知事物的动力，包括却不限于，创造一个永远可以找到最优解的，麻将 AI。
相关标签：
原网页已经由 ZAKER 转码排版
财经新闻43分钟前
财经新闻52分钟前
财经新闻48分钟前
财经新闻24分钟前
财经新闻30分钟前
股票频道4小时前
环球老虎财经2小时前
华尔街见闻3小时前
21世纪经济报道37分钟前
华尔街见闻3小时前
21世纪经济报道2小时前
环球老虎财经4小时前
华尔街见闻3小时前
华尔街见闻4小时前
华尔街见闻5小时前君，已阅读到文档的结尾了呢~~
中外民族体育－奇妙纷呈
扫扫二维码，随身浏览文档
手机或平板扫扫即可继续访问
中外民族体育－奇妙纷呈
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由：
将文档分享至：
分享完整地址
文档地址：
粘贴到BBS或博客
flash地址：
支持嵌入FLASH地址的网站使用
html代码：
&embed src='http://www.docin.com/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布，请您等待！
3秒自动关闭窗口}

淘宝游戏网