据说人机extend被强多少集变强了.有多强

4月10日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了47343分。总战绩36000手牌,人类一共输了792327分,平均每百手损失22个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。
分享专题至:
  2017年是AI在扑克上取得突破的一年,冷扑大师Libratus和DeepStack相继完胜人类,实现对人类专业级玩家的超越,毫无疑问是里程碑式的突破。在Alp
  5月6日,浪体德州扑克锦标赛第一期将迎来总决赛阶段的比赛,两位特邀明星牌手将与选拔赛出线的四位牌手争夺本期比赛的冠军。两位特邀牌手,一位是曾经击败过李世石的围棋职业六段高手王垚,一位是德州扑克界集主播、制片、演员等多身份于一身的超级网红色老三。
4月初,冷扑大师与中国龙之队的德州扑克人机对抗表演赛,掀起了一波对人工智能和德州扑克的关注风潮。在这种背景下,“金牌德州扑克”与“新浪体育”合作举办了浪体德州扑克锦标赛,通过海选,决出了四位晋级总决赛的选手,同时新浪体育与金牌德州各自特邀了一位明星牌手,共六位选手参加5月6日在新浪总部大厦演播室直播的总决赛。
围棋圈德州扑克打得最好的人
王垚在德州扑克比赛中
关注围棋新闻的朋友对王垚这个名字并不陌生,别看他的段位只有职业六段,但其实早就有了九段的实力和战绩。早年他不仅是围甲联赛云南队的主力,还经常参加世界大赛,李昌镐和李世石都曾是他的手下败将。没错,就是去年与AlphaGo人机大战的那个李世石。
王垚曾在三星杯中淘汰韩国李世石
这些年王垚出现在围棋赛场上的画面变少,一方面是柯洁等少年棋手成长起来,老棋手们的空间越来越窄,另一方面也是因为王垚对德州扑克发生了浓厚的兴趣,经常去参加一些锦标赛,而且成绩相当不错。
用个比较俗的梗,可以说王垚是下围棋里德扑打的最好的,打德扑里围棋下得最棒的。但据说职业棋手里还有其他的德扑高手,不知道他们服不服王垚这个“围棋圈德扑最强”的名号。
德扑圈的超级网红
著名牌手色老三
色老三在德扑圈里可谓是无人不知,他的经历也很传奇,曾就职于三国杀和暴走漫画,后来自己出来做视频,现在把最爱的德扑和视频结合,成为了集主播、制片、演员等多身份于一身的超级网红
色老三的一些名言也广为流传,例如“鱼打鱼call鱼有点,BuyinN手不眨眼,抢完大盲抢小盲,一言不合All一脸。”同时他最著名的战绩当属,连续一天三把AA四把KK全输。根据运气守恒原理,这次的浪体德扑总决赛,他会不会时来运转呢?
网红的颜值很重要
除了以上两位特邀出战的明星牌手,还有四位从金牌德扑平台选拔赛里脱颖而出的牌手,他们也都不是等闲之辈,这六人将争夺本次比赛的锦标,冠军的奖励是一台Iphone7(第一名:iPhone7,第二名:PS4一台,第三名:beats耳机一部)。以下是四位海选出线牌手的介绍:
金牌德州签约牌手兼顾问;多年企业高管履历,德州扑克牌龄8年;年作为半职业牌手,MTT及游戏桌均稳定盈利;2015年出任金牌德州战队队长,带队夺得《最强牌手》第二季团队冠军;培训经验丰富,热心细致的辅导入门玩家提高技术水平,成为金牌德州人气最高的主播。
北京奥政投资有限公司总经理。当过四年兵,荣立两次三等功,并光荣加入中国共产党。从事媒体工作数年,编导,主持人,导演。目前从事互联网增值业务开发和运营。
自我介绍:去年年初经朋友介绍,认识并了解金牌德州,从初级玩德州,到获得金牌德州十个冠军的成绩。目前我只要上金牌德州,全国各地的玩家都认识,都尊称我为强哥。我玩德州扑克的体会是,就像打高尔夫一样,每个动作要规范;德州扑克每手底牌和河牌的变化,操作筹码都要规范。学习德州扑克的过程,就是认识自己的过程。
李远龙(龙):
来自广东的选手,接触德州两年多,主要打线上的选手,平常接触各个德州平台,都有不错成绩,特别在金牌德州比赛拿过很多个冠军,线下参加过今年年初的澳门MBP拿到21名很不错的成绩,一个很标准的德州新生代玩家。年纪轻轻,同时还是两个小孩的爸爸。
周迅(Andrew):
男28岁。职业:食品销售渠道部经理。牌龄1年,德州扑克线上比赛新星 半年之内线上锦标赛收获30多个单奖金过万的冠亚军成绩。
5月6日下午14时,新浪演播室,这六位牌手将汇聚在本期浪体德州扑克锦标赛的决赛桌前,谁能笑到最后呢,我们拭目以待。
  (原标题:德州扑克人工智能之父:赢不赢柯洁,阿尔法狗都缺乏实际用处)人机对战无疑是4月10日的新闻焦点之一。一边在海南澄迈,德州扑克人工智能“冷扑大师”(Lib
  4月10日,《重演德扑人机大战》节目第四期节目现场,聚众互动CEO张鹏和知名专栏作家、导演、知名牌手王小山做客新浪演播室分享德州扑克人机战花絮。
以上是相关视频。
  4月6日-10日,德扑人机大战名人体验赛在海口举行,6支战队36位名人牌手与德扑AI冷扑大师进行PK,李开复、许戈辉、杨守彬、李思晓等众多大咖出战,新浪为您转播了比赛,欢迎回看。
&&&&&点击回看新浪视频直播
&&&&&点击回看前方直播
  4月10日下午,为期5天的德扑人机赛在海南闭幕。组委会在闭幕当天的特意安排了彩蛋,李开复、许戈辉等大咖领衔,德扑名人体验赛悄然上演,令本次赛事别有一番风味。
以上是相关视频。
  4月10日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了47343分。总战绩36000手牌,人类一共输了792327分,平均每百手损失22个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。
全部36000手牌打完,人类总共输了792327分,平均每百手损失22个大盲注。这个差距在人类牌手之中已经是比较大的了,一般认为每百手超过10个大盲注的战斗就属于大胜。更令人遗憾的是,即使单算九场比赛,龙之队也没有一场能够在总分上超过冷扑大师。
众所周知德州扑克的胜负与手里拿到的牌直接相关,有很大的运气因素,因此比赛采用了复式发牌,你的手牌好,意味着你的队友手牌坏,计算两人的总分,这样更有说服力。在这样一个相同公平的情况下,是人类牌手组合能够获得更多的积分还是人工智能呢?
虽然总分龙之队落败,但有几次单场比赛的两人小组成绩是胜过冷扑大师的,但出于种种原因考虑,本次比赛并未公布个人成绩,只有总分成绩。
赛后几位龙之队的选手坦言,后半程他们其实已经发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但可惜发现得有些晚。如果在进行几场较量的话,他们有信心取得单场比赛的胜利。
今天晚上还将有冷扑大师名人体验赛,李开复等跨界名人将挑战冷扑大师,敬请关注新浪之后的报道。
  4月9日,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了第4日的比赛,上午第七场损失42744分,下午第八场损失55644分,虽然龙之队总分依旧落败,但相比之前几天的成绩大幅好转。10日上午,将进行本次表演赛最后3000手牌的比赛,龙之队能否在单场比赛中击败冷扑大师,依旧存有悬念。
从4月8日下午的第六场开始,龙之队似乎找到了更好地与冷扑大师对抗的策略,虽然总分依然落败,但双方的差距已经大大缩小。在这种背景下,今天大家的心态轻松了许多,延续了好调,两场比赛虽然总分都不敌冷扑大师,这已经是大家取得的第二和第三好的单场战绩了。
有德扑“校长”之称的许朝军坦言在这几天的比赛当中,他学到了很多。这相信也是龙之队整体的感受,可能也是他们这几轮战绩回升的原因之一。帮助人类牌手训练,不断提升自己,这才是人工智能在德州扑克领域未来要扮演的角色。
德扑人机大战龙之队积分情况
回到比赛,明天上午将进行最后3000手牌的比赛,虽然总分龙之队已经大幅落后,不太存在整体比赛翻盘的可能,但单场的胜负依旧存有悬念。此前冷扑大师在与四位外国顶尖牌手对抗时,人类牌手也曾一度缩小了比分差距,即取得单场对抗的胜利。再加上这几场比赛龙之队的好调,明天他们能否取得别具意义的一胜呢,我们拭目以待。
  4月9日,《重演德扑人机大战》节目第三期节目现场,360副总裁、首席科学家、人工智能研究院院长颜水成和知名专栏作家、导演,知名牌手王小山做客新浪演播室畅聊德扑人工智能,现场两人模拟单挑。
以上是相关视频。
  5月6日,浪体德州扑克锦标赛第一期将迎来总决赛阶段的比赛,两位特邀明星牌手将与选拔赛出线的四位牌手争夺本期比赛的冠军。两位特邀牌手,一位是曾经击败过李世石的围棋职业六段高手王垚,一位是德州扑克界集主播、制片、演员等多身份于一身的超级网红色老三。
4月初,冷扑大师与中国龙之队的德州扑克人机对抗表演赛,掀起了一波对人工智能和德州扑克的关注风潮。在这种背景下,“金牌德州扑克”与“新浪体育”合作举办了浪体德州扑克锦标赛,通过海选,决出了四位晋级总决赛的选手,同时新浪体育与金牌德州各自特邀了一位明星牌手,共六位选手参加5月6日在新浪总部大厦演播室直播的总决赛。
围棋圈德州扑克打得最好的人
王垚在德州扑克比赛中
关注围棋新闻的朋友对王垚这个名字并不陌生,别看他的段位只有职业六段,但其实早就有了九段的实力和战绩。早年他不仅是围甲联赛云南队的主力,还经常参加世界大赛,李昌镐和李世石都曾是他的手下败将。没错,就是去年与AlphaGo人机大战的那个李世石。
王垚曾在三星杯中淘汰韩国李世石
这些年王垚出现在围棋赛场上的画面变少,一方面是柯洁等少年棋手成长起来,老棋手们的空间越来越窄,另一方面也是因为王垚对德州扑克发生了浓厚的兴趣,经常去参加一些锦标赛,而且成绩相当不错。
用个比较俗的梗,可以说王垚是下围棋里德扑打的最好的,打德扑里围棋下得最棒的。但据说职业棋手里还有其他的德扑高手,不知道他们服不服王垚这个“围棋圈德扑最强”的名号。
德扑圈的超级网红
著名牌手色老三
色老三在德扑圈里可谓是无人不知,他的经历也很传奇,曾就职于三国杀和暴走漫画,后来自己出来做视频,现在把最爱的德扑和视频结合,成为了集主播、制片、演员等多身份于一身的超级网红
色老三的一些名言也广为流传,例如“鱼打鱼call鱼有点,BuyinN手不眨眼,抢完大盲抢小盲,一言不合All一脸。”同时他最著名的战绩当属,连续一天三把AA四把KK全输。根据运气守恒原理,这次的浪体德扑总决赛,他会不会时来运转呢?
网红的颜值很重要
除了以上两位特邀出战的明星牌手,还有四位从金牌德扑平台选拔赛里脱颖而出的牌手,他们也都不是等闲之辈,这六人将争夺本次比赛的锦标,冠军的奖励是一台Iphone7(第一名:iPhone7,第二名:PS4一台,第三名:beats耳机一部)。以下是四位海选出线牌手的介绍:
金牌德州签约牌手兼顾问;多年企业高管履历,德州扑克牌龄8年;年作为半职业牌手,MTT及游戏桌均稳定盈利;2015年出任金牌德州战队队长,带队夺得《最强牌手》第二季团队冠军;培训经验丰富,热心细致的辅导入门玩家提高技术水平,成为金牌德州人气最高的主播。
北京奥政投资有限公司总经理。当过四年兵,荣立两次三等功,并光荣加入中国共产党。从事媒体工作数年,编导,主持人,导演。目前从事互联网增值业务开发和运营。
自我介绍:去年年初经朋友介绍,认识并了解金牌德州,从初级玩德州,到获得金牌德州十个冠军的成绩。目前我只要上金牌德州,全国各地的玩家都认识,都尊称我为强哥。我玩德州扑克的体会是,就像打高尔夫一样,每个动作要规范;德州扑克每手底牌和河牌的变化,操作筹码都要规范。学习德州扑克的过程,就是认识自己的过程。
李远龙(龙):
来自广东的选手,接触德州两年多,主要打线上的选手,平常接触各个德州平台,都有不错成绩,特别在金牌德州比赛拿过很多个冠军,线下参加过今年年初的澳门MBP拿到21名很不错的成绩,一个很标准的德州新生代玩家。年纪轻轻,同时还是两个小孩的爸爸。
周迅(Andrew):
男28岁。职业:食品销售渠道部经理。牌龄1年,德州扑克线上比赛新星 半年之内线上锦标赛收获30多个单奖金过万的冠亚军成绩。
5月6日下午14时,新浪演播室,这六位牌手将汇聚在本期浪体德州扑克锦标赛的决赛桌前,谁能笑到最后呢,我们拭目以待。
  (原标题:德州扑克人工智能之父:赢不赢柯洁,阿尔法狗都缺乏实际用处)人机对战无疑是4月10日的新闻焦点之一。一边在海南澄迈,德州扑克人工智能“冷扑大师”(Lib
  4月10日,《重演德扑人机大战》节目第四期节目现场,聚众互动CEO张鹏和知名专栏作家、导演、知名牌手王小山做客新浪演播室分享德州扑克人机战花絮。
以上是相关视频。
  4月6日-10日,德扑人机大战名人体验赛在海口举行,6支战队36位名人牌手与德扑AI冷扑大师进行PK,李开复、许戈辉、杨守彬、李思晓等众多大咖出战,新浪为您转播了比赛,欢迎回看。
&&&&&点击回看新浪视频直播
&&&&&点击回看前方直播
  4月10日下午,为期5天的德扑人机赛在海南闭幕。组委会在闭幕当天的特意安排了彩蛋,李开复、许戈辉等大咖领衔,德扑名人体验赛悄然上演,令本次赛事别有一番风味。
以上是相关视频。
  4月10日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了全部比赛,第九场龙之队依旧未能总分取胜,输了47343分。总战绩36000手牌,人类一共输了792327分,平均每百手损失22个大盲注。即使单看九个单场的比赛,人类牌手也未取一胜。
全部36000手牌打完,人类总共输了792327分,平均每百手损失22个大盲注。这个差距在人类牌手之中已经是比较大的了,一般认为每百手超过10个大盲注的战斗就属于大胜。更令人遗憾的是,即使单算九场比赛,龙之队也没有一场能够在总分上超过冷扑大师。
众所周知德州扑克的胜负与手里拿到的牌直接相关,有很大的运气因素,因此比赛采用了复式发牌,你的手牌好,意味着你的队友手牌坏,计算两人的总分,这样更有说服力。在这样一个相同公平的情况下,是人类牌手组合能够获得更多的积分还是人工智能呢?
虽然总分龙之队落败,但有几次单场比赛的两人小组成绩是胜过冷扑大师的,但出于种种原因考虑,本次比赛并未公布个人成绩,只有总分成绩。
赛后几位龙之队的选手坦言,后半程他们其实已经发现了冷扑大师的一些规律性失误,所以成绩也有所提升,但可惜发现得有些晚。如果在进行几场较量的话,他们有信心取得单场比赛的胜利。
今天晚上还将有冷扑大师名人体验赛,李开复等跨界名人将挑战冷扑大师,敬请关注新浪之后的报道。
  4月9日,冷扑大师VS中国龙之队德州扑克人机大战表演赛结束了第4日的比赛,上午第七场损失42744分,下午第八场损失55644分,虽然龙之队总分依旧落败,但相比之前几天的成绩大幅好转。10日上午,将进行本次表演赛最后3000手牌的比赛,龙之队能否在单场比赛中击败冷扑大师,依旧存有悬念。
从4月8日下午的第六场开始,龙之队似乎找到了更好地与冷扑大师对抗的策略,虽然总分依然落败,但双方的差距已经大大缩小。在这种背景下,今天大家的心态轻松了许多,延续了好调,两场比赛虽然总分都不敌冷扑大师,这已经是大家取得的第二和第三好的单场战绩了。
有德扑“校长”之称的许朝军坦言在这几天的比赛当中,他学到了很多。这相信也是龙之队整体的感受,可能也是他们这几轮战绩回升的原因之一。帮助人类牌手训练,不断提升自己,这才是人工智能在德州扑克领域未来要扮演的角色。
德扑人机大战龙之队积分情况
回到比赛,明天上午将进行最后3000手牌的比赛,虽然总分龙之队已经大幅落后,不太存在整体比赛翻盘的可能,但单场的胜负依旧存有悬念。此前冷扑大师在与四位外国顶尖牌手对抗时,人类牌手也曾一度缩小了比分差距,即取得单场对抗的胜利。再加上这几场比赛龙之队的好调,明天他们能否取得别具意义的一胜呢,我们拭目以待。
  4月9日,《重演德扑人机大战》节目第三期节目现场,360副总裁、首席科学家、人工智能研究院院长颜水成和知名专栏作家、导演,知名牌手王小山做客新浪演播室畅聊德扑人工智能,现场两人模拟单挑。
以上是相关视频。
  4月9日,冷扑大师VS中国龙之队德州扑克人机大战表演赛进入到收官阶段,在上午进行的第七场对决中,龙之队虽然以53907的积分劣势落败,但这已经是他们本次比赛的第二好成绩,人类牌手似乎渐渐熟悉了AI的打法,有了一些还手之力。
受日程的影响,第七场比赛的总共手牌数增加到了4800,所以龙之队全部选手比赛结束得很晚。按说这样对体能的要求会更加苛刻,但龙之队本场的总成绩比起以前再度有所进步,虽然六位牌手总分仍然输了53907分,但这已经是七场比赛以来的第二好成绩。
以下是详细积分情况。
七轮后积分
下午,比赛的发起人、创新工场的李开复也来到赛场,体验与冷扑大师的对抗。明天下午,以李开复为首的创投、科技、娱乐界各路人马将组成六支战队,分别与冷扑大师一较长短。
李开复与冷扑大师之父托马斯教授
  德扑人机大战比赛日赛后,美女牌手朱亚希分享了一些比赛中的趣事,她表示AI有时会犯一些人类看起来有些愚蠢的有趣错误。
以上为相关视频。
  德扑人机大战间隙,新浪体育对“冷扑大师”之父、卡耐基梅隆大学的计算机科学家Tuomas Sandholm教授进行了独家专访。教授表示,结合近日的比赛来看,AI在人类棋手面前展现出了难以战胜的特质,而人类棋手能够争取的看来只有尽量少输了。
以上为相关视频。
  德扑人机大战比赛日赛后,龙之队队长杜悦表示AI跟人类棋手在博弈上没有表现出明显的差异,关键点在于AI没有情绪的变化,不会有所谓“上头”的表现。
以上为相关视频。
  德扑人机大战在海南海口激战正酣,从首个比赛日开始至今,AI展现出了强大的优势,作为人类代表出战的中国龙之队目前颓势明显。
以上为相关视频。
  相比去年李世石与AlphaGo的人机大战给围棋圈带来天翻地覆的冲击,德扑圈此前对失利是有着足够的心理预期的,毕竟冷扑大师在此前的比赛中已经击败过四位顶尖的外国德扑职业选手。龙之队出战的六位牌手虽然也都实力不凡,甚至有的还是程序员出身,但在技术上他们恐怕也不敢说比那四位外国牌手更强。
虽然已经提前做好了输的心理准备,但当强大的冷扑大师真切地出现在大家面前,坐到牌桌对面的时候,给中国德扑人的震惊,远比想象大得多的多。
有中国德扑教父之称的王天健,在某天比赛结束后,神色憔悴地跟队友说道:“打牌这么多年,从来没有给人这样在地上锤过……”
司文是这次德扑人机大战的直播主持:“铜墙铁壁!我们直播这么多年,没见到过这么强大的……”
冷扑大师的强悍在于,即使龙之队的牌手某位牌手能够在单场比赛中取胜,它也不会输很多积分;而对面的拿着镜像手牌的队友,往往被打得惨败。这也是为什么昨晚,童舟、许朝军两位同组队友同时取胜,他们那么兴奋的原因。这是在单场对决中,龙之队第一次战胜冷扑大师。
朱亚希心情不错
由于德州扑克比赛的特殊性和运气成分,这一场胜利并不能说明太多问题,真正有说服力的数据还是全队六位牌手的总分和全程比赛的成绩。但这并不影响龙之队牌手们重拾信心,9日的赛场上,大家的神情明显轻松了许多。
虽然人类总成绩已经落后很多,但在单场比赛中真正扳回一局似乎迎来了新的希望,也许如人机大战第四局李世石般的“神之一手”要来了。
  4月8日,重演德州扑克人机大战节目第二集继续进行,中国青年天使会会长、英诺基金创始人李竹,中国首位夺得德州扑克亚洲冠军的女牌手李思晓做客新浪演播室,点评比赛精彩瞬间。
以上是相关视频。
  柏林森,资深计算机行业从业者,深度围棋、德州扑克爱好者。此次以新浪棋牌特约评论员的身份和我们一起关注德州扑克人机大战。我们精选了一些小白问题(其实就是小编自己想不明白的)来请教柏老师,制作了《白话AI》的栏目。
问:听说人工智能会诈唬,它们学会骗人了?!
答:所谓诈唬就是在德州扑克比赛里,假装自己有大牌,把对方吓跑。我们忘掉诈唬这个词的表面意思,它其实就是德州扑克里的一个技术手段。除了诈唬,还有假装诈唬,假装假装诈唬,甚至一直无限的假装下去。
从数学的角度上讲,诈唬是在德州扑克游戏里获得更大收益的一种基础手段,只是在表现形式上看似是在“骗人”而已。对AI来说,诈唬和说实话没有本质的区别,只是在当前牌型和底池情况下,选择哪种策略会让它的长期收益更高而已。
冷扑大师会用诈唬的策略不是人为教给它的,而是告诉它德州扑克规则之后,它在演算过程当中自然而然形成的打牌策略,是这个游戏规则本身决定的。对人工智能来说,德州扑克是个数学问题,诈唬这种行为和加减乘除的之类数学符号没什么区别。
柏老师跟教授下了盘围棋
今天柏老师专访了冷扑大师的缔造者托马斯教授,两人谈笑风生,相见恨晚,还下了一盘围棋。柏老师问了教授很多关键性的问题,比如冷扑大师是否每天都会把与龙之队比赛的牌谱拿回去研究升级,对此,教授回答:“暂时无可奉告,等比赛结束才会公布这些技术细节”。
  没太大悬念,人族代表龙之队的劣势扩大了。
截止到北京时间22:00时,冷扑大师VS中国龙之队巅峰表现赛DAY2经过11小时的战斗中国龙之队完成8400手牌。
上半场比赛,冷扑大师保持着首日的稳健表现,领先186842记分牌。下半场比赛,冷扑大师依旧领先中国龙之队,赢得160723记分牌,DAY2冷扑大师领先347565记分牌。经过两天的比拼冷扑大师共领先412792记分牌。
不过,比赛不只有结果的胜负,还有现场有趣的观点被谈及。在德扑人机大战的前方现场第二日,新浪科技采访到了冷扑大师开发者Tuomas Sandholm教授,以及几位龙之队的队员。
德扑人机大战地点定在海南,让不少媒体有所惊讶。
一直以来,海南并不以互联网发展著称,所以当比赛第一日网络遇到问题重启超级计算机,以及第二日因为网络登入有延迟时,已经来到现场督战的Tuomas Sandholm教授被问到了“远程协作”的问题。
Tuomas Sandholm 是CMU的教授,是“冷扑大师”之父,他于4月6日抵达海南,而且也是他的第一次海南之旅,此前他只听说这是一个可以称作“中国夏威夷”的地方。
Tuomas Sandholm当然不认为距离和地点能给冷扑大师带来挑战。
即便首日和次日接连遇到了网络相关的问题,但Tuomas Sandholm在接受新浪科技前方采访时,还是直截了当地表示:距离不是问题,在匹兹堡、在北京、在海南,对于冷扑大师来说都一样,而且即便在冷扑大师 “老家”匹兹堡比赛,具体真正的超算机房,也有30公里的距离。
Tuomas Sandholm解释了网络问题的真实原因——适配调整还未完美,不过就在接受采访时,次日上午的比赛已经接近尾声,网络再没遭遇挑战,而且冷扑大师的状态似乎越来越好了。
冷扑大师的状态更好了。这话不是别人瞎猜的,这话是龙之队队员许朝军说的。
他是这场巅峰表演赛中的“急先锋”,比赛开打以来,他总是第一个完赛的选手,还是其中成绩不错的选手。在第一日和第二日的4场比赛中,他有2场以上击败了冷扑大师。不过,由于此次采用的是团体计分的规则,个人选手的成绩并不希望被透露太多。
然而,新浪科技还是得到了一些确切且振奋的消息。比如在第一日的比赛中,许朝军2场比赛都击败了冷扑大师,用德扑专业术语来说是“在水上”。许朝军将此归结为之前准备工作充分,确实针对性的措施有了效果。
但在第二日上午比赛结束后,让许朝军感叹的是:冷扑大师似乎调整了策略,变强了,而且好像有了“读心术”,第二天的比赛超级难打。
Tuomas Sandholm教授证实了许朝军的感觉,他表示冷扑大师之所以可以用人工智能来定义,完全就是这种机器学习和不断优化的能力,在这方面人类的劣势显而易见。
作为这支龙之队的体能教练,许朝军透露在准备的一个多月里,龙之队从健身训练到头脑风暴,都在为这次人机大战做准备,所以当第一日“小输”惜败之后,他们备受鼓舞,但第二日展现出的实力来讲,似乎冷扑大师在一夜之间又提升了。
值得注意的是,这并非人工智能“遇强则强”。现场有媒体问Tuomas Sandholm说,如果完全不懂德扑、或者小白用户和冷扑大师对战,会不会出现“乱拳打死老师傅”的情况,在怪招之下把人工智能打懵?
在回答冷扑大师是否会被打懵之前,Tuomas Sandholm教授显然被这个问题问懵了,他可能不太理解这个问题的内在逻辑,所以又向翻译确认重复了几回。
在中国,正如“乱拳打死老师傅”成语存在一样,不少人仍旧认为所有的人工智能都会存在bug,而这个bug可能防高手而不防小白,正如不会下棋的虚竹破了珍珑棋局一样,如果乱打一气,是不是会让机器搞不清楚状况而陷入“死机”?
Tuomas Sandholm教授否认了这种情况的出现,他表示冷扑大师终极所在是数学原理,是概率思维,冷扑大师的目标就是通过价值网络去“赢”下比赛,而不管是高手小白,对冷扑大师的区别可能是“计算量”的差别而已。
Tuomas Sandholm还谈到,之所以可以这么去解释,是冷扑大师采用的算法是可回溯可检查的,这与AlphaGo所使用的深度学习的算法模型还有所区别。
自被李世石的神之一手击穿至今,AlphaGo团队始终未能找到机器忽然“懵逼”的原因所在。实际上,深度神经网络的 黑箱问题一直备受关注,但至今仍旧不能完全解决。虽然有Google资深工程师向新浪科技透露过,AlphaGo的算法程序有多种组成,并非只有深度学习 一种,但一年后DeepMind团队还是没找到出题出现的原因。
这也是Tuomas Sandholm被问到“冷扑大师”和AlphaGo谁更厉害时谈到的观点。他认为这二者无法直接比较,也无法通过比赛一较高下,因为二者所使用的方法和要研究的问题截然不同。
AlphaGo使用深度学习算法模型为主,主打有限信息条件下的计算,只要范围确定,AlphaGo就能展现出威力。
冷扑大师则针对“不完整信息博弈”,比如谈判等大量信息被隐藏的领域,是冷扑大师团队想要利用机器解决的问题。
而且发展到现在,Tuomas Sandholm认为冷扑已经到了要进入商用应用的阶段。他这次不仅代表研发团队和自己的科研弟子来华,Tuomas Sandholm还代表自己创立的公司“Strategic Machine”,他表示在不久,这家公司就会把冷扑大师带入商业谈判、网络安全、医疗方案制定等领域,并且坚信会比人类做得更优秀。
值得一提的是,Tuomas Sandholm强调说,这种应用还将是全球性的,不限制地域和条件的——或者说只要接入了互联网即可。
这也是德扑人机大战可以选在海南进行的原因。一方面是冷扑大师对“出差”完全不存在技术问题,另一方面则是海南当地对此次活动寄予厚望,希望把目前基础设施和诚意最大化展示,以期未来更多互联网创业者来到海南开展自己的项目。
在舆论热议的雾霾等环境问题探讨中,海南的优势更加明显:环境优美、沙滩阳光比基尼……
有意思的是,Tuomas Sandholm在得知最后比赛地点可以定在海南时,高兴地回复李开复:这么说,我可以带上我的泳裤了?!
  4月6日-10日,德州扑克人机大战在海南火热进行。7日,创新工场CEO和著名美女牌手李思晓做客新浪演播间,与主持人回顾了人机大战前2日的赛况。
主持人:我现在有请李开复老师介绍这次活动背景
开复:我们可能都关看到今年一月美国CMU卡耐基梅隆大学的一位教授,开发了一套德扑的机器人,而且在美国打败了顶尖的美国高手。因为我自己也是卡耐基梅隆毕业的,所以我就对他发出邀请。看他愿不愿意来跟中国的牌手对抗一下,那么就想阿尔法狗打败了世界冠军在围棋上,那么CMU的这套冷扑大师系统在美国打败了顶尖高手。那这次来到中国,我们是抱着希望,让大家能够看到德扑也是可以有意思的比赛。而且比围棋更有不同的意义。那么也非常开心的是,托马斯教授也带着冷扑大师过来,和我们这次组织的中国龙之队是由杜悦老师,是中国唯一的在VSOP上得过金手链的,带着中国龙之队的六位选手跟冷扑大师做一个为期五天的对抗,这是一个大概的背景。
主持人:好,那么我们先来看一下这两天的赛况
4月7日上午,冷扑大师对战中国龙之队德州扑克人机大站表演赛在海南生态软件园传奇智力运动馆结束了第三场比赛,本场六位选手共与冷扑大师打了近4200手牌,共输了124654分,加上昨天的损失,人类在11400手牌里已经落后了191591分。双方的差距也是越来越大了。所以我想问一下在场的三位嘉宾,昨天也有一直在关注这个比赛吧,然后你们对于昨天和今天的表现有什么评价呢?
开复:我先来说一下哈,一共有三场比赛嚒,第一次人类是输了一万多分,第二次是五万多分,第三次是十二万多分,这其中是有他的道理的,第一个我们可以看到,一万多分基本是一个不相上下的情况,表示中国龙之队确实很强,但是呢,冷扑大师他没打完一次比赛以后呢,一个小节之后,他就会开始机器学习,针对每一位牌手,针对他们所有的弱点,他会调整自己的参数,所以在第二次,第一天下午的比赛,他就已经化身成了六个冷扑大师,针对每一位牌手的弱点调整了自己的参数,呐,他就从一万赢到了五万。第三场,再学习之后就到了十二万。所以我们可以看到机器的自我调整是非常厉害,非常可怕的。
主持人:呐 李思晓呢?
李思晓:首先呢我觉得,嗯 这次很有看点,然后因为我不太了解机器,开复老师可能更了解,但是我会觉得比较可怕,我看了之前的一些介绍,包括他不单纯只是从大数据上的一个归纳,而且对人的及时的调整和很多整个德州扑克上的一些专业的学习能力是非常强的机器,因为这一次也是非常有看点,这六位牌手也是代表了中国最顶尖的一个水平,第二我昨天也看了一下,六位牌手所代表的风格也是不一样的,每个人对同样的一首牌的打法是完全不一样的一个处理方式,然后机器对人的一个及时调整也是很快速,你就可以看到他的包容性会是很强的,因为对于完全不同的六种风格的玩家有一个判断,这个还是很厉害的。当然我觉得,从第一场来说,我们人类牌手也有一些非常优秀的地方。
主持人:好了,我觉得现在应该还有很多观众会就是很疑问这个冷扑大师是一个什么样的存在,所以我特别想问一下开复老师冷扑大师这个电脑程序他是怎么学会打德州扑克的呢?
开复:其实这个跟阿尔法狗的围棋差别挺大的,因为冷扑大师从来没有学过人的比赛的牌谱,阿尔法狗是先从人的牌谱学起,然后在自我提升,冷扑大师几乎是从博弈论的理论加上德州扑克的规矩自己再不断的推进他的算法,所以他每一次决定的下注或者是不下注,或者每一个决策,他是针对所有人类的可能性然后所有的这种诈和和当真的可能性,做一个对他最有利的判断。那么这个判断呢,下出来以后,无论人是怎么样的回应,他应该都是一个接近最优的,然后他是优化自己的打法,让对手猜不出来自己是用什么风格在做什么事情。而他呢又会去猜,对方是用什么方式,呐,如果你把这个盖子掀开来,它里面其实是一个特别巨大的数据库,他储存了所有牌的排列与组合,还有在这种排列组合之下如何去找到一个平衡点,让对方猜不出来你有什么牌,所以还是一个巨大的统计系统。
主持:那我想问一下冷扑大师这个存在是否就意味着人工智能会向人类隐瞒信息呢?
开复:应该是说他的表现是有在隐瞒信息。但是呢,这是人教他去隐瞒的。就是说,现在所有的人工智能的工具无论是机器人、无人驾驶、阿尔法狗或者冷扑大师,他都是人写的代码,人操控的工具,所以他是我们管的,他没有自我意识来去隐瞒信息,他的隐瞒信息他的编程者叫他去隐瞒信息的,所以不用太担心我们的机器人以后会来欺骗我们。
朱波:其实这里面有一个人工智能的话在一些完全不确定的状况当中,信息不完全清楚的情况下能够做出他自己的最佳判断,这个呢我觉得人工智能能够在德扑做到这个地步的话,其实他的,应该说他的不确定信息,这种架势可能还有更多一点。
开复:我们可能跟围棋做一个对比的话,围棋它的每一个黑白棋都在你的面上,俩人都知道,没有任何隐藏的,那真是的应用在什么地方?人的真实的应用很少是一切都暴露出来的,那么德扑更像,比如你买一套房子,他是900w 你的心里价位是850w,你是先开出700w再加呢?还是开出840w说我再也不加了,他的这个商业的交谈,谈生意的过程其实就跟德扑是很像的。所以这也意味着德扑能够克服,以后商业谈判啦政治外交啦,国际关系啦,都可能有机器来帮助人,所以把这个应用层面提升的高。
主持人:好的,那我们昨天和今天上午也看到了很多精彩牌局,那我们来给观众来模拟一下。
第一手牌是alen是坐在小盲芒位,拿了一个草花4草花10,冷扑大师就是拿了一个草花25,就在大盲位。好我们看一下现在这手牌,这边是冷扑大师,那边是alen,然后一个是小盲,一个是大盲。他们在翻牌前,alen是加注到230
思晓:对,alen是加注到230左右,一个2.3BB的一个标准的加注
主持人:对,冷扑大师是平call,平call 130
思晓:冷扑大师选择了一个抵抗,因为在单挑里面,这个2 5的草花,只是有一个同色,还是可以选,因为只加1点多的1个DB,还是去进行一个抵抗。然后我看到底牌是一个A 6
10 的一个彩虹的情况,双方的玩家都选择了过牌,在人类这边的一个看法,可能是中了一个中队,然后选择了一个延迟性下注,同时因为我在观察这个冷扑大师的这个打法里面,他经常性的在转牌和合牌在做一些的很超池的一些下注,所以人类基本上在做这种中等牌类的时候会做些严格的控池的情况,冷扑大师很有意思,因为你在正常来说,你跟人类去打在前位回去控池,在后位回去造池,我昨天看冷扑大师经常会做一些匪夷所思的下注和判断,所以人类在这时候想做一个过牌同时引导对手去有一个咋呼的情况。
开复:其实冷扑大师他是在平衡不同的打法。他只可能一部分像人的打法,一部分像非人的打法。这样更让你猜不透,如果全部非人了你可能也会打得过他。
思晓:所以是心理上换成是我,因为我不了解那六位玩家,我可能会有一些恐惧
朱波:现在这手牌是昨天第一天的牌是吧?
思晓:对 我们现在复盘一个牌,同样的一手牌,然后人和冷扑大师交叉对打。然后造成的一个不一样的情况。
主持人:我来看一下,第一次底牌后,双方都过牌了。然后底牌又发了一张黑桃3。黑他3出来之后,冷扑大师选择的是下注1911。Alan选择下注到4000
思晓:我现在扮演的是一个人类
开复:你扮演的是人类?我以为你人类,你来自外星哦?
思晓:对 alan现在选择下注到4000,我们给冷扑大师转牌是一张好牌,给了一张补拍,有金有顺的一个层面,基本上是有12-13张的补牌。然后在这个牌面上,尤其是人类有可能是不中,没有任何的关系,所以,差不多是有30%-40%的胜率。所以冷扑大师选择了一个超池的一个下注,你可以看到我刚说的他会有一些很,在一个460的一个底池下面,下了一个将近5倍的一个底池性的下注
主持人:因为这个发射器上调出来一张。
思晓:一个是给他自己一个比较好的补牌,同时他可以偷掉对手一个没有任何A的一些补牌,就可以说,因为人类选择了过牌,所以人类有A的可能性,当然我们看到结果却是没有A,有A的可能性也确实没有那么大。那可以打掉对手的JJQQ,或者是KK 这些左右牌,所以冷扑大师选择了一个4倍的底池,会有更多的弃牌率在扑克的数学上面
主持人:那么alan跟注到了4000又是一个什么意思?
思晓:Alan跟注到了4000,杜悦老师之前我看他打WSOP时,我看他有一些在转牌上很激进的处理方法,他可能也读到了冷扑大师有可能是一个没有牌在转咋呼的一个情况。所以他做了一个反加注的转咋呼。而没想到冷扑大师选择了跟注。而且杜悦老师比较好,他有一张10 ,是一个对儿的补牌,他这里更多的是扮演一个A 10 或者一个对10的这样的一个范围。
朱波:是不是Alan这个跟注也是在验这个冷扑大师到底这个牌是不是他真的是成牌,如果是在买牌路上的也有可能就走了。
思晓:对,一个是转咋呼,同时也是试探对手的一个下注。
主持人:alan跟注到4000之后,冷扑大师选择了call 齐。然后我们来看合牌掉了一张红桃5,之后
思晓:我们从减法上来看这个是人类是领衔的
主持人: 这个是冷扑大师率先带的2197之后alan选择了复牌。
思晓:这个有点意思哈,换我我可能会call,但是因为转牌的这个加注,然后封锁掉了很多范围,因为在杜悦老师看来,对手不太会去偷底池。所以在杜悦老师看来,对手他的10可能会挂一个比较小的踢脚,有可能是落后了。但是在底池赔率上来说,可能是有10可以去开的,但是因为转牌这样一个反加注的过程,会锁紧一些范围。
朱波:是不是杜悦老师在考虑他可能是顺?因为这个牌是花顺双出么,翻到5出来这个胜面就很大。
思晓:因为牌面还是比较湿润的在扑克里面。然后牌在前位先做了一个。因为他觉得他自己是肯定赢不了了么,
主持人:在底牌后双方都选择check的情况下在10上冷扑大师做了一个open,然后他做了一个跟注之后冷扑大师又继续平call了,然后再合牌掉了一张5之后,冷扑大师继续开枪了。所以alan就选择了覆牌。这个思路是alan觉得冷扑大师成顺了是么?
思晓:嗯……我觉得alan会觉得冷扑大师有A吧。成顺的可能性并没有那么大。嗯……转牌成顺只有47的一手牌,但是有A 的组合,A 6 A10的组合,包括或者A3 的组合可能会更多一些,而且冷扑大师觉得对手是没有A的。但是这个合牌的下注有点意思。因为这只是单独的一手牌,因为可能他之前了解对手的一个数据,尤其对对手的转牌,我觉得这个牌重点不在合牌,重点是在转牌,一个强行的call的一个跟注。去读到对手一个范围,一个没有顶端的范围。这个是重点。
主持人:我们来看一下,迹象反过来的时候,我们张淮拿了冷扑大师的这手牌。张淮拿了黑桃25,冷扑大师拿了草花10 4 。他们俩是怎么对决的呢?冷不大师依然在大盲位。然后这个时候在翻牌前,冷扑大师加注到了250,然后张淮跟到600,
思晓:看到人类很激进啊,看到处理这些手牌。
主持人:冷扑大师平call 350,call 齐。这时候我们看一下底牌,底牌发出来 6 10 A的时候,张淮是率先加到800,就底池在1200的时候,张淮加注800。然后冷扑大师选择了平Call 800。这个时候你觉得,他们的思路是?
思晓:首先这个人类的这个翻前反加注很激进啊。可能这个之前也是为了平衡自己的手牌吧。因为冷扑大师太强了,如果我们打的很传统的话,可能就更有劣势。所以可能也会要用一些这种比较极化,我们叫两极牌,比如25这种,代表一些比较强的一些范围。尤其这个翻牌发出来以后,我们看到自己是25,因为我们翻前一些强势的举动,所以我们会代表我们自己手里有A,或者有A的一些组合,或者持续性下注,所以这里是一个很标准的持续性下注。
主持人:所以张淮加注到了800,所以冷扑大师选择了平call,然后我们看底牌掉了一张黑桃3之后,张淮是继续下注2000,
思晓:跟刚才拿手牌是一样的么?就是同样是有一个比较好的发展。然后我们又表现的强势,所以我们在这里一个是去塑造这样一个底池,同时看看打对手的一个弃牌率。在这点上打对手的一个弃牌率,冷扑大师做的是一个4倍的底池加注,我们做的是一个不到4/5的一个底池的下注。所以你就能看出冷扑大师对对手的一个弃牌率的处理上,在数学上更精准更凶狠一些。如果觉得对手没有A,他会更激进。
开复:因为他的每一次的动作的搜索的范围都是无限的,他可以从下100一直call in,他会考虑每一个可能性。然后找到其中的那一个可能性,是可以让他,无论在对手的回应之下,得到平均最大化的回报。
朱波:所以他是不是在底池2800的时候加注4/5还是带有邀请性的。想打出价值来。
思晓:对,这叫双向型下注,这就叫半咋呼,就算对手跟注了我们,合牌也可能也有十几张的补牌。但冷扑大师可能更直接
朱波:冷扑大师就是我要赢这手牌,我把你吓唬走了。他这里的话更想能够打出价值来
思晓:这可能就是人类心里和机器这里想的可能不太一样。逻辑上不太一样
朱波:人类想的我有可能花顺双出,我还是想打点价值
思晓:然后冷扑大师更没有,更跳出自己的手牌,更数据化的角度来判断。
开复:那思晓你会考虑用冷扑大师这种打法来作为你以后比赛的打法么?
思晓:会 而且我刚去打了一场比赛,现在世界上最顶级的这些玩家,也原来越去模仿机器人来下注,所以他一定是有特别优秀的地方,
朱波:其实这里就可以看出人类和机器的差别,机器就是我要赢,要结果。
主持人:我们再来看一下合牌在掉了一张红桃5之后呢,张淮是下注7000,
思晓:我们人类做了一个6800底池的一个超池
主持人:冷扑大师是跟注了16600,这是一个两倍多的跟注。
思晓:有效筹码只有20000
主持人:他选择了一个all in 冷扑大师直接选择了all in,然后张淮就选择了覆牌。
思晓:这个很精准啊,首先,在不均等信息的情况下,我们看到了25,但是要是没有看到的情况下,我们可能会觉得对手是有A的情况的,很精准的一个反向的覆牌。他觉得这个牌面组合上面,对手的AK,因为翻前是有动作的。我们逻辑上翻前是有动作的,AK的组合,包括A 10 的组合是小于JJQQ,AJ的这样的一个组合范围。同时,对手手上是有可能有两张黑桃的,冷扑大师手上是没有黑桃的,所以对手有黑桃的可能性会更多,所以对手买牌破产的可能性也会更高。而且我们看到是356,现在牌面上最大的手牌应该是47,冷扑大师手里有一张4 同时有一张10,是可以组合掉很多顶端范围。我们在扑克里面去顶端范围的一些手牌,所以他用他组合掉的手牌去打对手的顶端范围里头这样的手牌,就是对手有47的可能性和对10的可能性又减少了。我们从AKK的可能性有减少了一些。47 的可能性又减少了一些,对10的可能性有减少了一些。那这里面可能对手咋呼的可能要多于他有牌有价值的可能。还是一个数学上面的一个逻辑。那这个时候他觉得下的三条金,他有可能A挂弱踢脚。那个10是不太能开得动牌的。所以他觉得是一个,扑克里面的术语是抓鸡没鸡大,因为存在一个JJQQKK的可能性,因为张淮有可能是有可能有JJQQKK的可能性。如果那10开牌,有可能会输掉。但我们刚才有分析到了,这个有牌的可能性要小与没牌的可能性。组合大于很多。所以他一个反向咋呼是一个非常好的选择。
主持人:我觉得我刚刚从看这几首牌的时候,冷扑大师做的动作都很流畅,就从翻牌前翻牌后,到转牌到合牌的时候都是一气呵成的感觉。比如这手牌,冷扑大师和刚刚alan的时候就打法是完全的不一样。
思晓:对,我们总结一下,冷扑大师偷鸡的时候人类没有抓他,而且他判断出了人类在转牌的一个偷鸡,然后去平跟,同时在合牌在阻挡一个偷鸡,这是他拿到25这手牌的时候的一个处理方法。然后人类偷鸡的时候。他去反向偷鸡,反向咋呼。所以这点是很厉害的。
开复:所以他那两边的牌都赢了。
主持人:好了,我们来看一下第二首牌。我们来看一下这是王天健和冷扑大师打的一手牌。王天健是A8不同色,是大盲,冷扑大师是5Q不同色。是小盲位。我们来看一下翻牌前冷扑大师是选择下注到250。 大盲位的王天健是选择平call 150。 我们看一下底牌发了843,两个红桃,天健选择在前位过牌。冷扑大师加注到250。就打了一个1/2。
思晓:这个应该就是一个双方都比较标准的下注吧。持续性下注。因为他是加注者。然后我们人类这边中了一个顶对,在单挑里面也是一个比较好的手牌。所以选择了抵抗,选择了平call。
主持人:底牌掉了一张黑桃7之后,王天健继续过牌,冷扑大师继续开枪 打了1115。这又是一个超炮。
思晓:他真的很有意思
主持人:我觉得冷扑大师的下注很奇怪。
思晓:昨天看了 一个报道,就是人类他们一个赛后总结的一个报道。这个冷扑大师转牌的一个下注量是一个非常恐怖。就扑克里面我们衡量一个高手的能力也是在转牌。老外起名叫转牌,英文叫turn,为什么叫转牌turn,就理解为种百转千回的意思,就是他决定了这个5张牌后续发展的一个最关键的点,就像我们融资可能A轮B轮之间的那样一个点。所以在转牌上表现的强势,一个是给对手心理上造就一个压力,然后造大这个底池,二是去更好的咋呼。
主持人:王天健是继续平call 1115,
思晓:人类已经发现了它这个规律了。然后在转牌做了一个抵对,这个牌面还是比较潮湿的。这个各种的组合。人类还是选择了抵抗。就其实人类也是根据他的打法有一些适当的调整。
朱波:如果我们反过头来看,如果这时候人类肯换一下,他打1000多,冷扑大师在这上面可能会打一个超炮。
朱波:如果反过来,现在王天健是平call,思晓你是冷扑大师你会打多少。
思晓:极限价值么,就是换一下手牌,如果没有位置的情况下可能会call,如果有位置的话做一些极限的价值
朱波:如果这时候他是8顶对,又是打踢脚
思晓:如果人类那这个Q5转牌都不一定赶有动作。
主持人:冷扑大师打的很激进啊。我们来看合牌掉了一张方片8之后,王天健是选择率先开枪打了一个3200满池。然后冷扑大师跟注到8900
朱波:在这一点我就看不懂了。冷扑大师又是采用这种bulafu的方法
主持人:将bulafu进行到底么?
主持人:然后天健选择all in。将底牌加注到了18300,应该是有效筹码都选择了
思晓:这个逻辑应该是说冷扑大师首先有一张5,我们这个牌面发这张8之前可能这个逻辑是成立的,56是成立的,同时为什么冷不大师选择加注的情况下,对手56的可能性很小。然后对手转牌没有一个反向的加注,和fulaop一个没有转牌的加注,所以代表他有对儿的可能性也是比较小。所以在看合牌的这张8,目前我们是结果论,我们看到王天健手牌很大,但是他觉得对手已经没有葫芦的太多可能性。但是没想到被人类拿了一个对,反向的打了一个更多的价值。这个是人类也对机器人的一个不信任了。但是冷扑大师是有逻辑的。现在前后他是有一定逻辑的,原因就是说,他觉得78和3344的可能性,从fulaopo和turn上已经完全排除掉了。确实是没有。因为人类从始至终没有反向加注。所以这个牌的组合确实是非常小一些。
主持人:这时候我们的冷扑大师就选择了覆牌。
思晓:对 没有么,因为实在没办法了。All in
朱波:那最后天健加注了,冷扑大师又打了8000多,是明显想打他的弃牌率。
思晓:对 要打他的弃牌率。
朱波:他如果all in 的话呢?但是他也是跟了,天健肯定会跟
思晓:对 这是为什么有10%的胜率的一个情况。
开复:这时候冷扑大师又是考虑了一个整个范围。All in 对他来说是非常不利的。因为对方一接的话,你就没有任何的记分牌了。
主持人:很聪明啊 这个冷扑大师。
开复:留下了一万块钱左右。输了10000的筹码
主持人:我们来看另外一手牌,还有最后一手牌了。这个童舟拿了一个QQ,超对。我们冷扑大师拿了一个红桃47。 Button位是冷扑大师。冷扑大师是选择加注到了250,而童舟是选择翻倍到了799,然后冷扑大师继续选择4倍的加注,3196。这个牌就是安全
思晓:童舟这个玩家平时也会一起玩儿。他可能是这六个人里面,相对的跟杜悦老师一样是比较激进的玩家。所以我会觉得冷扑大师发现了他反加注的频率,因为他看不到他是QQ,因为他发现经常翻前经常反加注对手。所以他做回了一个继续加注的抵抗。一定是之前的一个大数据,然后造成了他拿47这样的牌,做了抵抗。而且他确实挑对人了。从我的角度来说,这六个玩家童舟是最激进的玩家。
主持人:然后童舟选择了call 齐。我们来看一下底牌发了10 6 8,有一张红桃。在看到底牌之后,童舟选择了过牌。然后冷扑大师也是选择了过牌,
朱波:在这个时候冷扑大师的顺面蛮大的。卡5 卡9
主持人:那我想问一下童舟为什么要选择过牌么?
思晓:因为他也会担心么?因为翻前对手很激进,而且这个牌面也很复杂。感觉是一个超对,但是其实如果打下去AKK不赢,同时有可能撞到赢对手一个手对J,手对9都没有那么大一个胜率。有7和9的一些补牌在上面。所以这牌给我拿QQ,可能翻前我可能会推掉吧。这就是一些不太一样的玩法。当然,可能童舟和机器人打的更多,可能他会有他自己的一些想法。
开复:其实,如果你技不如人的时候,不如翻前推掉
思晓:对对
开复:而且你觉得你有50%的胜率,就推掉,因为之后你还可能更落后了。
朱波:真的,如果我技不如人的话,我看到QQ我在翻牌前结束战斗。我们两条鱼肯定是推掉了
开复:我们两条鱼肯定是推掉了
主持人:我们看到翻牌前底池就可能到了6392,我们来看转牌。发了一张黑桃4。这个时候冷扑大师是有对了。童舟是选择开枪。加注到4505。而冷扑大师选择了平call。这个时候冷扑大师的几手牌没那么挤进去,是因为底池已经很大了。就是后手已经不太够他打一个超炮之类什么的
思晓:嗯 一个是这方面的原因,一个可能是对手翻前的一个抵抗。有可能让对手盖到很多大对子,冷扑大师有可能分析到他把对手翻前抵抗的那个范围缩短到很窄很窄,那这个时候也却是很难在这个牌面上盖掉一个很大的对子。
主持人:我有一个特别搞笑的问题想问一下,冷扑大师你们看他前面几手牌,就从来没有在翻拍,转牌弃掉牌过。永远都是在合牌别人推出来,如果他是bolafu他就是弃掉牌。他为什么在这个转牌的时候,击中了一张4还是不会弃牌还是要平call呢?
思晓:嗯,首先是说我们看到对手是QQ了。对手如果是翻前抵抗,我觉得不太会抵抗那种太杂的一些手牌,但是也会有一些AQ,JQ、或者AK这种,所以他可能在组合上面,但是我现在算不了太多细节的组合,但是会有一些手对子的组合,但是会miss掉一些JQ 9J类似于这样的组合在上面。
朱波:不过,如果换过来,人类打这手牌的话,当他下注到4000多的时候,肯定就盖掉了
思晓:人类肯定就翻前盖掉了。
朱波:所以这个机器的想法
开复:但是我们必须假设他是对的,所以表示我们必须要学习,要是我肯定就盖掉了
朱波:对啊必须要学习 要是这手牌的话,人类的话,我也肯定盖掉了,肯定打都不敢打。
开复:所以大家学习啊学习。因为范围可能会降低一点,但是也没有低到这个地步。
主持人:那么这个时候我们看到底池已经到了15400,我们看到了合牌掉了一张黑桃7之后,冷扑大师成了双对儿,
思晓:我觉这张如果不是黑桃7的话,他合牌一定会下注。我刚才没有想过这个问题,有可能他会打一个极限的价值。但是因为这张是黑桃7,所以对手可能call了黑桃AJ,黑桃AQ,黑桃AK,。因为多了黑桃AJ AQ A9 AK包括A小的这种同色的一个金的可能性,我刚才还在思考他为什么合牌没有下注,因为封锁到了一个首对子,就是因为有了一个金的组合,所以他认为没有更多的保价在里面。这也就更能判断出冷扑大师对这个组合的一个下注的一个比例的精细程度。我觉得是蛮厉害的。
主持人:所以在合牌黑桃7发出来之后,两方都选择了过牌,开牌
主持人:这也是我们看到了四手很精彩的人类和冷扑大师的一个精彩对决。李开复老师也看到这四手牌,您能跟我们介绍一下冷扑大师的打这四手牌的决策的原理么?
开复:决策的原理就是不断在评估,自己的所有的可能性和对方的所有的回应的可能性。还有下面会发出所有牌的可能性,。就是不断推下去,因为其实一方面我觉得德州扑克的搜索空间是比较小的,因为一共就是这么共有的5张牌加上你的两张手牌,他是可以穷尽的搜索可能性,那他所要做的事情就是平衡人类所有不同的打法和他如何选择一个让人非常两难的空间。就想比如说,我们玩剪刀石头布,如果你用任何的策略去push 1/3 1/3 1/3,那对方就会找到你的弱点。所以这个时候冷扑大师在这个时候就会说好,那剪刀石头布我各1/3。当然这个例子是非常简单的。在这个例子里他就会把各种不同的牌型去判断,当我碰到某种牌型的时候,我应该百分之多少时间这么打,百分之多少时间那么打。那么最后呢,他是最优化对手犯错的可能性和自己得到最多积分码的可能性。
主持人:我特别想问一下思晓,你刚看了这四手牌之后,你能点评一下人类牌手的一个发挥么?
思晓:我觉得,首先都有优点,王天健在A8的那一手牌打得很好,他也对机器人做了一个范围的调整。然后包括童舟和张淮他们也之前做的这些都是很标准的。包括张淮拿25做了一些转化。平衡了自己手牌的范围。就把扑克里面重要的概念其实已经传递的不错。
主持人:那朱波老师刚看了这四手牌,有什么让您匪夷所思的这种牌型么?
朱波:我觉得匪夷所思的话,机器人在合牌这个领域,这个节骨眼上,明明知道自己落后了,他还继续强行加注,尤其是在turn上打的特别激进,所以在这里面,我感觉人类还是带有情感因素,患得患失,比如像刚刚拿手牌,如果换成人类的话,可能当王天健加注的时候,人类就有可能覆牌了。而冷扑大师反而反加注,所以这个事让我感觉到人类在打牌的过程当中,是不是被情感,可能因为是空军,因为机器是0和1,他是没有恐惧,我要这个结果,要么有要么没有,人呢,就是有灰色地带,灰色地带的话,会不会影响人类在下注筹码时候的忧郁的感觉。这点是不是在1对1 的比赛中,人类几乎很难跟机器有所对抗。
开复:我觉得可以这么想,冷扑大师呢他可能已经对他的对手的恐惧感已经有一定的把握,。他认为这个对手的恐惧感是比较强的时候,他就会更倾向于选择一个大的下注,因为他打这个出来,虽然有时候会被call会输掉,但是赢的可能会更多。他会有这样的一个判断。
主持人:朱波老师您之前也组织过私人的比赛,然后这次德扑人机大战,您有没有分析一下技术原理?
朱波:其实我觉得人机大战呢这个从1对1的角度上来讲,就开复老师讲的,10%也是对人类的一个安慰,其实就是几乎没有胜的可言,其实这里面是对每一个人的分析,就想我今天打完以后,马上就能够学习,明天就是一个专业对付你的人,所以在人类当中呢,我觉得我们在打这种单人的这种比赛呢,我觉得是可能性不大的,未来是不是在多人的比赛中,人类会不会有机会赢
开复:我觉得会赢,因为今天还没有开发出很好的多人的德扑机器人,但是我觉得这应该有人要做开发,一年之内也应该可以把它衍生出来。
主持人:还想问一下开复老师,相似技术的应用情景分析。那么人工智能除了打德州扑克,还有下围棋,您觉得以后还能做什么呢?
开复:哦不是以后了,其实是今天。因为我们已经被人工智能围绕了,你手机里的应用,百度,淘宝,淘宝推荐让你买的东西,滴滴怎么帮你搭车,今日头条怎么帮你排序,知乎怎么让你知道答案,这一切都是背后是人工智能。那除此之外,我觉得最大的机会应该是在金融领域,因为基本上人工智能是一个大数据的游戏,但任何的一个领域,它基本上是一个特别大的数据而且又是可知的结果,对吧,你贷款还了没有,买一只股票他涨了没有,都是非常明确的,所以越明确的这种大数据信息呢越好用。所以金融之外,我觉得还有医疗看片子,然后人脸识别,物体识别,语音识别这个一个个算下来,我觉得大概在十年之内,人类现在所做的50%的工作都会被机器所取代。所以最近呢我也写了一本新书,就叫做人工智能。这本书现在可以开始预购,在里面我描述了人工智能的基本的技术,更总要的讲了他的应用和发展的蓝图。还有作为一个年轻人,要怎么样去选择自己事业的发展才能不会被人工智能机器人所取代。
主持人:那我刚刚也有回顾今天和昨天比赛的状况,人类在11400手牌里,已经落后了19w多分的差距,然后您能给预测一下接下来的走势么?
开复:走势应该是越来越不妙,因为机器不断的再学习,人也在学习,因为杜老师每天都会把团队召集起来做练习。然后用各种方法告诉大家试着怎们打,然后学到了什么东西,看来机器学习的速度会更快,所以我会预测差距会越拉越大。但是我觉得就想阿尔法狗对战李世石,李世石最后赢了一局,让我们人类保留了一点尊严,所以我也希望杜悦老师能够在未来的七场中会有一场胜出,还是会有可能的。
主持人:这么说来,开复老师会认为人类本次胜率的是不足10%哦,我想问一下思晓,你觉得人类的胜率大概会有多少呢?
思晓:嗯 我不太了解这个整个的东西,但是我觉得我们肯定是占劣势的,然后未来也是会被机器人了解的越来越多。我们的劣势一定会越来越大,我觉得鼓鼓劲吧给他们,希望他们可以更好,因为昨天我有看到他们牌手是有赢单场,我希望未来在单场的比赛中还是可以看到我们牌手的精彩表现。
主持人:好,作为一个美女牌手,你对这个机器人这个踏进德扑圈的领域你有什么样的感受么?
思晓:我觉得,我快失业了的那种感觉
开复:不可能 不可能,我觉得以后打德扑应该是越来越多在线下了,因为线上你没法分辨对手是人还是机器
主持人:那么据说4月10号的时候,两位嘉宾会来参加一个表演赛,你们对这个表演赛有什么期待么?
开复:因为我德扑打的不好,我觉得我就是应该来犯一些很大的错误来让大家嘲笑的。
思晓:我是为了体验人生,特别感谢开复老师给了这次机会,可能有生之年很早的接触到这些,然后能坚持多久就坚持多久吧。
主持人:我们今天也谢谢三位嘉宾做客新浪直播间,然后也希望各位观众持续关注我们新浪体育和新浪科技以后的直播,谢谢。
  新浪科技讯 4月8日凌晨消息,“冷扑大师”VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第二天的比赛。全天共8400手牌,龙之队一共输了347565分,与冷扑大师之间的积分差距相当明显。
4月7日下午,创新工场创始人、董事长李开复做客新浪直播间,为大家讲述了他眼中的德扑人机大战以及未来人工智能技术的应用前景。
以下为新浪科技根据李开复博士所讲内容整理:
就像AlphaGo打败了世界冠军,德扑AI程序Libratus也是打败了美国最顶尖的选手。
人 类第一次输了1万多分,第二次输了5万多分,第三次输了12万多分。我们可以看到,第一次几乎是不相上下的情况,代表中国派出的选手真的很强。但是“冷扑 大师”在打完每一场(section)比赛之后,他就会进行机器学习,针对每一位牌手的弱点调整自己的参数。所以在第一天下午的比赛,他就化身为6个“冷 扑大师”,针对每一位牌手的弱点调整参数,借此把差距拉到5万;第三场比赛再学习,便领先了12万。
我们可以看到机器的自我调整是非常厉害,非常可怕的。
“冷扑大师”如何学会打德扑
其实“冷扑大师”和AlphaGo的差别还是很大的。
“冷 扑大师”从来没有学过人类的牌谱,而AlphaGo先从人类的牌谱开始学起,之后再自我提升。“冷扑大师”几乎是从博弈论的理论加上德州扑克的规则,自己 再不断地推进算法,所以他每一次下注与否或者每一个决策都是针对人类所有的可能性做出一个最有利于他自己的判断。这个判断做出来以后,无论人类怎样回应, 对于“冷扑大师”来说都是接近最优的。而且“冷扑大师”还会不断优化自己的打法,让对手无法猜测,但他却可以猜测人类的应对方式。
如果你把“冷扑大师”的盖子掀开来,你会发现里面其实是一个特别巨大的数据库,它储存了所有牌的排列与组合,还有在当即的排列与组合之下如何去寻找一个平衡点,好让对手无法猜测出你有什么牌。
所以归根结底,还是一个巨大的统计系统。
人工智能会向人类隐瞒信息?
从 “冷扑大师”的表现上来看是在隐瞒信息,但实际上这是人类教他的。现在所有的人工智能的工具,无论是机器人、无人驾驶,还是AlphaGo或者“冷扑大 师”,本质都是人类写的代码,人类操控的工具。所以他们是受人类管的,他没有意识操控自己去隐瞒信息,之所以表现出来隐瞒信息实际上是他的编程者叫他这么 做的。所以不用太担心未来机器人会欺骗我们。
和围棋进行一个对比的话,我们可以看到围棋的黑白子都在棋盘上,完全公开没有隐藏的。我们可能 要问,真实的应用在什么地方?需要明确的是,人的真实应用很少会全都暴露出来,德扑可能更适合应用于你去买一套房子——标价900万,你的心里预期是 850万,你是该出700万慢慢往上加呢?还是直接出840万,拒绝加价呢?
说到这,我们发现商业谈判其实和德扑是很像的。这也意味着德扑未来可以克服商业谈判,甚至是政治外交、国际关系处理上的一些问题,帮助人类做出决策。
“冷扑大师”会穷尽所有可能性
“冷扑大师”不断地评估自己的所有的可能性和对方回应的所有的可能性,还有接下来发出的牌的所有可能性,如此往复,不断推下去。
一 方面,德州扑克本身的搜索的区间是比较小的,因此“冷扑大师”是可以穷尽地搜索所有的可能性的,他要做的事情就是去平衡人类的不同打法以及自己如何选择一 个让人类感到两难的打法。最后的目的就是最优化对手犯错的可能性和自己获取更多积分码的可能性。打个比方,两个人玩石头剪刀布,如果你用任何策落的概率不 各是三分之一,那么对方就会找到你的弱势。
实际上,除了AlphaGo和“冷扑大师”,我们现在已经被人工智能技术围绕了。百度、淘宝、滴滴、今日头条、知乎等公司在其各自服务用户的过程中,都已应用了人工智能技术。
除此之外,人工智能应用场景还包括金融领域、医疗领域、语音识别、人脸识别等。我预计在十年之内,人类从事的50%的工作都会被机器取代。
希望人类选手能赢一场
目前两天四场比赛15600手牌过后,龙之队共落后412702分,平均每百手损失26.2个大盲注。龙之队与“冷扑大师”之间的积分差距已经相当明显。
形势越来越不妙,因为机器在不断的学习,当然,人类也在不断的学习。但很明显,机器学习的速度更快,因此我预测差距会越拉越大。
AlphaGo对战李世石的比赛中,人类选手最后是赢了一局的,这也为人类挽回了尊严。希望在未来的7场比赛中,我们的中国德扑选手也可以获胜一场。(徐利)
  昨晚在做赛后采访时,龙之队的队长杜悦老师说了这样一句话:“一旦科学找到正确的方向,前进的速度是惊人的。”
虽然落后人类并不气馁
4月7日的两场比赛,龙之队其实输了蛮多积分的,冷扑大师在牌桌上表现出的强悍与冷酷,水平越高的人越能感受得到。不过龙之队的选手们并没有太多气馁的氛围,反而是变得越来越兴奋。这种兴奋来源于人类天生想去挑战更强的冲动。
这个落后和实力差距其实赛前大家是有所预估的,一方面是冷扑大师已经在美国的比赛中战胜了四位外国的德州扑克顶尖高手,另外一方面去年围棋人机大战李世石的失利已经帮我们所有人类做了一次应对失败的心里建设。
输掉人机大战后难过的李世石
去年3月12日,李世石与AlphaGo人机大战第三局,李世石认输的一刻,不光是围棋人,很多不懂围棋的人都经受了巨大的心理震撼。人工智能真的已经来了。一年的时间过去,人工智能的话题不断发酵,人们已经接受了AI在某些智力领域强于人类的事实,甚至遥望到了更广阔的未来。
从人工智能身上学到的
作者德州扑克虽然仅停留在明白规则的最基础阶段,但从六位龙之队牌手的表现和直播嘉宾的讲解来看,他们从与冷扑大师的比赛中,获益匪浅。
六位牌手分为A、B两队,分别拿到的是镜像牌。A组杜悦对应的是B组张淮对手电脑的牌,A组朱亚希对应的是B组王天健,A组童舟对应B组许朝军。比赛时是允许本组的三位队员探讨牌型和打法的。六位牌手在昨天的比赛中都不时惊呼出声,本组的成员也经常一起讨论AI惊人之举。许朝军在比赛结束后还不时回味冷扑大师的某些手牌打得“太漂亮了”。
牌手们技术讨论
直播嘉宾拿到牌例时,经常会对冷扑大师的一些做法感到意外,但经过仔细一分析,会发现其中的必然性和合理性。德州扑克毕竟是个不完全信息博弈,而且在翻牌、转牌、河牌时都有胜负翻转的机会,具体到某一手牌冷扑大师的结果虽然是输的,但它在全程的打牌动作上,很多时候只能用完美来形容。
随着与冷扑大师交手的增加,人类能从中学到的就更多。这一点和去年的围棋人机大战何其相似,大家从开始对AI招法的怀疑甚至批评,到后来仔细品味后的认可甚至追捧。
AI是为了帮人类做到更好
专心致志比赛的朱亚希
朱亚希非常享受这次比赛的过程,每天都是最后一个结束的,她说跟冷扑大师打牌是一个难得的学习机会。对人工智能来说,无论是德州扑克还是围棋都是非常完美的测试模型,在这些模型里,人工智能可以从基本规则向最终真理趋近。所以杜悦说:“一旦科学找到正确的方向,前进的速度是惊人的。”
冷扑大师可预见的未来会成为人类职业牌手的参谋,当然前提是它能够解决多人游戏和不同筹码量问题的时候;围棋的AlphaGo或者说Master已经达到了一个导师的程度,可以给人类职业棋手不少启发了。
人类发明汽车,不是为了跟自己赛跑,而是能够载着我们来到达更美好的远方,人工智能也是这样。所以这次德州扑克人机大战,发起人创新工场的李开复给出的定义是“表演赛”,目的是为了让人们更好的了解人工智能的前沿技术,更多的关注的德州扑克这个有趣的智力竞技。
李开复昨天做客新浪演播室畅谈人工智能的未来
  4月7日晚,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第2日的全部比赛。赛后龙之队队长杜悦表示虽然目前暂时落后,但基于德州扑克这个项目不确定性,龙之队还是有10%的胜利可能的,朱亚希则分享了一些比赛中的趣事,AI有时会犯一些人类看起来有些愚蠢的有趣错误。
记者:先聊聊今天的情况。
杜悦:虽然没看到统计,但我觉得我们今天平均下来每场要输10万以上……B队的许朝军其实前三场都在水上(积分领先),但今天下午也被打到了水下(积分落后)。
记者:怎么形容这个对手?
杜悦:AI就像一个技术非常高,而且不会“上头”的顶尖牌手,我是把它假想成这样一个人类对手。其实这几天的成绩,我们也分析了下,具体到每场比赛,AI分别对我们的队员,也都有“水上”、“水下”。今天下午虽然输了不少,但我们也是有两位队员在水上的。只是AI在水下的时候,也不会输很多;而我们队员经常在水下很深的位置。想把AI打成一个碾压的结果非常难,而我们人类在落后的时候很难做到心如止水。
记者:之前您提到龙之队有10%的胜率,现在估计还有多少。
杜悦:其实10%的胜率还是在那里,没有变的。
记者:这次人机大战作为一个历史性的时刻,您有没有压力。
杜悦:我个人对这次比赛是有些情结的,我以前是做计算机的,所以无论输赢我们都见证了一个人工智能的发展历史时刻。
记者:今天你是最后一个打完的,冷扑大师是不是比昨天更难对付了?
朱亚希:我昨天也是最后一个打完的呀,我感觉还好,差别不大。
记者:跟AI打牌和跟人打牌最大的区别是什么?
朱亚希:如果是人类对手他可能会有一些固定的习惯,我们会根据这些习惯做针对性的策略。但AI似乎都是根据计算,很难摸清固定的套路。我们现在的打法是,抓AI一些细节处理上的不细腻,而且AI会犯一些在我们人类看来很愚蠢的错误。
  4月7日晚,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第2日的全部比赛。全天共8400手牌,龙之队一共输了347565分。目前两天四场比赛15600手牌过后,龙之队共落后412702分,平均每百手损失26.2个大盲注。龙之队与冷扑大师之间的积分差距已经相当明显。
6日全天7200手牌,龙之队落后65137分。今天冷扑大师似乎展现出更为冷酷的一面,人类损失的积分进一步扩大。全天共进行了8400手牌,龙之队一共输了347565分。上午的第三场输了186842分,第四场输了160723分。
全天赛后龙之队队长杜悦和朱亚希接受采访
由于今天比赛的手牌数增加,整体比赛的时间变长,上午发布消息时有的牌手尚未打完全部手牌。上午龙之队其实遭遇了比想象中更大的打击,平均每手牌损失将近45个大盲注。下午成绩依然不佳,面对强大而冷酷的冷扑大师,龙之队遭遇了前所未有的挑战。
这样的一个差距,在德州扑克比赛里已经属于比较大的了,平均每百手牌,人类要落后个26.2大盲注。
前四场比赛龙之队成绩统计
4月7日、8日、9日上午,还将进行五场正式的挑战赛,赛程已经超过1/3,人类还有20400手牌的机会翻盘。在德州扑克的桌面上,什么事情都有可能发生,我们一起期待。
  4月7日,李开复、李思晓和朱波做客新浪演播室,为德扑人机战复盘并畅谈人工智能。
以上是相关视频。
  4月7日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆继续进行,两位早些结束比赛的人类牌手接受了新浪的专访,他们均表示第三场开始,冷扑大师比昨天变得更强了,而且很多手牌打得非常精彩,令人拍案叫绝。许朝军坦言感觉AI有读心术。
在上午进行的比赛中冷扑大师扩大了战果,反应到比赛现场的表现上,几位龙之队的牌手不时发出惊呼,与同组队友沟通冷扑大师的打法的精彩之处。许朝军和张淮两位牌手率先完成了700手牌的比赛,接受了新浪网的专访。
新浪:上午的比赛感觉怎么样?
许朝军:我觉得冷扑大师的策略和昨天相比有了很大的改变,变得很“凶”(德州扑克专业属于,打牌时加注等技术操作使用频繁,不轻易过牌)。我今天上午的比赛可以说是大起大落,中间几度反复,倒数第三把牌的时候我总算又赢了回来,上午的总战绩在“水上”。(水上是指赢得的积分超过AI,水下是指积分输给了AI,水平线则是双方打平的那条线)
新浪:冷扑大师变得更强了么?
许朝军:是的,他变得步步紧逼,而且是个“铁头”,读牌非常准。我们的诈唬很难骗到它,而它的诈唬动作运用的非常频繁,进攻性十足。我有种它有读心术的感觉。
新浪:感觉今天龙之队都很兴奋
许朝军:确实,有几把牌,AI打得真是太漂亮了。外我是全队的体能教练,也在帮大家调整神状态。
许朝军说这段话的时候,作者不禁想起来去年围棋人机大战第二局的时候,AlphaGo在布局下出令人惊艳的思路尖冲,棋圣聂卫平感叹:“就凭这手棋,阿老师值得我们脱帽致敬”。
张淮上午似乎状态不佳
新浪:上午的比赛怎么样?
张淮:上午我成绩不太好,一方面是牌运不佳,另外一方面可能还是技术上的问题。虽然比赛采用的是复式发牌,我这边牌不好,都会以为队友那边牌比较强,但很可能不见得是这样。具体要等到我们一起复盘的时候再看。
新浪:冷扑大师是不是今天有所变化。
张淮:其实还好,我觉得我主要的问题还是在自己,昨天整个人状态比较紧张,成绩还可以。今天有点放松。但今天明显我们打牌时要思考的东西变多了,变得艰难,从这种意义上讲,对方确实变强了。希望全队只是我的成绩不好,整体能赢。牺牲我一个,幸福大家。
新浪:下午继续加油!
张淮:谢谢。
不过,上午最终的结果并不像张淮希望的那样,只有他的成绩不好,上午的奖金4200手牌比赛,人类配上输了19万多的积分,与冷扑大师的差距进一步扩大。人机大战中,人类状态、心理、体能上的劣势也开始渐渐显现出来。
(新浪体育周游 发自澄迈)
  4月7日上午,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第3场比赛,本场六位牌手共与冷扑大师打了将近4200手牌,截至13时落后那么多,共输了126454分。算上昨天的损失,人类在11400手牌里,已经落后了191591分,双方的差距越来越大。有几位牌手暂时还没有完成比赛 4200手牌的数据稍后更新。
6日全天比赛人类牌手共输了65137的积分。平均到每100手牌,人类输9.02个大盲注。然而今天冷扑大师打法变得更加强悍,上午每人和机器打了700手牌,共进行了4200手较量。龙之队惨遭重创,共输了126454分,平均每百手输30.1个大盲注。本场六位牌手共与冷扑大师打了将近4200手牌,截至13时落后那么多,共输了126454分。有几位牌手暂时还没有完成比赛 4200手牌的数据稍后更新。
三场比赛战罢,共进行了00=11400手牌,龙之队总积分落后191591,平均每百手损失16.8个大盲注。
下午16时,将继续进行第四场对抗
,人类能否反败为胜呢?我们拭目以待。(文玄)
Dan&Colman罕见在牌桌上开口,为了让对手跟他的Allin真是拼了,细细品味那每个表情都是演技啊!视频来源:中扑网
  &&德扑人机大战激战正酣,对德扑感兴趣的小白们,此时无疑是入门学习的极佳时机!传奇扑克特意为您制作德扑小白教学视频,3分钟教您学会德州扑克。
  新浪科技李根 发自海南
德扑AI冷扑大师与中国龙之队的人机大战已经完成首日比赛。
从结果来看,全天累计数据方面,冷扑大师领先 65,137记分牌。其中,上半场冷扑大师领先中国龙之队14,145记分牌,下半场冷扑大师领先中国龙之队50,992记分牌。
这并不是一个差距明显的数据结果。至少冷扑大师展现出的优势并不明显,特别是在上午进行的上半场比赛中,也就可能只是一手牌中的运气之差而已。
但是下半场开始,人和机器的区别开始展现,伴随着一声“wocao”的感叹在比赛区响起,分水岭开始出现,据比赛结束后说,那是一手特别不错的牌,但最后没能从机器那边赢过来。
龙之队赛前合影
冷扑大师这边,主创开发团队也已从匹兹堡飞抵现场,让这些科学家感兴趣的是:龙之队半德扑半计算机背景的经验,他们渴求通过这次比赛看到一些不同的情况,有有意思的点发生。
不过,冷扑大师的开发者成员也表示:“以守为攻”的冷扑大师,第一日的比赛肯定不会有特别明显的优势展现,但差距也会随着时间而拉开。
实际上,如果回顾冷扑大师在1月30日的匹兹堡职业比赛中击败职业德扑玩家的统计图,也能看到比赛形势走势图呈现的是陡梯状——越往后差距会越明显。
但目前龙之队似乎心情和状态并未受到影响,领队杜悦在第二日比赛前调侃称:昨天稍微有一小点“不走运”。
龙之队队长杜悦登入系统
有意思的是,表现出“愁眉苦脸”的反倒是领先者冷扑大师的开发者,今天比赛开始前,网络登入还是不同程度有延迟和卡顿,但也比昨天要好了——毕竟第一天刚比赛就不得不重启了大洋之外的超级计算机,也算是这次德扑人机大战最富戏剧性的花絮了。
看来,战胜机器的唯一办法,还是得从源头想办法(真诚微笑脸)。
  4月6日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了首日的比赛,7200手牌之后,人类暂时总积分落后65137分。赛后六位龙之队的成员也分享自己首日比赛的感受。
杜悦:人如其名,冷冷酷酷的德扑大师。内功极其深厚,不亏是科学的结晶。我自己平时打牌,是比较松凶的,能够碾压对手就碾压,所以上午也是这样,结果被碾压了。中午和队友做了一些沟通,下午变得比较稳健,再加上牌比较好,所以效果还不错。
朱亚希:下午冷扑大师给我们的压力比上午大了,经常让我们处于比较为难的抉择当中。整体而言,我觉得他像将军一样,打法很大气。比赛之前我们比较懂计算机的队友透露过,AI在河牌转牌时很厉害,算得比较准,所以我的打法是尽量不要进入到河牌转牌阶段。
童舟:和人类高手打区别很大,我们都是找它的弱点。
许朝军:比赛前我说准备了七十二变的打法,但今天发挥了73种。我还加上了冷扑大师的打法。由于比赛是计算团队的积分,所以我的打法跟我平时自己打会有些不同,可能错过了些机会。
张淮:今天AI比我想象的弱,但实力确实还是很强的。我们有六个人,还是有机会的。我下午故意做了一些不规则的加注,希望找到AI计算上的误区。比如AI计算可能是的加注可能,我故意加到1200,在AI的计算里可能是会四舍五入到1000的策略里。一次加注误差一点,到最后可能会积累到不可忽略的数量。我是希望通过找到它这个的计算的误区,来寻找它的破绽。
王天健:第一天我们其实是在互相摸底。这不是一场纯粹意义上的德扑比赛,我今天有一些奇怪的打法,主要是想给AI一些误导,我们是在测试,看看AI是否有漏洞。我今天发现其实它有,不知道明天是否会修补上。我们能看到冷扑大师是有思考时间的,如果我们的策略不在它的常规思路里,它的思考时间相当长。有些牌它是犯了人类不会犯的错误,后面不知道是不是还能够利用。
(路西法)
  4月6日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了首日的比赛,下午的比赛人工智能“冷扑大师”和上午判若两人,打法变得犀利精确。人类牌手7200手牌之后,共输掉了65137积分,暂时每百手落后9.02个大盲注,虽然处于明显劣势,但还有翻盘的机会。
上午共进行了3600手牌,人类落后14145积分,比赛采用100的大盲注级别。平均下来,冷扑大师每百手领先3.92个大盲注。这个差距在德扑比赛里是在误差范围之内的,领先5到10个大盲注,则是领先的状态,超过10个大盲注则是碾压的状态。
下午的比赛有打了3600手牌,人类牌手共输了50992积分,全天比赛人类牌手共输了65137的积分。平均到每100手牌,人类输9.02个大盲注。虽然人类目前暂时落后,但后面还有翻盘的机会。
直播嘉宾司文和里昂明显感觉到下午“冷扑大师”的打法变得更加犀利和精确,可能是从上午的牌局数据里,已经读出了几位对手的策略,并做了针对性的调整。而龙之队的几位则明显感受到了压力。龙之队似乎也有过沟通,在打法上有些变化,但目前看成效不大。
龙之队队长杜悦老师在打法上变化最大,上午他打得非常激进,下午“火花”似乎渐渐熄灭了。打法的改变,加上牌运不错,杜悦的个人成绩提升了。不过龙之队整体输的更多了一些。赛后采访龙之队的成员表示,第一天可能大家都还是互相试探,后面会在打法上有更针对性的调整。
4月7日至10日,请继续关注德州扑克人机大战的相关报道。
  柏林森,资深计算机行业从业者,深度围棋、德州扑克爱好者。此次以新浪棋牌特约评论员的身份和我们一起关注德州扑克人机大战。我们精选了一些小白问题(其实就是小编自己想不明白的)来请教柏老师,制作了《白话AI》的栏目。
问:李开复说德州扑克人机大战人类胜率有10%,而围棋是零,你怎么看?
答:我们假设真的有围棋之神和德扑之神。围棋之神能够所谓穷尽变化,那么你跟他下棋确实不可能赢。德扑之神判断、计算能力无可匹敌,他能从你的行为中读出你的手牌是对3,而他拿着对A。那么这手牌,德扑之神肯定是“All IN”的。但河牌是有可能发出一张3的,最后输的是德扑之神。
围棋和德扑有本质上的区别,围棋是完全信息博弈,理论上有最优解。德扑是非完全信息,总是有概率的。德扑水平的较量要看长线收益,打得手牌越多,小概率事件所能造成的影响就越少。这次一共只打36000手,其实人取胜的概率比想象的大。
可能要跟柯洁下人机大战的AlphaGo当然还不是围棋之神,但他距离围棋之神的距离肯定比人类棋手近很多,人类棋手跟他下的胜率会很低很低。不过,在数学上0%并不代表着不能发生,只是在有限的时间里你可能观察不到而已。所以一般这种事发生的时候,我们都称之为奇迹。
德扑人机大战直播画面
问:听说冷扑大师没有用最近比较热的深度学习的技术?
答:冷扑大师用到的是一种叫做CFR(Counterfactual Regret Minimization)的框架。在双人零和游戏(你赢的是我输的)里,理论上是都存在纳什均衡点的。这次人机大战的德州扑克单挑赛制就是这样,人类和机器的输赢相加和为零,双方的目的都是为了赢棋对手手里尽可能多的筹码。
我们用最简单的剪刀石头布游戏举例。我们可以很容易的想到,如果我很均匀的按三种各1/3的概率出,那么无论对方怎么出,最后的结果肯定是胜平负各占1/3,而我不可能获得更差的结果。
如果对手只出石头和剪子,在我1/3策略不变的前提下,我的胜率还是1/3。但一旦我读到了对手的策略,做出相应的改变,那么对手的胜率将会大幅下降。所以对手的最优策略也应该各出1/3,这样能够保证自己的胜率不会低于1/3。
各出1/3就是剪刀石头布这个双人游戏里的纳什均衡点。我们可以把德州扑克理解为一个复杂了无数倍的石头剪刀布,而且是根据不同的牌面情况还是不同方式的剪刀石头布,冷扑大师就是要找出各个状态下不会输的策略。
具体到某个牌手,机器会通过数据分析牌手的策略,寻找其中的可利用性,加以打击。这也是为什么上一次冷扑大师与外国牌手人机大战,前面差距不大,后面人类越输越多的原因。
所以目前看来冷扑大师和深度学习暂时没什么太大关系。
能按照训练AlphaGo的方式训练小白么……
问:我如果有足够的高手牌谱,是不是能用深度学习训练出德扑AlphaGo来?
答:不能。两者游戏的基本算法逻辑是有很大区别的。举个例子,两个高手打牌的各种操作,反馈到扑克游戏里,最后的结果可能并不一样,因为胜负是有概率的。而两位棋手按照固定的走法在棋盘上落子,最后的结果是肯定的,不是黑胜就是白胜。从这种意义上讲,AlphaGo使用的那种棋谱学习的模式,是无法复制到德州扑克里的。
  4月6日上午,“冷扑大师VS中国龙之队”德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆打响,关于比赛的种种细节也终于揭晓。冷扑大师目前只能进行每局重置筹码的1V1比赛,人类德扑比赛常见的多人桌赛制,它暂时还不能挑战。
人类牌手打牌速度远胜AI
人类可以同时打两副牌
龙之队分成A、B两队,杜悦、朱亚希、童舟在A队,许朝军、张淮、王天健在B队。两队分别与冷扑大师对抗,采用复式发牌。A队人类拿到的手牌,是B队电脑的手牌,A队电脑的手牌是B队人类的手牌。
每位牌手面前有两个电脑,因为冷扑大师打牌速度较慢,人类可以同时打两副牌,时间上完全来得及。据了解冷扑大师采用完全数学的模型和算法,后台的计算机群计算量非常之大。所以目前情况来看,人类打牌的速度比AI快不少。
4月6日至10日上午,六位人类牌手将和电脑鏖战九场,共计打36000手牌。每场比赛结束后,官方会公布龙之队和冷扑大师的总成绩。10日下午将安排名人体验赛,由科技、创投、娱乐界名人组团,感受人机大战。
每局重置筹码
每局的基本筹码量要重置
具体到每局比赛都采用1V1单挑的模式,而且每局重置筹码。每局开始时,每位牌手有20000的筹码,大盲注100,小盲注50。这手牌打完之后,无论结果如何,下一局双方的筹码都要重置回20000。
这样的方式在某种意义上降低了电脑方面的难度,手中筹码量的不同,在打牌策略上也会有很大变化。而目前的冷扑大师还无法做到在不同筹码量的前提下,与人类对抗,因为初始等量筹码和不等量筹码在数学模型的建立上有本质上的区别。
名人赛也是1V1
本次德扑人机大战还安排了名人体验赛环节,但和之前传言名人赛采用多人局赛制不同,名人赛也会采用和表演赛一样的1V1模式。目前冷扑大师还无法进行多人比赛。
按照开发者卡内基o梅隆大学计算机科学学院院长安德鲁o摩尔的说法:“德州扑克中最考验牌手技术的反而是双人对战,如果有更多牌手的话,其他牌手间的技术差别反而会被利用。”
从技术层面这种说法也有一定道理,但德州扑克比赛,多人赛制是常态,而且偶然因素更多,也更加刺激。从基础策略模型的角度上分析,多人赛制和现在单挑的模式有本质上的不同。
这次比赛只是德扑人机大战的第一步,如果有一天冷扑大师能够在多人比赛中从头打到底,完美应对不同筹码量的问题,那么我们才敢说,人工智能在德州扑克项目上已经击败了人类。
(新浪体育周游 发自澄迈)
4月5日上午,冷扑大师VS中国龙之队人机巅峰表演赛发布会在创新工场举行。李开复现场为龙之队加油助威,龙之队队长杜悦也表示虽然胜机仅有百分之10,但是仍将全力以赴,赛出水平。&
  4月6日至10日,冷扑大师VS中国龙之队德州扑克人机大战表演赛在海南智力运动馆打响,中国的六位牌手将向德州扑克人工智能“冷扑大师”发起挑战,新浪将全程跟踪此次事件,为您带来第一现场的消息。
德州扑克 扑克游戏里的“围棋”
围棋是棋类游戏里变化最为复杂的,经常有人说下了围棋之后,对其他棋类就不感兴趣了。德州扑克在扑克类游戏,或者说非完全信息博弈游戏里,也是这样。有位德扑圈的高手以前酷爱麻将,但自从接触了德扑之后,就再也不打麻将了。
德州扑克基本规则很简单,玩家在发牌过程中依次投注}

我要回帖

更多关于 无人机是什么 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信