打败DOTA2顶级玩家的机器人打败人类到底强在哪

当前位置:&&&&正文
找好玩手机游戏,上&
那个打败Dota2世界冠军的AI却输给了50位普通玩家
在好游快爆上浏览
安装好游快爆,资讯随身看
扫描右侧二维码下载,您可以
· 掌握好玩新游资讯· 查找热门手游攻略· 强大工具助你成功
上周站内小编报道了在Dota2最大型的赛事Ti7上,乌克兰选手Denti被人工智能AI直落两局落败,在场解说无不惊叹&从未见过这么强的&!
据制作人员表示,团队并没有对AI指定任何针对Dota的策略或指示,完全放任AI令其自行领悟,通过与电脑AI的对战自行学习Dota打法,短短2周后AI便从初学者向世界冠军选手发起挑战,并最终取胜。关于人工智能在特定领域过于强大的现状也再次引起了关注。
然而在比赛结束后,制作团队兴高采烈地邀请各路玩家参与水友赛,并许诺只要赢了Dota AI即可获得游戏中的至宝,共计50份。令人意外的是,50份奖品很快就发完了&&击败了世界冠军的AI却惨败在50位普通玩家手上,这究竟是怎么回事?
原来,玩家琢磨出对抗AI的窍门,那就是根本不按套路出牌!例如,在双方出兵之前跑到AI家2塔和3塔之间,把AI的小兵勾引走,此时依旧想着卡兵的AI就会被玩家晾在野区不知所措,玩家的小兵就能顺利推掉一塔,确立优势。又或者绕后击杀掉AI用于补给的小鸡信使或是残血勾引AI来击杀自己的时候吃掉大魔棒瞬间回血给予反杀。
由此可以看出AI虽然能短期内学会游戏规则,但在变通上显然比不上人类,但随着AI的不断升级,或许有一天真能具备人类的意识和变通能力,到时怕不是真如恐怖电影所演的那样。
热门游戏推荐
热门关键字
热门游戏专区
扫描二维码,关注4399手游微信解密OpenAI击败DotA2顶级人类玩家,并不是AI的一次突破
[ 亿欧导读 ]
昨日,OpenAI击败DotA2顶级人类玩家的消息刷爆网络,但是这个DotA2人工智能到底干了什么,它是如何训练的,以及在什么样的游戏环境中运行?本文一一为您解答。
当我昨天看到OpenAI的人工智能,在一项奖金2400万美元的电子竞技赛事上,击败DotA2人类顶级高手时,整个人感觉超兴奋。
这是因为,一方面我是一个电子竞技的粉丝。尽管没玩过DotA2,但我经常在Twitch上观看其他其他电竞赛事,高中时我还当过一阵半职业选手。
更重要是的,像DotA这类多人在线战术竞技游戏(MOBA),以及星际2这类实时策略游戏(RTS),通常被认为远超目前人工智能的驾驭能力。因为这两类游戏需要长期战略决策、多人合作,比国际象棋、围棋有着更复杂的状态和动作空间。
DeepMind已经在星际2上研究了一段时间,前不久刚刚发布了新的进展,但目前为止,相关研究还没有取得重大突破。大家普遍认为,距离人工智能在星际2上吊打人类顶级玩家,至少还有一两年的时间。
这就是OpenAI这个成果如此令人震惊的原因。这是怎么回事?最有有什么人工智能方面的突破是我没有注意到的么?于是我开始研究这个DotA2人工智能到底干了什么,它是如何训练的,以及在什么样的游戏环境中运行。
我的结论是:这是一个令人印象深刻的成就。但不是一次AI上的突破。
通过这篇文章,我想提供一个关于此事的清醒解释。实际上,过度炒作人工智能的进步才是真正危险的事情。例如,下面这位在推特上的发言,才是真正的误导。
这是伊隆·马斯克的推特,这位硅谷钢铁侠不单创办了特斯拉,而且创办了OpenAI。上面这篇推特中,马斯克大意是说:OpenAI搞出了史上首个击败电子竞技顶级玩家的人工智能。这比搞国际象棋和围棋什么的复杂多了。
在第二条推特中,马斯克再次发表曾被AI届猛轰的观点:没人喜欢被管制,但对公众构成危险的一切(汽车、飞机、食品、药物等)都应该受到管制。AI也是一样。
首先要声明的是,我今天要谈及的炒作或者误导,并不是OpenAI研究人员的错误。OpenAI一直在研究方面都有诸多贡献。目前,OpenAI还没有公布他们解决方案的细节,所以外界很容易就会得出错误的结论。
现在开始切入正题。我们先来看看DotA2的人工智能程序,到底解决了一个多困难的问题?尤其是与AlphaGo相比。
1v1不能与5v5相提并论 在正常的DotA2游戏中,两个对抗的队伍各由五名玩家组成。游戏过程中需要高级策略、团队沟通和协调,一局比赛通常要45分钟。 而这次人工智能击败人类的比赛,采用了1v1的模式,这种模式有太多限制。例如双方基本上只能沿着单线前进,并尝试击杀对方,游戏过程几分钟就结束了。 在1v1模式中,击败对手主要靠机械技能和短期策略,并不涉及长期规划和协调,而后者才是对当前AI技术来说最具挑战性的部分。 事实上,在这次的人机DotA2对抗中,可以采用的有效动作数量,少于围棋人机大战;有效的状态空间(目前局面情况),如果以智能的方式表示,应该比围棋要小。
AI可以获取更多信息 OpenAI的人工智能程序,极有可能是构建在DotA2原有的机器人接口之上,可以获取更多人类玩家看不到的信息。即使OpenAI的研究人员限制了这些信息的获取,人工智能仍然能够得到比人类更精准的信息。 例如技能的施放,人类玩家必须紧盯屏幕,并且估算与对手之间的距离。而AI知道确切的距离,并且能立即决定是否施放技能。获得精准的数字信息是一个很大的优势。其实对战过程中你就能看到,AI有几次攻击都是在最大距离上展开。
反应时间 AI可以立即作出反应,人类不行。再加上刚才说的信息优势,AI的优势进一步扩大了。比方,一旦对手逃离攻击范围,AI可以立刻取消攻击命令。
使用单一英雄 DotA2中有上百种不同的英雄角色,各具不同的能力和优势。而AI掌握的只是其中一个英雄:ShadowFiend(影魔)。影魔通常会立刻展开攻击,而不是在一段时间内学习掌握更复杂的攻击技能,这更加有利于发挥AI在信息和反应方面的优势。 所以,鉴于1v1主要比拼机械技能,AI击败人类玩家并不奇怪。鉴于游戏环境被严格限制,造成一些列战术和策略也被限制,而且对战中几乎没有必要进行长期规划或协调。
再次重申我的结论:这次AI击败DotA玩家,比在围棋中击败人类冠军要容易得多。人类没有在AI领域突然取得突破。
这次在DotA对抗中之所以AI获胜,是因为研究人员聪明的设置了问题,使得AI可以绕过目前人工智能的技术限制。
据说这个OpenAI训练这个AI打DotA花了2周。与之相比,AlphaGo在Google的GPU集群上进行了数月的分布式大规模训练。两个程序之间的计算要求有着数量级的区别。
好吧,最后夸夸这个会玩DotA的AI,到底有何精彩之处?
完全通过自学训练 AI不需要任何训练数据,也不会从人类的比赛中学习。整个学习过程随机开始,并且通过和自己对抗进行学习。虽然这不是什么新技术,但令人惊讶的是,AI学会了人类玩家已经在使用的技术。这很酷。 AI可能还有其他技术,甚至人类都不知道。这与我们在AlphaGo中看到的类似,围棋选手已经开始学习AI的下棋方式。
AI+电竞的重要一步 在具有挑战性的环境中(例如DotA2和星际2)来测试AI技术是非常重要的。AI可以为游戏提供更多的价值,游戏也会助推AI更快发展。
不完美信息 在DotA对决中,人类玩家智能看到地图的一小部分,视线受到妨碍。AI可能也一样,虽然还不清楚OpenAI如何处理这个问题的细节。 这意味着与围棋、国际象棋、Atari游戏机等环境不同,AI在DotA中处于一个部分可观察的环境,而无法获知关于游戏当前状态的完整信息。这类问题通常难以解决,话虽如此,但目前还不清楚1v1的DotA2比赛中,视野的重要性到底几何。
不管怎样,非常期待看到OpenAI关于这次比赛的技术报告。舜网-济南时报
舜网-济南日报
中国青年网
美媒称,算上网上购票,吴京的《战狼2》在14天中的总票房达到5.939亿美元(1美元约合人民币6.7元——本网注),这部影片本周几乎必定会成为史上在单一地区最卖座的影片之一。最近AI圈发生了两件大事。第一件是DeepMind、Facebook等AI巨头对《》研究兴趣浓厚,公开发布研究工具和数据;第二件是Open&AI的机器人在比赛中战胜了人类顶级职业玩家。至此,继横扫人类国际象棋大师和围棋大师后,人工智能如今又将风靡全球的电子竞技游戏Dota2攻陷。可以预见,在很短的将来,万众瞩目的《》顶级玩家,也会被人工智能打败。DeepMind等公司已经在《星际争霸》上研究了一段时间,但目前为止,根据前不久刚刚发布的最新进展,相关研究还没有取得重大突破。倒是OpenAI公司打败DOTA人类顶级职业玩家,率先取得令人兴奋的成就,一跃成为AI圈中的热点。回顾赛事,OpenAI公司的机器人表现可以说是非常“强悍”,出手“快”、“准”、“狠”,手法娴熟,不仅会卡兵、补刀,还会取消掉技能抬手,而且具有强烈的攻击性,连续两局狂虐Dendi。OpenAI的工程师表示,他们对机器人训练了2周,就获得了足以击败全球最佳Dota&2专业玩家的能力。伊隆·马斯克看了战况之后,抑制不住内心激动,在推特上公开宣称:OpenAI搞出了史上首个击败电子竞技顶级玩家的人工智能。这比搞国际象棋和围棋什么的复杂多了。这次打败DOTA人类选手比赛的难度究竟有多大?虽然OpenAI公司没有公布更多细节,不过,我们可以根据已有的信息进行客观评价。1、属于多人在线战术竞技游戏(MOBA)中的单人模式。这次是在中路进行影魔的SOLO对决,属于1V1遭遇战模式,需要战争迷雾隐藏的信息较少,与5V5模式在难度上还有较大差距。正常的DOTA&2游戏中,2支对抗队伍各由5名玩家组成,游戏过程中需要随时调整作战策略、需要大量的团队沟通和协调,任意一名玩家都可以随时根据战况,召唤其他队友组织支援、抓捕或埋伏,突发情况多、对抗较为激烈,相互配合和节奏的把握非常重要,比赛时长通常要45分钟。在1v1模式中,击败对手主要靠机械技能和短期策略,并不涉及长期规划和协调,而后者才是对当前AI技术来说最具挑战性的部分。因此,OpenAI计划在明年推出可以进行5V5协同作战的更高智能的机器人。2、相比围棋,DOTA对战中机器人的反应时间占据优势。AlphaGo和柯洁对战时,双方时间都是3小时,时间的增加,有利于人类棋手发挥。实际上,时间长短对于AlphaGo来说并不重要,因为它每一步棋的决策时间最多只需10秒。这次DOTA对战则不同,人类选手直面机器人,需要几乎在一瞬间大致估计出与对手之间的距离,是否进行攻击、是否值得背水一战,再通过神经系统发出信号控制双手操纵鼠标和键盘,这一连串的动作需要耗费大量时间。OpenAI机器人可以获得精准的对手位置、技能冷却时间信息,并迅速计算出准确的攻击时间节点,确保将对手一击致命。仔细观察对战过程,你可以看到,机器人有几次攻击都是在最大距离上展开,最后在短短10分钟赢得对战。为何马斯克对机器人的这次成功这么看重?“自我对局”(Self-play)的理念是OpenAI研发的关键。OpenAI的机器人整个学习过程随机开始,并且通过和自己对抗进行学习。OpenAI的CTO&Greg&Brockman介绍,技术人员通过神经网络对机器人进行了数千次的自我对局进行训练。自我对局的参与人选择针对其对手的平均行为的最佳反应。因此,OpenAI研发的机器人,可以从完全的随机状态一步步发展到如今的世界顶级水平。虽然这并不是最新最前沿的理论,但令人的震惊的是,机器人学会了人类玩家已经在使用的技术,并吸收为自己所用,并用来打败人类玩家。谷歌公司开发的AlphaGo在打败了人类顶级选手李世石、柯洁之后,宣布永久退出围棋比赛。同样,OpenAI公司开发这样一个机器人,并不是为了打败DOTA人类职业玩家这么简单。自主学习游戏规则,通过自我对局进行训练,能够掌握复杂视频游戏的机器人可以有其他更广阔的用途。最直接的例子是,围棋选手已经开始学习AlphaGo机器人的下棋方式。同样,一些DOTA游戏玩家开始利用OpenAI公司机器人进行日常训练。智能机器人可以为游戏娱乐产业提供更多价值,游戏娱乐也会助推人工智能技术快速发展。AI公司的目标:建立更加通用的智能系统显然,OpenAI公司的雄心不止于此,“我们所建立的是一个普遍的学习系统,尽管它在很多方面仍然受到限制,但它仍然能击败最优秀的人类专家,”Brockman说,“这是朝着向建立更通用的系统迈出的关键一步,它可以学习真正复杂的、重要的现实世界里的任务,比如做一名外科医生。”不仅在电子竞技、医疗领域,OpenAI公司的这项技术在家政服务机器人领域和军用机器人领域可能会发挥更大的价值。最近人民网报道,有网友买扫地机器人后泪崩,仿佛买了一个智障,肆意展示各种蠢萌技能:扫地2年了,每天都会在在盥洗室地毯上被卡住,在沙发拐角上被卡住,在各种意想不到的角度上被卡住,和各种桌子腿过不去。目前在售的这类扫地机器人有一个救命技能,被卡住了就发求救信号,让人把它搬出来,感觉它的主业不是打扫卫生,而是负责搞笑卖萌。可以预见,采用“自我对局”(Self-play)理念来提升扫地机器人的学习能力,可以在随机探索整个室内环境的过程中,通过和自己、和家庭环境进行对抗学习,不断提升对整体环境的感知应对能力,最终达到人类保洁水平。进行更大强度的训练,甚至可以成为一个顶级的家庭卫生保洁员,避免因为被卡住频频向人类求助的窘迫,成为真正意义上的智能家居产品。在军用领域,“自我对局”(Self-play)的设计理念同样大有可为。2015年9月,美国海军陆战队开始测试谷歌旗下机器人公司波士顿动力开发出的新一代机械狗Spot,而这款机械狗的“前辈”BigDog早就在2014年在夏威夷投入使用了。这只机器狗只是被看成是可以执行侦察和搜索任务军犬的替代品。准确来说,这不仅仅是一条军犬,进行深度改造后,可以变为一个可以在战区和灾区提供导航,执行搜索任务,排查建筑物危险,装备上武器就可以作战的超级士兵。同样是激烈的对战环境,在DOTA2中可以迅速准确评估战况、动作灵活、攻击性强的OpenAI公司机器人给我们展示了其强大的学习、超越能力,借鉴和改进机器人背后的通用学习系统,用来提升军用机器人的学习能力、侦查作战能力,对于保存军队有生力量具有重要意义。创办特斯拉公司大获成功的硅谷奇才伊隆·马斯克,可能正是看中了这项技术蕴含的潜在巨大商业价值而兴奋不已。【钛媒体作者:智能相对论(id:aixdlun)】
您可能感兴趣:
摄影手机硬件笔电平板
最新科技资讯下载ZOL APP}

我要回帖

更多关于 机器人打败老师 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信