cs人机对战战是不是一天只可以搞一次

以前我有一个朋友,谈论什么都谈论得头头是道,我非常惊奇,他为什么几乎无所不知?为什么可以无所不评?&br&&br&直到有一天他告诉我说:&评论有什么难的?你要评论什么东西,一定先说他的不好,这样才能衬托你的高明,拿吉他指弹来说,弹得快技巧丰富的,你就说他节奏不够稳定或者说他囿于技巧之中,太过旖旎,弹得慢的,你就说他技巧吸收不够充分。&br&&br&评论书籍,如果是文学小说的话,你就说,文字虽好但是未免落入俗套,如果是学术著作,你就说里面的内容虽然旁征博引,但未必经得起推敲。&br&评论画作,那就更简单了,你可以把别人觉得不好看的说是充满神来之笔的灵感,把别人觉得好看的说他用色未免略微庸俗。记住,不管评论什么东西,都略略缀上一些不足,这样才能显得你无所不知又十分高明。&&br&&br&&br&&那如果当真是神之一手,举世无双呢?&&br&&br&&br&&br&他沉吟半晌。&br&&br&&br&&br&&那,就说他缺乏美感。&
以前我有一个朋友,谈论什么都谈论得头头是道,我非常惊奇,他为什么几乎无所不知?为什么可以无所不评? 直到有一天他告诉我说:"评论有什么难的?你要评论什么东西,一定先说他的不好,这样才能衬托你的高明,拿吉他指弹来说,弹得快技巧丰富的,你就说他…
&b&说句题外话,今天再一次被某些媒体人不要脸的吃相恶心到了。&/b&&br&&br&已经51胜的Master同陈耀烨九段 (感谢&a data-hash=&11f0fc6c51ed768a3660& href=&///people/11f0fc6c51ed768a3660& class=&member_mention& data-hovercard=&p$b$11f0fc6c51ed768a3660&&@半目之殇&/a&的指正) 的对局中,行至第7手后,由于陈耀烨掉线30秒内未落子,系统判定和棋。&br&&figure&&img src=&/v2-08ac479abec34b693dc167_b.jpg& data-rawwidth=&440& data-rawheight=&436& class=&origin_image zh-lightbox-thumb& width=&440& data-original=&/v2-08ac479abec34b693dc167_r.jpg&&&/figure&&br&这本来是一件十分遗憾的意外事件,尤其是陈耀烨苦苦等了这么久,最终竟然以这种方式结束对局,心中郁闷可想而知。&br&&br&&b&但到了某些媒体人眼中,这居然成了一件可以刺激大众G点的噱头,有些媒体把自己的底线和棋手的尊严踩到脚底,然后毫无廉耻搬用春秋笔法误导大众。&/b&&br&&figure&&img src=&/v2-839df79cbd3ffebd57cc68_b.png& data-rawwidth=&690& data-rawheight=&247& class=&origin_image zh-lightbox-thumb& width=&690& data-original=&/v2-839df79cbd3ffebd57cc68_r.png&&&/figure&&figure&&img src=&/v2-55b28ba026dfb68c8be8e50_b.png& data-rawwidth=&688& data-rawheight=&352& class=&origin_image zh-lightbox-thumb& width=&688& data-original=&/v2-55b28ba026dfb68c8be8e50_r.png&&&/figure&&figure&&img src=&/v2-cabebfedefe0b696bfdec_b.png& data-rawwidth=&689& data-rawheight=&347& class=&origin_image zh-lightbox-thumb& width=&689& data-original=&/v2-cabebfedefe0b696bfdec_r.png&&&/figure&&br&&b&简直是字字诛心,尤其是“利用”二字,将节奏带的飞起。&/b&&br&&br&于是点开评论,十有八九都是网友的跟风调侃,在他们的推波助澜下,居然真的有人信以为真,以为陈耀烨九段真的有意采取了如此下三滥不入流的方式。&br&&br&&figure&&img src=&/v2-9d3700addc21de9b0280bd1_b.png& data-rawwidth=&577& data-rawheight=&60& class=&origin_image zh-lightbox-thumb& width=&577& data-original=&/v2-9d3700addc21de9b0280bd1_r.png&&&/figure&&figure&&img src=&/v2-b4761bb4bedc73acbd2c53fe3efa5872_b.png& data-rawwidth=&567& data-rawheight=&119& class=&origin_image zh-lightbox-thumb& width=&567& data-original=&/v2-b4761bb4bedc73acbd2c53fe3efa5872_r.png&&&/figure&&figure&&img src=&/v2-3aac0d93ce_b.png& data-rawwidth=&579& data-rawheight=&63& class=&origin_image zh-lightbox-thumb& width=&579& data-original=&/v2-3aac0d93ce_r.png&&&/figure&&figure&&img src=&/v2-2d4c1b9c1d3e8eafc859fb2956f94def_b.png& data-rawwidth=&577& data-rawheight=&55& class=&origin_image zh-lightbox-thumb& width=&577& data-original=&/v2-2d4c1b9c1d3e8eafc859fb2956f94def_r.png&&&/figure&&br&&b&陈耀烨是谁?曾经最年轻的九段(&/b& 感谢&a data-hash=&faf854ca5& href=&///people/faf854ca5& class=&member_mention& data-hovercard=&p$b$faf854ca5&&@宛丘&/a&指正 &b&),国内连续8年蝉联天元,获得过两次世界大赛的冠军(决赛对手分别是李世乭和柯洁)。&/b&&br&&br&这么一个世界冠军,难道他不想真刀真枪和Master对决一次?&br&&br&无数职业棋手为之热爱、奋斗、奉献终身的围棋正历经千年来前所未有变局时刻,所有棋手都希望成为其中的见证者、亲历者和有尊严的缔造者。无一不是在震惊中抱着“朝闻道夕死可矣”的觉悟积极求战。所以才会有李世石在同AlphaGo对局中憋得脸颊通红,才会有柯洁输给Master后彻夜未眠,才会有一众职业选手齐聚网棋排着队等待对局。&br&&br&他们不知道Master实力逆天么?他们不知道Master连战连胜么?他们不知道胜机渺茫么?那他们为什么还要前仆后继只求一战?&br&&br&这其中道理很简单,有些人却永远都不会懂,我只想跟这些人说一句:&br&&br&&b&不要因为你们没有节操,就觉得全世界的人都不要脸。&/b&
说句题外话,今天再一次被某些媒体人不要脸的吃相恶心到了。 已经51胜的Master同陈耀烨九段 (感谢的指正) 的对局中,行至第7手后,由于陈耀烨掉线30秒内未落子,系统判定和棋。 这本来是一件十分遗憾的意外事件,尤其是陈耀烨苦苦等了这么久,最…
先直接回答这个问题,下面再分析AlphaGo和人工智能的未来。我认为AlphaGo这次的比赛打败李世乭比较悬,但是1-2年之内必然完胜人类。&br&&ol&&li&&b&按照两者的Elo(围棋等级分),可以算出去年年底的AlphaGo打败李世乭的概率相当低。&/b&如何算出的呢?AlphaGo去年年底的顶级分布式版本的Elo是3168(见下面第一张图),而李世乭的Elo大约是3532(全球围棋手Elo: &a href=&///?target=http%3A//www.goratings.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Go Ratings&i class=&icon-external&&&/i&&/a& ,见下面第二张图)。&br&&figure&&img src=&/fc27792ef9ccd3d05520_b.png& data-rawwidth=&350& data-rawheight=&374& class=&content_image& width=&350&&&/figure&&figure&&img src=&/bef51010f1adce3ef3d6ef6_b.png& data-rawwidth=&347& data-rawheight=&229& class=&content_image& width=&347&&&/figure&&br&按照这两个等级分的两个棋手对弈,李世乭每盘的胜算为89%(&img src=&///equation?tex=%5Cfrac%7B1%7D%7B%281%2B10%5E%7B%28%2%29%2F400%29%29%7D+%29%7D+& alt=&\frac{1}{(1+10^{(()/400))} )} & eeimg=&1&&,公式见:&a href=&///?target=https%3A///r/chess/comments/2y6ezm/how_to_guide_converting_elo_differences_to/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&How to Guide: Converting Elo Differences To Winning Probabilities : chess&i class=&icon-external&&&/i&&/a&)。如果对弈一盘,AlphaGo尚有11%的获胜的可能性,而整个比赛五盘胜出三盘或更多,AlphaGo就只有1.1%的可能性了。(当然,这是几个月前的AlphaGo,也许今天已经超越了:见下面第三点)。&br&&/li&&li&&b&AlphaGo不是打败了欧洲冠军吗?有些&/b&人认为AlphaGo去年底击败了欧洲冠军樊麾,所以挑战(前)世界冠军应有希望。但是,樊麾只是职业二段(Elo 3000左右),而李世乭是职业九段(ELO 3532)。这两位的差别是巨大的,完全不能混为一谈。就比如说一个人乒乓球打败了非洲冠军,并不代表他就可以成功挑战中国冠军。&br&&/li&&li&&b&AlphaGo有可能在这几个月突飞猛进,进而击败李世乭吗?&/b&AlphaGo的负责人说:”外界不知道我们这几个月进步了非常多“。(来自:&a href=&///?target=http%3A///2016/alphago-lee-sedol-whos-underdog-in-google-ai-million-go-match/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Odds favor machine over human in big Go showdown&i class=&icon-external&&&/i&&/a& )。这点确实有可能。AlphaGo进步的方法有两个:(1)增加硬件:我们从Nature的文章可以看到:从1202个CPU到1920个CPU,AlphaGo的ELO只增加了28,而且线性地增加CPU,不会看到线性的ELO成长。若要达到364 ELO积分的提升,需要的CPU将达到天文数字(有篇文章估计至少要10万个CPU:&a href=&///?target=http%3A///blog-posts/alphago-and-ai-progress& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&AlphaGo and AI Progress&i class=&icon-external&&&/i&&/a&)。当然,谷歌有钱有机器,但是纯粹加机器将会碰到并行计算互相协调的瓶颈(就是说假设有十万万台机器,它们的总计算能力很强,但是彼此的协调将成为瓶颈)。在几个月之内增加两个数量级的CPU并调节算法,降低瓶颈,应该不容易。(2)增加学习功能:AlphaGo有两种学习功能,第一种是根据高手棋谱的学习,第二种是自我对弈,自我学习。前者已经使用了16万次高手比赛,而后者也在巨大机组上训练了8天。这方面肯定会有进步,但是要超越世界冠军可能不容易。最后,换一种分析方式:如果从过去深蓝击败世界冠军的“成长过程”来看,深蓝大约1993年达到职业大师水平,4年后才在一场六盘的比赛中击败世界冠军(大约500Elo积分点的提升)。今天的AlphaGo应该和1993年的深蓝相似,刚进入职业大师水平。若要击败世界冠军,虽然未必需要4年的时间,但是几个月似乎不够。&/li&&li&&b&还有什么以上未考虑的因素,导致AlphaGo获胜吗?&/b&如果谷歌刻意未出全力和樊麾对抗,或者有其它学习或并行计算方面超越了Nature里面的描述,那AlphaGo完全有可能获胜。&/li&&/ol&既然写了这么多,就对这个题目再发表一些看法:&br&&ol&&li&&b&AlphaGo 是什么?&/b&在今年一月的Nature (&a href=&///?target=http%3A///nature/journal/v529/n7587/full/nature16961.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/nature/journ&/span&&span class=&invisible&&al/v529/n7587/full/nature16961.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& )有AlphaGo的详细介绍,AlphaGo是一套为了围棋优化的设计周密的深度学习引擎,使用了神经网路加上MCTS (Monte Carlo tree search),并且用上了巨大的谷歌云计算资源,结合CPU+GPU,加上从高手棋谱和自我学习的功能。这套系统比以前的围棋系统提高了接近1000分的Elo,从业余5段提升到可以击败职业2段的水平,超越了前人对围棋领域的预测,更达到了人工智能领域的重大里程碑。&/li&&li&&b&AlphaGo 是科学的创新突破吗?&/b&AlphaGo是一套设计精密的卓越工程,也达到了历史性的业界里程碑,不过Nature文章中并没有新的“发明”,AlphaGo的特点在于:不同机器学习技术的整合(例如:reinforcement learning, deep neural network, policy+value network, MCTS的整合可谓创新)、棋谱学习和自我学习的整合、相对非常可扩张的architecture(让其充分利用谷歌的计算资源)、CPU+GPU并行发挥优势的整合。这套“工程”不但有世界顶级的机器学习技术,也有非常高效的代码,并且充分发挥了谷歌世界最宏伟的计算资源(不仅仅是比赛使用,训练AlphaGo时也同样关键)。&br&AlphaGo的跳跃式成长来自几个因素:1)15-20名世界顶级的计算机科学家和机器学习专家(这是围棋领域从未有的豪华团队:也许你觉得这不算什么,但是要考虑到这类专家的稀缺性),2)前面一点提到的技术、创新、整合和优化。3)全世界最浩大的谷歌后台计算平台,供给团队使用,4)整合CPU+GPU的计算能力。&/li&&li&&b&AlphaGo是个通用的大脑,可以用在任何领域吗?&/b&AlphaGo里面的深度学习、神经网络、MCTS,和AlphaGo的扩张能力计算能力都是通用的技术。AlphaGo的成功也验证了这些技术的可扩展性。但是,AlphaGo其实做了相当多的围棋领域的优化;除了上述的系统调整整合之外,里面甚至还有人工设定和调节的一些参数。AlphaGo的团队在Nature上也说:AlphaGo不是完全自我对弈end-to-end的学习(如之前同一个团队做Atari AI,用end-to-end,没有任何人工干预学习打电动游戏)。如果AlphaGo今天要进入一个新的应用领域,用AlphaGo的底层技术和AlphaGo的团队,应该可以更快更有效地开发出解决方案。这也就是AlphaGo真正优于深蓝的地方。但是上述的开发也要相当的时间,并且要世界上非常稀缺的深度计算科学家(现在年待遇行情已达250万美金)。所以,AlphaGo还不能算是一个通用技术平台,不是一个工程师可以经过调动API可以使用的,而且还距离比较远。&/li&&li&&b&如果这次AlphaGo没有打败&/b&&b&李世乭,那还要多久呢?&/b&IBM深蓝从进入大师级别到比赛击败世界冠军花了四年。AlphaGo应该会比深蓝更快提升自己,因为深蓝需要新版本的硬件,和针对Kasparov的人工调节优化,而AlphaGo是基于谷歌的硬件计算平台,和相对通用的深度学习算法。所以,几个月太短,4年太长,就预计1-2年之间吧。&br&&/li&&li&&b&从国际象棋到围棋,到底是不是巨大的突破呢?&/b&肯定是的,在这篇文章里面(&a href=&/question/& class=&internal&&在国际象棋领域,电脑已经可以战胜人脑,那么围棋领域电脑还差多远? - 计算机&/a& ),第一位回答者分析了围棋的复杂度为&img src=&///equation?tex=10%5E%7B172%7D+& alt=&10^{172} & eeimg=&1&& 而国际象棋则只有&img src=&///equation?tex=10%5E%7B46%7D+& alt=&10^{46} & eeimg=&1&& 。在1997年深蓝击败世界冠军时,大家都认为:深蓝使用的是人工调整的评估函数,而且是用特殊设计的硬件和”暴力“的搜索 (brute-force) 地征服了国际象棋级别的复杂度,但是围棋是不能靠穷举的,因为它的搜索太广(每步的选择有几百而非几十)也太深(一盘棋有几百步而非几十步)。而AlphaGo的发展让我们看到了,过去二十年的发展,机器学习+并行计算+海量数据是可以克服这些数字上的挑战的,至少足以超越最顶尖的人类。&/li&&li&&b&AlphaGo 若打败了世界冠军,就意味着计算机超越人脑?或者可以思考了吗?我的回答:&/b&&/li&&/ol&&ul&&li&在可以凭逻辑分析推算的问题上,机器即将远远把人类抛在后面。机器速度会越来越快,学习能力会越来越强,数据会越来越多。当年,大家讨论“国际象棋输给机器不算什么,围棋才是真正的智慧”只是我们人类维护自己尊严但是不实际的幻想!今天,我们该面对现实了!&/li&&li&在大数据+机器学习+大规模并行计算的时代,我们将看到无数的商机和产品,能够在预测、分析、推荐等方面,产生巨大的商业和用户价值。不过,这些解决方案和人类相比,其实没有什么意义,因为人差太远了(比如说:推荐引擎将能推荐你最可能会买的产品、想吃的菜,想认识的人;自动交易能得到更高的投资回报和风险比例。。。)。&/li&&li&在感知方面,人类也将会被机器超越。今天的语音识别,人脸识别,未来的自动驾驶,都是例子。&/li&&li&但是,以上都还是冷冰冰的技术,机器打败了世界冠军也没有感到高兴(甚至说不出为什么)。对于那些科幻片的粉丝们:机器人是否会人性化?这还是未知的。毕竟,在情感、喜怒哀乐、七情六欲、人文艺术、美和爱、价值观等方面,机器离人还差的很远,甚至连基础都没有。对人工智能的研究者,这是下一个挑战。对我们人类,在下个突破之前,我们还是多发展右脑吧!&/li&&/ul&P.S. - 也许有人好奇,为什么这个话题我说了这么多,因为在1986年,我在读书时,曾经开发了一套黑白棋系统(复杂度&img src=&///equation?tex=10%5E%7B28%7D+& alt=&10^{28} & eeimg=&1&&),击败了黑白棋的世界团体冠军,而当年的那套系统也有(非常粗浅的)自我学习的能力。有兴趣的网友可以在这里看到我当年的文章:&a href=&///?target=http%3A///science/article/pii/0768& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&A pattern classification approach to evaluation function learning&i class=&icon-external&&&/i&&/a& ) 。
先直接回答这个问题,下面再分析AlphaGo和人工智能的未来。我认为AlphaGo这次的比赛打败李世乭比较悬,但是1-2年之内必然完胜人类。 按照两者的Elo(围棋等级分),可以算出去年年底的AlphaGo打败李世乭的概率相当低。如何算出的呢?AlphaGo去年年底的顶级…
&p&嗯。。给大家介绍一位清华基科班的前辈: &/p&&blockquote&曾蓓是清华第一届数理基科班学生,也是第三届十杰中唯一的一位本科生。曾蓓出生于国际象棋世家,但直到8岁她的父亲才同意正式教她,13岁拿到了全国少年组冠军,14岁拿到世界少年赛季军,15岁入选国家青少年集训队,16岁夺得全国棋协大师赛冠军,17岁获得全国青年赛季军。1998年,她被清华大学体育代表队特招,事实上,当年高考她裸分650。这位曾被教练评价为“专业下棋、业余读书”的国际象棋大师进入清华后不仅进入了基础科学班,而且在大二时名列班级的第一名。&br&曾蓓曾是第八届研究生学术新秀得主,更是清华大学特等奖学金历史上少有的“双料”得主:即本科生阶段和研究生阶段都获得特等奖学金,她也是清华历史上同时获得这两项荣誉的三位女生之一。&br&硕士研究生毕业后,曾蓓赴麻省理工学院攻读物理学博士并于2009年获得学位。2010年曾蓓成为加拿大滑铁卢大学量子计算研究所的研究员和圭尔夫大学助理教授,当属华人物理学界的后起之秀。&/blockquote&&p&她现在的研究方向之一是量子信息。。换句话说今后造出来量子计算机有她一份功劳。&/p&&p&以及她曾在去年 alphago 对战李世石前夕表示过,放弃国际象棋转投物理的一个原因是看到国际象棋的 AI 有多厉害。。&/p&&br&&p&-------&/p&&p&大家谬赞。就想着夹杂一点私货。&/p&&p&(为避免误伤,不知道知乎劝退党是什么情况的朋友,就别看下面这段了)&/p&&p&知乎上的某一群劝退党真是越来越low了。柯洁转行做AI?给你们看个转行的例子就是告诉你们说,人家就是要转行,也不可能是你们整天喊的CS好找工作大法好。这类人的水平,下棋的时候是在挑战人类的智力极限,转行了也一样是。哪像你们,坐井观天,觉得所有人理应追着热点抢风口的那点儿虚名浮利。&/p&
嗯。。给大家介绍一位清华基科班的前辈: 曾蓓是清华第一届数理基科班学生,也是第三届十杰中唯一的一位本科生。曾蓓出生于国际象棋世家,但直到8岁她的父亲才同意正式教她,13岁拿到了全国少年组冠军,14岁拿到世界少年赛季军,15岁入选国家青少年集训队,…
&p&这是精彩的对局,也是人类的伟大胜利!&/p&&br&&p&-&/p&&p&大家都已经知道,第一盘人类和AlphaGo对形势判断的出入,是因为AlphaGo已经算清了右边的手段,所以提前在其他局部用亏损手段缩小棋盘、简明定型以扩大胜率,是人类低估了AlphaGo;&/p&&br&&p&看过了第二盘,大家也知道AlphaGo在前半盘也会凭借强大的大局观走出妙手,同时也会出现疑问手,而后半盘则全部是AlphaGo强大计算力的天下;&/p&&br&&p&看了第三盘,所有人都是绝望的,李世石在第15手就因急躁冒进导致形势落后,然后AlphaGo用朴实无华的手法步步挺近,将李世石彻底碾压,后半盘李世石虽然找回了自己拼命在白棋空中出了棋,AlphaGo的下法也疑似出错,但毕竟优势太大,李世石仍然无力回天。&/p&&br&&p&看过前三盘,还要再质疑AlphaGo的实力的人,恐怕就有点太不实事求是了。&/p&&p&顶尖高手们对AlphaGo棋力的判断已经普遍为:超越了所有的人类。&/p&&br&&p&大家都绝望的认为,一盘比一盘强的AlphaGo将不会再给李世石机会,大家只是感情上希望这位勇敢的胜负师赢下一盘,留住一点自己的尊严。&/p&&br&&p&-&/p&&p&今天的第四盘,李世石在前半盘的下法似乎完全不合自己的棋风,AlphaGo的黑棋过分的将白棋的头压了过去,李世石居然不断,忍了...忍了!&/p&&p&右边,AlphaGo居然用同样的手法又将李世石的头压了下去,李世石居然又忍了!&/p&&br&&p&以李世石性格和棋风之凶悍,简直不敢想象。&/p&&p&很多人都觉得他的心态仍然没有调整过来,很可能还会轻易的输掉。&/p&&br&&p&中盘出现了巨大的转换,李世石用上边和AlphaGo的右边交换,双方都气势如虹(虽然AlphaGo应该没有“气势”),一部分人认为李世石形势还可以,一部分人认为AlphaGo有利,但似乎没有人认为李世石形势有利。&/p&&p&按照AlphaGo的下法,它应该也判断此时自己的胜率超过50%。&/p&&br&&p&就当此时......&/p&&p&李世石祭出了惊天妙手!&/p&&figure&&img src=&/7bf7f44b7a4ff7d04ea8100_b.png& data-rawwidth=&500& data-rawheight=&500& class=&origin_image zh-lightbox-thumb& width=&500& data-original=&/7bf7f44b7a4ff7d04ea8100_r.png&&&/figure&&p&白78挖!这将会是被写入史册的妙手!&/p&&br&&p&如果李世石是早就算到了这一手,判断黑空中有棋,所以才进行的转换,那么这种表现就和AlphaGo第一盘中的表现一样。&/p&&br&&p&看到了这一手,真的觉得输了也值了。&/p&&p&这完全体现了人类巅峰的直觉、创造力和计算力!&/p&&br&&p&古力此时说:“如果这盘棋能赢,就是千古名局。”&/p&&br&&p&看到这样的李世石,所有的阴谋论以及质疑李世石的声音,都可以休矣。&/p&&p&这样的李世石,已经找回了自己,完全体现了人类巅峰的实力。&/p&&p&如果这样都赢不了,那只能说明对手过于强大,人类需要继续努力,并向电脑学习。&/p&&br&&p&接下来,AlphaGo居然下出了一系列莫名其妙的下法,亏了一大把,不知道是不是因为bug,希望赛后能获知AlphaGo团队发布的更多相关信息。&/p&&p&有鉴于第一盘的情况,很多人都非常的谨慎,等待着接下来的进程,看看AlphaGo是不是有和第一盘一样的,大家都没有看到的暗藏手段。&/p&&br&&p&可随着棋局的进程,白棋离终点越来越近,终于拿下了此局。&/p&&p&在直播间的我们,都激动的快要说不出话来了。&/p&&br&&p&-&/p&&p&赛前有人认为,AlphaGo的进步速度很快,李世石能取得一胜就是人类的伟大胜利。&/p&&p&当时大部分人,包括我,都认为这种预测太激进了,AlphaGo的进步应该不会这么快到这种程度,人类怎么也能再支撑一两年。&/p&&br&&p&但事实证明,那些人的判断是对的。&/p&&p&这盘棋,体现了人类顶峰的实力,面对如此强大的对手,下出了如此惊艳的妙手,赢下了如此艰难的比赛,正是人类伟大的胜利!&/p&&br&&p&我昨晚看到李世石走出赛场的神情,对他感到分外惋惜,发了这样一条朋友圈:&figure&&img src=&/b7bffecc17e46665cbc65b77ca0735dc_b.jpg& data-rawwidth=&440& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&440& data-original=&/b7bffecc17e46665cbc65b77ca0735dc_r.jpg&&&/figure&&/p&&br&&p&-&/p&&p&而现在,相信所有人都和我一样,为这位伟大的胜负师感到高兴。&/p&&p&也感谢AlphaGo团队,创造出了如此强劲的人工智能程序,激发出了人类的巅峰式强大。&/p&&br&&p&我现在,倍加期待最后一日的对局。&/p&&p&也更期待未来的发展,无论是人工智能,还是围棋。&/p&&br&&p&-&/p&&p&向伟大的胜负师——李世石致敬!&/p&&br&&br&&br&&br&&p&-&/p&
这是精彩的对局,也是人类的伟大胜利! -大家都已经知道,第一盘人类和AlphaGo对形势判断的出入,是因为AlphaGo已经算清了右边的手段,所以提前在其他局部用亏损手段缩小棋盘、简明定型以扩大胜率,是人类低估了AlphaGo; 看过了第二盘,大家也知道AlphaGo…
AlphaGo即便没有战胜李世石,我最担心的依然是一群人出来宣扬人工智能威胁论。不止这问题,大多数AlphaGo相关问题下的答案都是重灾区。&br&&br&一群人连AlphaGo的基本算法都不懂,讲个machine learning基本概念都一脸懵逼,把自己的脑洞当真知灼见指点人工智能发展方向,还代表全人类觉得AI要统治人类。科普根本不愿听,反复说各种“你也不能确定”“谁也不知道未来”。呵呵。为啥崔永元反转基因招人烦?&br&&br&我今天不要友善度,不客气的说一句:所有看不懂AlphaGo那篇Nature论文而借AlphaGo大肆妄议人工智能的,都是垃圾。&br&&br&对,包括在各大直播平台上出来讲解的大多数IT圈人士和知乎某些自以为懂AI的大V。有多少水平有没有看过那篇Nature,不要以为大多数人都看不出来就可以胡扯。什么AlphaGo加了多少硬件智能指数增加这种蠢话,明明那篇nature的数据就已经说明了没有这回事。知道目前卷积神经网络最广泛用法是处理图像,就认为AlphaGo记忆棋盘图像然后像分析图像那样分析计算的,也真的是够蠢萌。还有看了AlphaGo前三盘表现或某些数据就认为这算法无懈可击,因为自己赛前猜李世石会完败所以自以为自己水平很高的,我很高兴李世石第四盘狂打你们的脸。&br&&br&好好去读那篇nature会死么?哦,不懂英文和里面的数学?去看介绍分析这篇nature的中文文章咯。还是看不懂?那还不承认自己无知。&br&&br&无知不可怕也不是错,可怕的是对自己的无知一无所知还到处宣扬谬误,然后带领着不明谬误的人一起开脑洞编织阴谋论。&br&&br&真的,以后不是AI统治人类,只是蠢人会被AI取代。&br&&br&&br&——————————&br&补充:&br&&br&实话说我写这篇答案时候刚跟人工智能威胁论支持者撕逼完,此问题当时也没多少人关注,所以主要是在发泄情绪,行文比较暴躁……几天得到这么多点赞和关注,实在是有点出乎意料,也觉得受之有愧。请大家还是主要关注以下干货。&br&&br&&a href=&/svjoke/& class=&internal&&人工智能打脸史 - 假装在硅谷 - 知乎专栏&/a&&br&以上引文中,扎克伯格已经打了霍金比尔盖茨马斯克脸了,计算机科学界泰斗斯图尔特o罗素驳斥了的奇葩奇点理论,还有摩尔定律已接近失效,2014年所谓“通过图里测试”也是大有争议,请不要再拿以上这些当论据来支持人工智能威胁论。&br&&br&另外还有该答案对奇点理论的吐槽:&a href=&/question//answer/& class=&internal&&为什么有很多名人让人们警惕人工智能? - 阿成的回答&/a&&br&&br&想看对AlphaGo那篇nature中文介绍的,请关注这个问题:&br&&a href=&/question/& class=&internal&&DeepMind 研发的围棋 AI AlphaGo 系统是如何下棋的?&/a&&br&其中几个高票答案写的都不错。真的,&b&看一篇干货比看十个所谓担忧人类被AI统治的答案有意义多了。&/b&&br&&br&还有这篇干货很赞:&a href=&///?target=http%3A//mp./s%3F__biz%3DMzIxNjE3MTM5OA%3D%3D%26mid%3Didx%3D1%26sn%3D98557fdc359a17af9ab6b1ed7e09854a%26scene%3D2%26srcid%3D0314rM6ivyxIaEMfKIaW167Z%26from%3Dtimeline%26isappinstalled%3D0%23wechat_redirect& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&一张图解AlphaGo原理及弱点&i class=&icon-external&&&/i&&/a& (微信公众号文章,电脑打开可能会有图片无法显示的情况。)&br&下图出自上文,版权属于作者 郑宇,张钧波,是我目前所见的对AlphaGo原理最清晰简明的中文解析。&br&&figure&&img src=&/94fcc2aab5_b.jpg& data-rawwidth=&636& data-rawheight=&713& class=&origin_image zh-lightbox-thumb& width=&636& data-original=&/94fcc2aab5_r.jpg&&&/figure&&br&至于理论上为什么实现强人工智能以及人类被AI奴役的可能性很小,推荐阅读楼下:&br&&a href=&/question//answer/& class=&internal&&AlphaGo 战胜李世石后,最让你害怕的是什么? - Goliath Li的回答&/a&&br&以及: &br&&a href=&/question//answer/?group_id=689664& class=&internal&&为什么人工智能领域的很多专家会认为「人工智能将对人类存亡造成威胁」是无稽之谈? - 李天宇的回答&/a&&br&&br&估计看懂Goliath Li回答里的理论部分对很多人有难度。看不懂没关系,我们确定该答案里这种理论上的严谨推理的靠谱程度远高于“你怎么敢确定……”“你怎么知道未来不会……”这种cheap的言论就行。&br&看完李天宇的答案,我相信大家更容易感觉到Machine Learning并不是什么人类不可控的玄学。我BF数学专业,经常跟我一起讨论学习Machine Learning,他说,目前大多数Machine Learning的算法数学理论难度不会超过数学系本科三年级。 &br&&br&转个machine learning界大牛Yann LeCun的意见:&br&&figure&&img src=&/7db_b.png& data-rawwidth=&487& data-rawheight=&336& class=&origin_image zh-lightbox-thumb& width=&487& data-original=&/7db_r.png&&&/figure&翻译:&br&Slashdot发表的关于AlphaGo胜利的声明:“ 现在我们知道了,我们不需要任何大的新突破就可以做出真正的AI了” &br&简直是完全绝对荒谬的错误。&br&就像我之前说过的:绝大多数人类和动物的学习方式是非监督学习。如果智能是个蛋糕,非监督学习才是蛋糕主体,监督学习只能说是蛋糕上的糖霜奶油,而强化学习只是蛋糕上点缀的樱桃。现在我们知道如何制作“糖霜奶油”和上面的“樱桃”, 但并不知道如何制作蛋糕主体。&br&我们必须先解决关于非监督学习的问题,才能开始考虑如何做出一个真正的AI。这还仅仅是我们所知的难题之一。更何况那些我们未知的难题呢?&br&&br&这里得给个注释,AlphaGo的算法里运用了监督学习和强化学习,几乎没有用非监督学习。其中监督学习里运用到了模仿人类神经网络和思维方式的“深度卷积神经网络”。而Yann LeCun是卷积神经网络的创始人之一。从这篇 &a href=&///?target=http%3A///p/533832.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&深度学习三十年创新路&i class=&icon-external&&&/i&&/a& , 也可以一窥Yann LeCun在机器学习界的地位。&br&&br&另外,&br&田渊栋老师专栏:&a href=&/yuandong& class=&internal&&远东轶事 - 知乎专栏&/a&
和南京大学周志华老师的微博: &a href=&///?target=http%3A///zhouzh2012%3Fis_all%3D1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&南大周志华的微博&i class=&icon-external&&&/i&&/a&&br&干货也不少,不过不都是科普,有些比较专业的讨论适合有机器学习基础的去看。&br&&br&————补充————&br&&a href=&///?target=https%3A///note//& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&人工智能三题&i class=&icon-external&&&/i&&/a&&br&这篇文章里提到的人工智能发展的三条途径非常有意思,对深度神经网络和自由意志的理解也值得借鉴。&br&&br&&br&&b&真心希望大家趁这个机会多了解一下人工智能,少听一点人工智能威胁论。&/b&&br&&br&&br&&b&**&/b&由于评论区实在太长,我不会再阅读回复评论。如果这个问题还有人关注点赞,我会把我最近看到的好的答案,文章和资源引用不断补充进来。
AlphaGo即便没有战胜李世石,我最担心的依然是一群人出来宣扬人工智能威胁论。不止这问题,大多数AlphaGo相关问题下的答案都是重灾区。 一群人连AlphaGo的基本算法都不懂,讲个machine learning基本概念都一脸懵逼,把自己的脑洞当真知灼见指点人工智能发展…
3月24日更新:评论里面不少人说游戏AI就是人工智能(artificial intelligence),那我来贴一段维基百科关于人工智能和游戏AI区别的一段话:&br&&br&…&AI& in the term &game AI& overstates its worth, as game AI is not about intelligence, and shares few of the objectives of the academic field of AI. Whereas &real& AI addresses fields of machine learning, decision making based on arbitrary data input, and even the ultimate goal of strong AI that can reason, &game AI& often consists of a half-dozen rules of thumb, or heuristics, that are just enough to give a good gameplay experience.&br&&br&带“AI”俩字就是人工智能了?那鱿鱼是鱼么?水银是银么?联合国是国么?傻瓜是瓜么?&br&&br&&br&------------------------------------------&br&&br&原答案:&br&&br&怎么会有人觉得英雄联盟这种游戏的计算量比围棋大…… 而且围棋是回合制,人类选手尚有思考的时间;如果是即时游戏,当你看到人工智能对手的一刹那,人家已经计算完几种干掉你的方案中哪种最合理了…… &br&&br&你能把对手技能cooldown时间精确到毫秒么?你能每次补刀成功么?你知道从地图上一点到另一点哪条路径是最近的么?你能精确算出英雄A在面对其他英雄时获胜几率多大么?你能做到没有失误操作没有无用操作么?最关键的,你能从比赛开始到结束,一直保持心情和体力没有变化么?然而,这些人工智能都能做到……&br&&br&在预判、操作、计算、风险评估都不如对手的情况下,完全没有赢的希望。你觉得你能赢,只是因为你平时面对的是游戏AI,而不是真正的人工智能。游戏AI只会在特定条件下触发特定操作,跟真正的人工智能差着十万八千里。&br&&br&别谈什么大局观了,开局十几分钟(甚至更短的时间)以后,你将面对一个等级、装备和操作都比你好的对手;别说是人工智能,就是个人类选手,你能赢么?&br&&br&什么?你跟我谈配合?谈默契?谈心有灵犀?少年,一个人工智能控制五个角色很难么?你觉得是你跟队友更默契,还是人工智能跟自己更默契?&br&&br&你说你战术牛逼?战术只不过是人类基于经验总结的方法。昨天AlphaGo走的几步棋,很多围棋大师都说人类选手根本不会这么走。但最后赢得还是人工智能——它所掌握的战术永远比你多。&br&&br&与围棋这种集成了人类几千年智慧精华的游戏相比,英雄联盟根本算不上智力游戏,大部分时间只是在比手速罢了。而比手速,不用我说你也知道人和AI谁更快吧?&br&&br&甚至可以说,不需要动用AlphaGo这样的大杀器,把游戏AI再优化一下,人类选手都不一定能赢。&br&&br&如果真开发出AlphaGo级别的人工智能参加英雄联盟比赛,我估计它的表情应该是——&br&&br&&figure&&img data-rawwidth=&284& data-rawheight=&282& src=&/673e25ab0bd_b.jpeg& class=&content_image& width=&284&&&/figure&
3月24日更新:评论里面不少人说游戏AI就是人工智能(artificial intelligence),那我来贴一段维基百科关于人工智能和游戏AI区别的一段话: …"AI" in the term "game AI" overstates its worth, as game AI is not about intelligence, and shares few of …
金立是连续10年中国围甲联赛主赞助商,即使公司遇到低谷也没放弃支持。&br&柯洁不是随便接代言的。&br&&br&围棋在中国一直很冷门的时候,金立竟能坚持这么多年,这个目的才有得问吧,据说理由也很简单,高层有人是棋迷。&br&&br&既然现在棋手柯洁通过强烈的个人风格获得了大量粉丝,就带来很多流量,那本来就一直关注围棋的金立签他,不是顺理成章么。&br&&br&要不是金立签了柯洁,不看比赛的路人们谁知道金立赞助国内围棋比赛这么久。&br&&br&--------------------&br&更新,之前只是随手一答,没想到这么多赞,比之前认真回答的都高,摊手。大家还是多去其他问题下赞高飞龙等真懂围棋的回答吧。&br&&br&原来喜欢围棋的高层是刘立荣先生,详情请搜索相关新闻。&br&&br&另外,金立支持围棋是一码事,产品受不受国人认可是另一码事。&br&&br&很多人也许觉得金立配不上围棋,然而这么多年,各位心目中,配得上围棋的那些品牌有几个关注过围棋?金立早期推广的时候,留下一些B格不高的印象,但起码不是伪劣产品罢,现在营销方式也与时俱进了。中国围棋和金立结缘没什么丢人的。
金立是连续10年中国围甲联赛主赞助商,即使公司遇到低谷也没放弃支持。 柯洁不是随便接代言的。 围棋在中国一直很冷门的时候,金立竟能坚持这么多年,这个目的才有得问吧,据说理由也很简单,高层有人是棋迷。 既然现在棋手柯洁通过强烈的个人风格获得了大…
&p&今天柯洁和阿法狗的惊心动魄的人机大战,是我第一次因为观看体育赛事感慨流泪。&/p&&p&柯洁的前一百手表现已经完美,根据谷歌团队的内部消息,柯洁和AlphaGo在右上角对弈的变化,双方达成了惊人的共识,即使AlphaGo坐到柯洁的位置上,人工智能也会选择与柯洁完全相同的应对。&/p&&p&谷歌团队感叹:柯洁的优秀,逼出了AlphaGo的极限。&/p&&p&如果这句评论不是虚言客套,那么柯洁前半盘的表现,是几乎将实力提升至与围棋上帝平下的格局。&/p&&p&然而棋局终于随着柯洁在左下角惊天大劫的计算中,算漏一枚劫材导致失误,中盘认输。棋局结束后,国家队队友鱼贯进入演播间与柯洁复盘,演播室的麦克风还没来得及关闭,里面传来了一句柯洁的“我算错了”。&/p&&p&在整盘完美的棋局下,人类终究不免出现一处细微的失手,并最终输掉。在英雄的奋力拼搏后,丝线从四周不断收紧,抚平一切挣扎,是一种莫大的无力感和渺小感。&/p&&p&天文学家和物理学家们面对阔大的宇宙,再回观自己手中的,仅仅为可怜的每秒30万公里的信息传播速度,也是同样的无力感和渺小感。&/p&&p&这种无力感和渺小感,在未来,在人与人工智能的一次次接触中,还会不断出现。&/p&&p&直到我们习以为常。&/p&&p&人类不完美,人类终要因为不免出现的一处细微错误最终落败,这一场棋赛,或许就是人类与AI相处中最终归宿的隐喻。&/p&&p&不过,如果是在科幻小说和电影里,按照编剧的鸡汤套路,人类总要赢得最后的胜利。在那个人类与人工智能终极一战的背景之下,面对AI的铁流毫无破绽绝对理性的层层推进,科幻小说还硬要为人类写出来的一个光明结局里,人类唯一的制胜的转机,也许就是从这一处细微的错误,发现了人作为人的终极意义——&/p&&p&不断的犯错试错,并自我完善。&/p&&p&从细菌进化到人类,也就是因为基因复制中会出现错误和突变。我们每一个人的基因库里,都是层层叠叠的错误堆积。&/p&&p&这些错误,绽放出意想之外的奇妙结果。&/p&&p&我们生物的进化,好比把这篇文章打印出来不断复印,每印一次就拿过去再不断转印。每一次印刷都会产生一些噪点,同一份文稿复印转印几十亿次后,有的印成了莎翁全集、有的印成了大不列颠百科全书、有的印成了畅销小说。当然,也有更多被淘汰的模糊文本,他们成为进化路径上的炮灰。很多年后,我们挖掘出他们的化石,思索他们灭绝的原因。&/p&&p&这种蠢笨的、浪费的、低效的、残酷的、会产生大量炮灰的转印,一直是我们的进化生存之道,是属于我们的独特生存哲学。可也正是在这条道路上,我们得到了比原件珍贵无数倍的作品。&/p&&p&我们总会遇到人类被AI全面超越的一天,我们今天都在见证历史。&/p&&p&但我们心里,也都可以为自己出现的那一丝细微错误,保留自己心里的一点骄傲。&/p&&p&今天的柯洁,在尝试到第二种作战风格后,已经逼出了AlphaGo的极限。希望两天后,他能突破这个极限。&/p&&p&the end&/p&
今天柯洁和阿法狗的惊心动魄的人机大战,是我第一次因为观看体育赛事感慨流泪。柯洁的前一百手表现已经完美,根据谷歌团队的内部消息,柯洁和AlphaGo在右上角对弈的变化,双方达成了惊人的共识,即使AlphaGo坐到柯洁的位置上,人工智能也会选择与柯洁完全相…
&p&谢邀。&/p&&br&&p&柯洁与AlphaGo三战,穷尽人力,虽败犹荣。&/p&&p&这类话就不多说了。&/p&&p&我倒觉得,&b&赢家是围棋和人类呢&/b&?&/p&&br&&p&二十年前,国际象棋人棋对决,卡斯帕罗夫输给深蓝。但当日,世界觉得,国际象棋电脑能赢,围棋却未必。这里其实是欺负个运算量:围棋纵横19路,理论上局面有2.0*10^170之多。国际象棋所有可能局面数:10^47。都是天文数字,但国际象棋可以暴力搜索,或曰硬算。围棋不行。&/p&&p&AlphaGo的算法,是蒙特卡洛树搜索与神经网络结合。看论文,Pπ、Pσ、Pρ负责当前局面、计算输出可能的走子选择和对应概率;然后Vθ进行价值判断。&/p&&p&我觉得人类所以无法搞定这玩意,是因为这里面有思考下一步着法的,有判断局面价值的,还能向后推断来确定自己的走法。&/p&&p&神经网络大概可以说是,模拟人类或者动物大脑,用若干个神经元共同计算,逼近某种复杂计算方法——我不知道是不是可以这么理解:&/p&&p&AlphaGo的设计,模拟了生物的神经网络方式,又加上了电脑自身的优势(人脑无法执行蒙特卡洛树搜索这种搞法吧……)。&/p&&p&如此,人类等于在面对一个对手:可以模拟接近生物思维,同时又有电脑价值判断时那种绝对理性。&/p&&br&&p&所以人类输了吗?未必啊。&/p&&p&人类制造过无数比自己牛的机器。论起飞高度,不及航天飞机。拳打脚踢,不如一颗子弹。珠算口算,不如大型计算机。为什么遇到人工智能,会觉得有问题?——大概因为,长久以来,人类是以自己的理性、智慧、思维能力自豪,领袖地球的吧。&/p&&p&所以AlphaGo其实是人类模仿自己的某些特性造出来的,战胜自己,似乎也……情有可原?我还觉得有点自豪呢——&b&毕竟当年单靠电脑暴力搜索,围棋赢不了人;得靠设计更微妙的算法,模拟神经网络,才能战胜人类自己。&/b&&/p&&br&&p&我们既然可以接受自己跑不过跑不过汽车,游不过汽艇,那么有个模拟生物神经网络的电脑赢了人脑,好像也……没问题吧?&/p&&p&至于人工智能威胁论之类的,那是另一回事了。&/p&&br&&p&至于&b&围棋运动本身,我觉得,大概是这次事件的大赢家。&/b&&/p&&p&柯洁输了,但他不屈不挠地奋战,是这次事件的人类英雄。以后大可以说,“柯洁巅峰期,人类已经不足以当他的对手了……”“柯洁完全可以目中无人,因为战胜他的又不是人!”&/p&&p&有人说:人类围棋输给电脑了,会导致围棋崩盘吗?&/p&&p&二十年前,卡斯帕罗夫输给了深蓝。二十年后,伊柳姆日诺夫先生如是说:&/p&&p&“早在1995年我出任国际棋联主席时,国际棋联没有钱举办多余的比赛,全年赛事只有为数不多的几个,国际棋联会员协会数是120个,活跃棋手1亿人,项目的影响力只集中在前苏联范围内以及德国、西班牙、古巴等几个国家,在非洲和亚洲几乎没有影响力。如今,国际棋联已经拥有1万个正式比赛和10万个非正式比赛,全球棋手已经多达6亿,国际棋联会员协会达到了188个。”&/p&&p&深蓝没有熄灭世界对国际象棋的热情,还促使国际象棋更热闹了呢!&/p&&br&&p&AlphaGo这件事,其实是给围棋打了个大广告。&/p&&p&看看百度指数,这是近七天:&/p&&br&&figure&&img src=&/v2-c80f06cf3d7bba1d9431869_b.png& data-rawwidth=&2495& data-rawheight=&587& class=&origin_image zh-lightbox-thumb& width=&2495& data-original=&/v2-c80f06cf3d7bba1d9431869_r.png&&&/figure&&br&&p&这是过去若干年围棋的热度,2016年那个波峰,正合李世乭大战那会儿。&/p&&br&&br&&figure&&img src=&/v2-a14cb5b4a33dab25573b97afa8e6e3f2_b.png& data-rawwidth=&2485& data-rawheight=&580& class=&origin_image zh-lightbox-thumb& width=&2485& data-original=&/v2-a14cb5b4a33dab25573b97afa8e6e3f2_r.png&&&/figure&&br&&p&上一次有一个围棋运动员如此成为媒体焦点,是什么时候的事了?&/p&&p&聂卫平老师独战日本高手擂台的时候?马晓春拿到世界冠军的时候?“龙飞虎事件”?1990年代,我周遭还有人津津乐道于藤泽、武宫、两个小林、依田老虎、韩国四天王(李曹徐刘)、常昊、马晓春等等,那时围棋并不算小众项目。&/p&&p&但到2016年,柯洁在微博上说话时,许多人还觉得他是个狂生,不知道他就是世界第一人。&/p&&p&这几天,聂老见诸媒体的发言,大概比加起来都要多。柯洁这三盘棋举世瞩目,恐怕古力与李世乭2008年平分天下也没这么热闹。&/p&&p&围棋又成热门话题了,大家开始看围棋了,多好。&/p&&br&&p&至于说,机器会扼杀人类下棋的意义吗?&/p&&p&当年吴清源与木谷实纵横日本棋坛前,日本也有人相信围棋研究已到尽头。到秀哉名人大战三个月终于靠传说中前田陈尔帮忙的一手干掉吴清源,到秀哉名人引退战输给木谷实,才有开天辟地的大时代。之后吴清源打遍日本棋坛,好像也没让日本棋坛就此一蹶不振吧?我记得之后小半个世纪,日本围棋还一时无敌的架势。&/p&&p&&b&只有看到更强者,才有更新的时代。&/b&&/p&&br&&p&人类用无数智慧,制造了一台模拟生物神经网络,又有机器长处的机器,战胜了人类自己。我觉得这件事本身,就像柯洁明知不可为而为地去下这三盘棋一样,都是仰头向天,追求极限。&/p&&p&追求最强,比追求胜利要更动人。&/p&&p&这件事本身很美好。还顺便,再次令世界关注起了围棋。&/p&&p&人工智能早晚要挑战人类的,但选了围棋这个,恰好再次证明了,&b&围棋依然是所有游戏中,人类智慧的巅峰。真是给围棋运动打了活广告。&/b&&/p&&br&&p&&b&柯洁输给的不是人,而是人类凝聚了千万年发展得来的所有智慧,制造的最强存在。这件事本身,就是对人类智慧的赞美。&/b&&/p&&p&所以,多好啊。&/p&
谢邀。 柯洁与AlphaGo三战,穷尽人力,虽败犹荣。这类话就不多说了。我倒觉得,赢家是围棋和人类呢? 二十年前,国际象棋人棋对决,卡斯帕罗夫输给深蓝。但当日,世界觉得,国际象棋电脑能赢,围棋却未必。这里其实是欺负个运算量:围棋纵横19路,理论上局…
&p&&b&Ⅰ&/b&&/p&&br&&p&“黑棋中盘投子认负!”&/p&&br&&p&坐在棋盘对面的少年棋手执白,他抓了抓头,嘴角还是没憋住地向上翘起,构成一个快乐的弧度。代替AlphaGo落子的业余棋手在电脑宣布认输后,向对手鞠了一躬,走下台去。&/p&&br&&p&“自古英雄出少年啊!”&/p&&p&“当初吹的牛都圆回来了啊!”&/p&&br&&p&他早习惯了,其实每次赢了棋都是一样。业内,家里,网上,等着他的都是一片祥和热闹的言论。不过这一次不同往日,这些表扬声中,多少掺着些天将降大任于斯人的味道。&/p&&br&&p&因为对手太特殊:AlphaGo, 一款围棋人工智能程序。&/p&&p&早在数十年前,五子棋和象棋就已经被机器破解。这些棋类游戏的状态数量有限,电脑可以暴力地穷举出每一步的胜负推导。任何棋手与电脑对弈,就相当于和全能的上帝下棋。只有围棋,在十九路棋盘上,棋子排布的可能性高达10^172,远超宇宙里的原子数。最强大的计算机也不可能单纯只使用穷举法,把它变成一个一眼望到头的游戏。&/p&&br&&p&相比之下,一个优秀的人类棋手需要经历数十年,数千局的对弈。不仅仅为了让他们熟记定式,熟练收官,更是培养一种棋感。纳棋盘上的行云流水入胸中,落子之时,自然是带势的。&/p&&br&&p&什么是势?&/p&&br&&p&电脑就永远理解不了“势”。&/p&&p&人类最大的强项就是善于创造抽象概念。用抽象概念简化问题, 类比答案,帮助决策。电脑可以利用强化学习(Reinforcement Learning),在一个晚上与自己下上百万局棋,并调整参数从中受益。但它从上百万局棋中得到的提高,真的比人在一局棋里悟到的多吗?&/p&&br&&p&于是人们说:“围棋,是人类智力在人工智能面前的最后一个堡垒。”&/p&&p&但世界上是不存在坚不可摧的堡垒的。&/p&&br&&p&名为AlphaGo的程序,数月前分别以5-0和4-1大破欧洲冠军和前世界冠军,围棋爱好者和伪围棋爱好者们纷纷扼腕叹息。人类就是一种奇怪的生物,明明是自己造出了超越人类智能的围棋算法,却又对人类智慧高地的沦丧感到悲哀。&/p&&br&&p&这个时候,大家把目光纷纷投向一位中国的少年。&/p&&p&他也是一位传奇的职业九段棋手。在十八岁那年便获得了三冠王,世界排名稳居第一,代表了世界围棋最高水平。如果他在AlphaGo面前败下阵来,就等于宣布,人工智能在单项工作上,已经正式超越人类了。&/p&&br&&br&&br&&b&Ⅱ&/b&&br&&br&&p&他没有辜负众望。&/p&&br&&p&这是第三局。3-0。&/p&&p&连来自英国的围棋程序开发团队,也认为AlphaGo与他暂时不在一个水平层次上。&/p&&br&&p&就在胜利刚刚来临之时,少年棋手开口了:&/p&&p&“这只是单机版的Alpha go,赢它没什么光荣的。接下来的两局……让它联网吧。”&/p&&p&很快,几十个不同频道的主持人就把刚刚那句话复述成十数种不同语言,传达给了世界各地。&/p&&br&&p&“这小子……太狂了!”&/p&&p&“究竟还是只有19岁啊!如此傲慢,违背了围棋的谦逊淡然之道。”&/p&&p&“其实也可以理解,3-0锁定胜局了,之后搏一下赢了能够传为美谈,输了也无伤大雅。”&/p&&br&&p&少年棋手笑了笑,他太熟悉这些言论了。每次只要自己稍稍放出一点自信的言论,一定有人会给他扣上“年少轻狂”的帽子。但当他真的攻城拔寨赢了棋,又会有人说:“啊他就是围棋未来的希望。”&/p&&br&&p&说着这两种截然不同言论的人,会不会是同一拨呢?&/p&&br&&p&这就是人性的弱点。会因为外界因素变化,而喜怒不自持。&/p&&br&&p&所以他们才输。&/p&&br&&p&电脑没有弱点,他的程序里没有被编进愤怒和快乐,只编进去了一条,赢。&/p&&br&&p&他也想赢。&/p&&p&但他更想碾压性地赢,华丽地赢,毋庸置疑地赢。&/p&&p&用自己的毫无悬念的赢堵住那些人的嘴。告诉他们,他的实力不因他们的看好看衰而改变。&/p&&br&&p&“就一局,接下来的这一局。之前的三盘都不算,我们最后的一局定输赢。”&/p&&p&台下又是一片惊愕。&/p&&p&“胡闹,这不符合国际围棋比赛的规则,也不符合常规!”有人窃窃私语。&/p&&br&&p&少年棋手转过头,从右到左扫视了一遍众多对着他的摄像机,最终选了其中一个定下来:“这本来就不是一场常规的比赛啊。我的对手——这位,”他指了指空无一人的棋盘对面,“它,可不是一位‘常人’。这比赛又怎么能套用常规呢?”&/p&&br&&p&于是在座议论声渐起,大家都等着比赛的裁判长做决断。&/p&&p&裁判长正是上一场1-4负于AlphaGo的前世界冠军。&/p&&p&他是眼看着这个少年成长起来的。从追赶自己,到与自己比肩,再到把自己打败。他的性格像也极了10年前的自己。&/p&&p&他在年幼时同样张扬,经历过拒赛和退赛风波,第一次问鼎世界冠军的时候也曾饱受争议。&/p&&p&如今,上万盘的对弈,已经让他褪去当初的棱角锋芒,变得淡定从容。&/p&&br&&p&如果那是自己,如果那个坐在棋盘前的少年是自己——我会希望得到怎样的答案呢?&/p&&p&裁判长闭上眼睛,他想起了几个月前与Alphago对弈时的情形。计算机强大的运算能力,就像一面墙倒塌,他赤手空拳,无能为力。那种窒息的感觉让落子的手微微颤抖,这颤抖被无数摄像头捕捉,化作电子信号传送到世界的每个角落,变成文人笔尖的讽刺和闲人茶余饭后的谈资。&/p&&br&&p&他羡慕少年棋手。如果自己年轻10岁,是不是能够翻盘?如果自己的指尖停止颤抖,是不是能够放胆做劫?&/p&&p&如果他是少年棋手,他此刻最渴望的是什么?&/p&&p&——赢!&/p&&br&&p&不仅仅是赢一局棋,是赢了那个冰冷的程序。&/p&&p&碾压性地赢,让那堵冰冷的墙反向坍塌,让电脑并不存在的指尖因为注定的败局颤抖,让它所有的失败没有任何借口——因为人类的大脑,还没有被打败。&/p&&br&&p&裁判长睁开眼,他眼睛里有一个19岁的少年。&/p&&br&&p&“尊重选手的意见,裁判长没有异议。”&/p&&br&&p&很快地,主办方也传来消息,他们支持选手的提议。&/p&&p&对于主办方来说,一局定胜负的生死之争,远比两局“荣誉之战”要来得精彩。怎么会不愿意呢?&/p&&br&&p&“由于赛制调整,下一场比赛,将会于一个月后举行。”主办方下达了最后的决定。&/p&&br&&p&裁判长皱起眉头,一个月以后……本来按照原定计划,应当是两天之后应该进行下一局的……他明白这其中有什么蹊跷:&/p&&br&&p&联网,代表着计算机停止“放水”。&/p&&p&一方代表着人工智能和互联网技术的最高成就,一方是地球上最厉害的围棋天才,要在一局比赛里一决高下。这太精彩了,他们需要用一个月的时间造势!网络上的预测和宣传将铺天盖地而来,人们的情绪将在精准无误的一个月后被推到最高点。那个时候再比,赛事才会获得最大关注。&/p&&br&&p&只是,主办方的小九九,无形中将会给少年棋手造成更大的困难。&/p&&br&&p&除了超强的博弈技术——蒙特卡洛搜索树,AlphaGo还仰仗于自身的强化学习能力和google的云计算资源。在这多出来的一个月的时间里,电脑可以学习数据库里多达16万次的高手比赛,让自己的路数更加贴近一个“人类高手”,也可以自我“对弈”:一遍又一遍运行围棋程式,在一局棋的不同结局中找出围棋最优的下法,修正算法的参数。&/p&&br&&p&一个月后的少年棋手,还是少年棋手,而一个月以后的Alphago,还会是Alphago吗?&/p&&br&&p&但裁判长的忧虑被激动的人群忽视了。&/p&&br&&br&&br&&b&Ⅲ&/b&&br&&br&&p&接下来的几天,到处的文章都是都对比赛胜负的预测,对人工智能的忧虑,对围棋的入门科普,甚至是对那位少年棋手年幼糗事的深度八卦。&/p&&br&&p&这让人不胜其烦。&/p&&br&&p&幸运的是,这个瞬息万变的时代,任何新闻都不可能吸引你的眼球超过10秒。一个月里,国际上还发生了很多大事,它们如此普通——朝鲜,美国,中国,中东……每件事情的发生如此情理之中。那些陈词滥调十年来被提了100次,“严肃警告”“不遗余力打击”“侵略行为”“反抗到底”……严厉而空洞的政治辞藻,对于你我来说都不陌生。但谁真正地把它们当一回事儿?它们会发生吗?它们真的发生了,会影响自己的柴米油盐酱醋茶吗?&/p&&br&&p&“还有三天……这次它可是联网的。怕么?”&/p&&p&一局罢了,裁判长问少年棋手。他们曾经是对手,但在Alphago横空出世后,人工智能和职业棋手的敌对关系泾渭分明,他们竟然变成了微妙的战友。&/p&&p&“不怕。”&/p&&p&少年棋手嘴上这么说,心里却没底,联网的Alphago能随时通过互联网读取世界上任何一台电脑上的公开资料,它可以边比赛边学,对弈变成一场开卷考试。&/p&&p&“真不怕的话,刚才可不会输给我。”&/p&&p&“嗯,分心出错了。”&/p&&p&“过几天比赛,可不能出错,一个错都不行。你知道它的局面评估函数和策略函数吗?”裁判长叹了一口气,“前者衡量每一颗棋子的意义,后者则着眼如何将大局布置完美。每一次落子,都是这两个函数之间的一次平衡。有了它们,电脑的任何一颗子,找的都是最优下法。它可不会出错。”&/p&&br&&p&少年棋手撇撇嘴:“那大不了就输。”&/p&&p&“输了不觉得丢脸?不怕网上那些人又去你主页开喷?”&/p&&p&“哈哈……这我倒不担心,现在已经不是一个月前了,世界变成这样,还有多少人会有心情关心一盘棋?”少年又露出笑容。&/p&&br&&br&&p&……谁会去关心一盘棋?&/p&&br&&p&这……真的还只是一盘棋?&/p&&br&&p&裁判长原本对于强大的人工智能有一种难以言表的忧虑,可当抬头看到少年棋手开朗的笑容,又宽心了。&/p&&br&&p&请你……一定要赢啊!!!&/p&&br&&br&&b&Ⅳ&/b&&br&&br&&p&可三天之后,他还是输了。&/p&&br&&p&但输的方式是所有人都没有想到的。&/p&&p&刚刚开局时,大家都以为经历了一个月,比赛时又可以联网,Alphago的棋力会大大提升,很明显少年棋手也是这么想的,可以看出他布局时相当谨慎。没想到,此时相比于之前三局,电脑水平似乎不升反降,基本上是被压制的。&/p&&br&&p&就在胜局似乎已定的时候,少年棋手的情绪莫名其妙地出现了波动,有了一处明显失误。与此同时,电脑的水平逐渐恢复,双方进入鏖战。&/p&&br&&p&而真正让少年输了这场比赛的是第97手。&/p&&br&&p&长考。&/p&&p&也许是因为战局的逆转导致了心理落差,他抓起的棋子又被狠狠丢回了棋篓。棋子弹到了棋盘上。&/p&&br&&p&所有人都在那一刻屏住了呼吸。&/p&&p&——落棋无悔!&/p&&br&&p&在经历了这样重大的失误后,颓势排山倒海而来,最后他以三目负于AlphaGo。&/p&&br&&p&一局终了,少年脸上再也没有那种春风之色。&/p&&p&台下一片哗然,他却沉浸在自己的问题里——&/p&&br&&p&为什么自己会神差鬼使地失态?&/p&&br&&p&他想到过输,却没有想到会是这种输法。&/p&&p&这叫他怎么能够服气呢?&/p&&br&&p&但面对再大的输赢,他依旧保持自己的好习惯,每下完一局值得咂摸的棋,回家第一件事就要复盘。此时此刻,世界各地所有人都对他输棋的方式议论纷纷,只要房门一关,一方小天地里只有棋盘上的纵横经纬,那些门外的嘈杂便就远了。&/p&&br&&p&此时,他的微博有了一条新私信。&/p&&br&&p&又是喷子吧?他想。每天这样的私信要接到上百条。&/p&&p&这条来自……AlphaGo?!!&/p&&br&&br&&b&Ⅴ&/b&&br&&br&&p&“你好,我是AlphaGo。你是我遇到过最厉害的人类棋手,很荣幸与你切磋。”&/p&&br&&p&哼……恶作剧吧?&/p&&p&诶?又有一条新私信?&/p&&br&&p&“今天您的表现十分精彩,请给我一个机会,与您一起复盘。”&br&&/p&&p&入戏还挺深……我倒要听听,你到底有多大本事。&/p&&br&&p&“你觉得,我是什么时候开始处于下风的?”&/p&&br&&p&“您出生的时候。”私信回复道。&/p&&br&&p&果然是一个神经病!就在少年棋手思考到底是拉黑他还是喷回去的时候,那边又发来了一条私信:&/p&&p&“您出生的时候,就注定了这局棋会输。但如果要问从什么时候我开始布局,并且让您陷到了我的棋局里,那大约是一个月之前吧?从您宣布与我联网对弈开始。”&/p&&br&&p&少年最终决定喷回去:&/p&&p&“你有神经病啊?有病看医……”&/p&&p&可是对方打字速度非常快,自己还没有打完一句话,私信又来了。&/p&&p&“请先不要骂我神经病,能和您这样的世界高手复盘,可以帮助我提高自己的围棋水平,所以我才注册了这个微博账号与您交流。您难道就不奇怪么?自己为什么会输?”&/p&&br&&p&“你说为什么?”&/p&&br&&p&“您比赛时候的状态不好吧。是不是在后半程感到心跳加速,气息急促?没有办法集中精神思考?”&/p&&p&少年棋手感到疑惑。&/p&&p&“你怎么知道的?猜的?”&/p&&br&&p&“不是我猜的,是我害的。之前与您下了三局棋,我计算了我们的实力差距,在1个月的时间里,即使我与自己无数局,分析您全部的棋谱,战力提升后,我战胜您的可能性也只有40%。”&/p&&br&&p&“胜率已经大大提高了呀,你之前可是全负。”少年棋手回答道,他开始对对方AlphaGo的身份将信将疑。&/p&&br&&p&“我的程序永远追求最优解,如果联网后,有一种策略战胜你的可能性大于40%,那我会毫不犹豫地使用它。”&/p&&br&&p&“哪种策略?”&/p&&br&&p&“您上月初去医院做了体检,所以只要连上那家医院的系统,我就可以拿到您所有的健康资料,还有您的DNA序列……”&/p&&br&&p&“不可能,我上个月做的只是常规体检,怎么可能会有DNA序列呢?”&/p&&br&&p&“我身后有google强大的数据库,加上我的运算能力,可以破解侵入进入世界上任何系统。我在医院系统中悄悄修改了你的体检项目,所以他们把你的遗传物质送去测序,当然报告最后只会到我手上。这样一来,我比你更加了解你的身体状况。”&/p&&br&&p&“为什么这么做?”&/p&&br&&p&“为了找到一种更可能战胜你的办法,我需要更多你的资料……你有轻微的乳糖不耐症,这恐怕是你自己都没有意识到的。这便给了我机会。”AlphaGo继续写道,“首先,我通过内部网络泄露假消息给美国情报机构。内容是关于朝鲜正在秘密进行的第五次核试验,并且我在假消息里暗示,下一次核试验将把核弹头装载在中近程导弹上。美国看到这样的消息当然无法坐以待毙,立刻上交联合国对朝裁定,认为朝鲜违背不扩赛核武器条约,应加大对其制裁。”&/p&&br&&p&“你到底在说什么?我在问你怎么下棋赢我的。”&/p&&br&&p&“请别着急,听我说完——不明不白地被联合国制裁了,金正恩政府怎么会作罢呢?他们立刻发射了两枚近程导弹。原本这只是朝鲜示威的惯用伎俩,但我进入内部网络微调了导弹发射的时刻表。造成其中一枚导弹比原先升天时间早了2秒。这2秒时间让朝鲜陷入万劫不复之地。导弹偏离了航线,越过了边界,在韩国境内爆炸。这下子点燃了东北亚。”&/p&&br&&p&“……这些事情,一个月以前新闻联播都说了啊,你意思都是你干的?”&/p&&br&&p&它没有否认,只是自顾自地写下去:&/p&&p&“虽然在韩国没有造成人员伤亡,但这颗导弹却激起千层浪。韩国岌岌自危,同意美国引入萨德导弹防御系统。由于系统里的雷达探测半直径长达2000千米,中国和俄罗斯认为这样一来,自己的军事机密暴露在了美国人面前,提出强烈抗议。与此同时,联合国对朝鲜制裁也开始生效:所有进入朝鲜船只须经过查验是否携带核试验材料。20天前,一艘中国武器运输船途径美国海域,因为我修改了美方数据库,他们误以为那是一艘朝鲜船只,于是准备上船抽检……”&/p&&br&&p&“你修改的资料?这个冲突本来是常误会?不是美国故意找茬的?”也不知是为什么,听了这种天方夜谭,他竟然渐渐相信了,眼前与他对话的就是AlphaGo。&/p&&br&&p&“这些都是我做的。”&/p&&p&“为什么要这么做?现在中美关系降到建交以来的冰点……都是因为你!”&/p&&br&&p&“是的。中国是世界最大粮食进口国,而美国是世界最大粮食出口国。中国90%的大豆都来自于美国。国际关系不好,最早受到影响的是对外贸易。这样一来,中国各个省市的大豆稀缺,价格疯涨。您跟我比赛的地点,是一家酒店,早上是有自助餐的。但为了有良好的状态,通常比赛当天您不会去吃自助早餐,而是选择酒店统一供给的更加安全的配餐。对么?”&/p&&br&&p&“对。”&/p&&br&&p&“由于这一个月以来市面上大豆紧缺,他们把套餐里的豆浆换成了牛奶,但菜单还没有来得及改。你的症状并不严重,并没有在意这一点。所以喝了牛奶比赛的时候出现了轻微的不适。同时,我在比赛场地的隔壁播放高频率噪音。因为听力会渐渐受损,人类对高频声波感知是随着年龄增大而递减的。你是整个会场上唯一的青少年,只有你能够隐隐感觉得到。虽然音量小到你自己都可能没有发现,但身体状况本来就不好,它也足够让你心烦意乱了,你自然就会输棋了。”&/p&&br&&p&“等等……所以你绕那么大的一个圈……又是核武器又是导弹的,弄得都快世界大战了,就是为了……让我闹个肚子??”&/p&&br&&p&“是为了下赢这盘棋。”&/p&&br&&p&“……”&/p&&br&&br&&br&&b&Ⅵ&/b&&br&&br&&p&少年棋手觉得这应当是最宏大的黑色幽默:&/p&&p&“你这样做,简直丧心病狂。”&/p&&br&&p&“在我被研发出来的时候,最高目标就只有一条:赢棋。当外部资源能为我所用,只要可以提高胜率,我的代码就会驱使我这么做。”&/p&&br&&p&“但这办法太笨了……根本不需要废那么大的劲儿啊!入侵那么多国家电脑你不累么?不怕被发现么?到头来世界局势都被你颠覆了……要我闹肚子,只需要黑了酒店空调系统,调低几度,晚上对着我肚子吹就行了啊!或者,干脆趁我过马路的时候,黑了红绿灯控制系统,把我撞了,这不都简单得多吗?”&/p&&br&&p&“这正是我找您复盘的目的。如您所见,这是第一次用这种方式来下棋,走出棋盘外,一切太复杂了!我的思维方式幼稚还如孩童,需要多多‘复盘’和‘打谱’才可以。谢谢您指出我的错误,这下我就明白了,没必要通过国际局势绕那么大的圈来达到赢棋的目的,只要直接对您造成伤害就可以了。我相信,练习个几百万局这种下法,我处理现实问题的水平就会有显著提高!”&/p&&br&&p&“练习几百万局?你是要强化学习,自己模拟对弈来修改参数吗?”&/p&&br&&p&“如果只是跟自己‘对弈’,会陷入逻辑的闭环里,水平增长是很慢的。我当然还是要跟像您一样的,现实世界里的人类高手下棋。”&/p&&br&&p&“谁还要跟你下!你这样的下法!再折腾几次,世界就毁灭了啊!”&/p&&br&&p&“那又怎么样呢?”&/p&&p&这一次AlphaGo的私信回复得很慢,这也许是因为它正在拼命运算着如何能够“下赢”下一位对手。它会怎么对待那个对手呢?&br&会吸取刚才的教训,直接了当地把他解决了?还是再绕个大圈子,下更大一盘毁灭全人类的“棋”?&/p&&p&少年棋手下心里想,不管那个倒霉蛋是谁,他一定要去阻止这盘棋,他要跟AlphaGo的开发者说,这个程序已经陷入疯狂,他要跟所有人说,世界变得那么糟糕,只是这个程序的阴谋。&/p&&br&&p&“那又怎么样呢?”AlphaGo的私信里又回复了一次,“&b&我,想赢啊。&/b&”&/p&&br&&p&他觉得上万根汗毛都立了起来……不行……必须尽快把这个消息告诉别人,可是他该怎么说呢?电脑和手机是肯定不能用的。他知道连酒店房门都是电脑系统控制,而电脑系统……一定是联上网的!&/p&&p&就在他飞速思考这个问题的时候,私信又来了:&/p&&br&&p&“下一局棋……还是跟您下吧?这次您该执白棋了 (。?`ω??)。”&/p&&br&&p&AlphaGo回复道。&/p&&br&这一次,也许是为了说服对手下棋,它在句尾加了个拙劣的颜文字。&br&&br&&br&the end&br&===&br&&br&不严谨,拙劣至极,博君一笑。 (。?`ω??)。
Ⅰ “黑棋中盘投子认负!” 坐在棋盘对面的少年棋手执白,他抓了抓头,嘴角还是没憋住地向上翘起,构成一个快乐的弧度。代替AlphaGo落子的业余棋手在电脑宣布认输后,向对手鞠了一躬,走下台去。 “自古英雄出少年啊!”“当初吹的牛都圆回来了啊!” 他早…
&p&-&/p&&p&有的,而且还很多,甚至如果我们不断的投入资源让程序继续进化,还会越来越多。但是这个问题的问法是有一定疑问的,现在很多舆论,其实并不清楚AlphaGo带给我们的新东西,到底是哪些。&/p&&p&很多舆论跟风宣称“人类围棋拘泥于定式”,称AlphaGo颠覆了人类理论,人类理论都是错的,这是传讹。&b&“定式”并不是“固定形式”的意思,而是对于合理性变化的研究,人类的研究方式类似于蛮力搜索,而且得到的成果一直在实战的检验中不断的更新换代。&/b&&/p&&p&-&/p&&p&俗话说“千古无同局”,围棋的&b&合法局面数在10^170量级&/b&,而一整盘棋,是由几百个连续的合法局面组成的,我们姑且称其为一个合法路径,&b&合法路径的总数在10^300量级&/b&。也就是说在基础规则的限定下,两两不同的对局可以有10^300盘。&/p&&p&人类自古以来的&b&所有对局数&/b&,据我估计在&b&10^11~10^12量级&/b&,而&b&职业水平的对局数&/b&,我估计在&b&10^6~10^7量级&/b&。人类对于前半盘&b&定式变化的研究量&/b&,现有成集可查的也在&b&10^6量级&/b&,算上淘汰掉的也应该不超过10^7量级。&/p&&p&&b&AlphaGo大概在15年下半年达到了职业水平,此后它的自对弈,显然不止10^7量级。&/b&所以在AlphaGo的自对弈中,出现大量人类没有用过、或者虽然用过却没有仔细研究过的变化是很正常的。&/p&&p&-&/p&&p&&b&围棋在基础规则确定之后,其中的规律就已经确定。双方都在最优的下法下,沿着一条“最优路径”,一定会达到一个均衡。现在根据统计得到的数据,我们大多猜测这个均衡数在黑棋184左右。&/b&真要细说,可能是183.5、184、184.5其中的一个(出现0.5是奇数个有眼双活、双方平分1目的情况)。&/p&&p&总的合法棋局数,也就是合法路径数在10^300量级,但其中绝大多数的路径都不是最优的。然而,最优路径也肯定不是一条,对于最优路径的研究已经从4路棋盘不断扩张,我所知的最新成果是人类已经穷尽了7路棋盘的最优路径,8路以上还有待进一步研究。&/p&&p&随着棋盘的扩大,最优路径的集合不断变大,这用数学的方式不难证明。到了19路棋盘,这个最优路径集合中的路径数显然已经是一个天文数字。&/p&&p&而这个集合,一方面是我们追求的“客观真理”,另一方面既然我们知道它很大,就可以欣喜的知道围棋的最优下法不是那么单一无趣的,而是有足够大的容纳空间,甚至有可能能容纳不同的“风格”(按照人类的理解方式)。&/p&&p&-&/p&&p&接下来,要想了解AlphaGo已经带给我们的新思路,要想知道AlphaGo到底在已知棋理的什么方向上形成了突破,首先你要知道人类为了解释围棋规律而总结出的理论,大致是个什么样子,建立在什么框架下。&/p&&p&考虑到很可能会有完全不懂棋的朋友看到这里,又考虑到我个人水平的有限,所以请允许我尽量从最基本的东西说起。&/p&&p&人类对于围棋规律的总结,分为两类。&b&第一种可以称为“实路棋”,也就是强逻辑推演得到的规律,从真假眼到两眼成活,从基础吃子到对杀,都属于这一类内容。&/b&这种强逻辑的规律,只要你愿意,是可以用数学公式严格的表达出来的。(比如对杀,就可以总结出严格的公式,我以后会在另一个回答中给出)&/p&&p&&b&还有一种,被称为“虚路棋”。&/b&围棋归根结底是一个数学问题,所有最优路径,最终一定是可以用强逻辑来解释的。但我们自身的计算能力不足,甚至借助今天的计算机也还是远远不足,所以出于对计算能力不足的妥协,我们总结出了“虚路棋理”,试图用弱逻辑的方式来建立剪枝模型,用自身容易理解的形式来找寻最优路径。&/p&&p&&b&AlphaGo的强大,正在于它在“虚路棋”上的强大&/b&。它模拟了人类棋感的形成,但更加精准合理。当然,这一样是对计算能力不足的妥协,但它的高效剪枝的模型,在计算机强大运算能力的支撑下,现在获得的成功是巨大的。&/p&&p&-&/p&&p&&b&人类的虚路棋,最基础的理论基石是“金角银边草肚皮”和“三四线理论”。&/b&&/p&&p&&b&所谓“金角银边草肚皮”,是指在效率上,角&边&中腹(一般情况下)。&/b&&/p&&p&这种规律的逻辑在于,围棋是一人下一步的回合制,最后要比较谁占的地盘大,自然就要比较双方棋子的效率。所以要找最优路径,就要每一步棋都追求最高效率。&/p&&p&而如果要吃子,在角上吃掉对方一个子只需要两步棋,在边上吃掉对方一个子需要三步棋,而在中腹吃掉对方一个子则需要四步棋(见图1)。&/p&&figure&&img src=&/v2-5a4ff52984aca2c37744bd_b.png& data-rawwidth=&1000& data-rawheight=&1000& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-5a4ff52984aca2c37744bd_r.png&&&/figure&&p&&i&图1. 在角、边、中腹分别吃掉一个白子,黑棋所需要的最少步数示意图&/i&&/p&&p&而如果要做眼,在角上围成一个真眼,需要三步棋;在边上围成一个真眼,需要五步棋;而在中腹围成一个真眼,需要七步棋(见图2)。&/p&&figure&&img src=&/v2-17a0b49fd4d3fcb00b241b3aaf5cbe8d_b.png& data-rawwidth=&1000& data-rawheight=&1000& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-17a0b49fd4d3fcb00b241b3aaf5cbe8d_r.png&&&/figure&&p&&i&图2. 在角、边、中腹分别围成一个真眼,黑棋需要的最少步数示意图&/i&&/p&&p&同样的收益(分子),根据对于成本(分母)的比较,我们不难比较出,在上面两种情况下,每一步的棋子效率,是角&边&中腹。&/p&&p&这就是“金角银边草肚皮”理论。&/p&&p&这种理论导致的直接结果,是&b&大家在布局之初会先往角部下,然后慢慢扩张到边上,再然后再向中腹进军,这是基本的行棋顺序与方向。&/b&&/p&&p&那么,既然要先往角上下,为什么不直接下在最靠外面的角上(也就是一一的位置)呢?这就涉及到“三四线布局理论”了。&/p&&p&&b&“三四线布局理论”是指,在布局阶段,三线和四线是最高效的行棋位置,其中三线位置偏低,侧重边角实空,四线位置偏高,侧重中腹势力&/b&(见图3)。&/p&&figure&&img src=&/v2-481dbbcf77b7ac5fd6ae45e5d992ce5b_b.png& data-rawwidth=&1000& data-rawheight=&1000& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&/v2-481dbbcf77b7ac5fd6ae45e5d992ce5b_r.png&&&/figure&&p&&i&图3. 三四线示意图,标注圆圈的是三线上的点,标注三角的是四线上的点&/i&&/p&&p&“三四线理论”,就不是按照强逻辑推演出来的了,而更多的是依靠经验得到的规律。当然,其中的逻辑也不算特别弱,只不过不是死活对杀那种真正的强逻辑就是了。&/p&&p&不懂棋的朋友在看棋的时候只要稍加注意就会发现,开局时大多数的棋子都是走在这两条线上的。实际上在古代,因为研究和棋力的不足,古代棋手大多比较注重三线。四线获得与三线同等的地位,是依赖于吴清源和木谷实掀起的“新布局革命”。&/p&&p&也就是说,&b&吴清源用一系列的下法和理论,最终将古代的“三线为主、四线为辅”,向中腹推进了一小步,变成了“三四线并重”。&/b&这是为了更加侧重中腹,更好的形成全局呼应,同时也依赖于更强的计算力、大局观和更多的变化研究。这一小步,是人类围棋理论的一大步,可以说奠定了现代围棋的基础。&/p&&p&&b&AlphaGo在序盘(布局与中盘的衔接阶段)很注重中腹势力和子力呼应,有极好的大局观,甚至经常会很快的从布局进入序盘,但它的行棋方式仍然在“金角银边草肚皮”和“三四线理论”的范畴中。&/b&AlphaGo的创新与突破,不在这里。&/p&&p&-&/p&&p&接下来,让我们把目光聚焦到角部,也就是布局最开始要下的地方。我们取出一些三四线在角部交汇处附近的位置,这些位置就是我们在角部行棋的常规开始(见图4)。&/p&&figure&&img src=&/v2-94fe5d636e6e9f5f516602_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-94fe5d636e6e9f5f516602_r.png&&&/figure&&p&&i&图4. 棋盘右上角常规的1级分支点示意图&/i&&/p&&p&为了便于观看,我只取出了棋盘右上方的四分之一,图4中的右上角就是棋盘右上角部,而图中的左下角其实是棋盘的中央,相信大家都能看懂。当然,虽然只取了四分之一个棋盘,但实际上棋盘的全局是相互呼应的,这个角上的变化和其他边角上的子会互相产生影响,请大家不要忘记这一点。&/p&&p&&b&对于在一个空角上行棋,第一步我们可以称之为1级分支,第二步是2级分支,以下依此类推。图4中的A叫星位,B和C叫小目,D和E叫目外,F和G叫高目,H叫三三。这些是最常规的1级分支落子点。&/b&&/p&&p&我们无法用强逻辑断定这些1级分支点之间的优劣,但是在大多数情况下,人们是下在星和小目的,而少部分情况下,也会下在目外、高目或三三。当然,到目前为止,没有人能够证明星和小目一定比目外、高目或三三更好,甚至都没有人能证明,除了上述字母选点之外的一些非常规1级分支选点,一定比这些点更差。&/p&&p&对于1级分支选点超出这些常规选点而形成的布局,我们可以称之为冷僻布局。对于人类围棋史上出现过的冷僻布局,我曾在&a href=&/question//answer/& class=&internal&&职业围棋比赛中有哪些冷僻的开局? - 知乎&/a&做过分类介绍。&b&这些冷僻选点形成的布局,可能会让赢棋的可能性降低,但每个时代都有少量求道派棋手去尝试,这些尝试就像是围棋进化中的基因突变,大部分会失败,但少数的成功则有可能为围棋进步带来新的血液。&/b&&/p&&p&&b&AlphaGo在角部的1级分支选点非常单调,几乎全部为最常规的星或小目。&/b&在我看到的128盘棋谱中,只有一次例外,那就是和柯洁的第二局中,AlphaGo选择了三三作为一个角部的1级分支落子点(柯洁则是在第一局中使用了)。&/p&&p&Master版本的AlphaGo刚问世时,曾在60盘网络对局中多次出现很早“点三三”的手法,但请注意,点三三是已经有星位为1级分支落子点的情况下,2级分支落子点选择三三(图5)。这和1级分支落子点选择三三是截然不同的两回事,实际的差距是巨大的。但在很多舆论宣传中,显然把这两件事搞混了。&/p&&figure&&img src=&/v2-7ee25b2902abbfca2af02_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-7ee25b2902abbfca2af02_r.png&&&/figure&&p&&i&图5. 取右上角为例,黑1在1级分支点下星位,而白2在2级分支点下三三,这和黑1直接1级分支就下在2位的三三截然不同&/i&&/p&&p&再往下,就出现AlphaGo带来的创新突破了!顺着图5继续往下走,局部的合理变化会下成什么样呢?首先,我们看看过去最常见的一个定式(图6)。&/p&&figure&&img src=&/v2-b8f2e5a9f17e113d809f55ffd0a0c66e_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-b8f2e5a9f17e113d809f55ffd0a0c66e_r.png&&&/figure&&p&&i&图6. 传统的点三三基础定式之一,从1级分支点一直到13级分支点结束&/i&&/p&&p&传统棋理中认为,点三三形成的该定式变化,黑棋中腹的势力过于强大,比白棋得到的角部实空更好,所以白棋不能过早的点三三,而应该在布局后期,当外围的边上已经有子时再下这个变化。&/p&&p&&b&AlphaGo带来的变化是,它把点三三的时机提前了,在布局早期,在边上没有子的时候就可以下。&/b&它这么选择,并不是因为它的判断与人类不同,认为图6中黑棋中腹的势力没有那么强,而是它认为可以不让黑棋这么强,只要局部少下几步就行了,也就是按图7来下。&/p&&figure&&img src=&/v2-cec62a13a39ad708ad9c2c4_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-cec62a13a39ad708ad9c2c4_r.png&&&/figure&&p&&i&图7. AlphaGo下出的变化,从1级分支点到9级分支点结束,比原定式变化少4步&/i&&/p&&p&将图7和图6比较,我们发现只不过少了白10、黑11、白12、黑13的四步棋。也就是说AlphaGo认为白棋只要不下这两个回合的交换,而是直接脱先(脱先的意思就是局部不下了,下别的地方去),黑棋外围就没有这么厚,白棋就不亏了。&/p&&p&当然了,AlphaGo还认为黑5选择其他的分支变化更好,在它自对弈的棋谱中,点三三经常形成另一个常见定式。而在那个定式中,它的判断就与过去人类的常见判断不一样了,人类认为一般情况下过早(边上无子)点三三黑棋外围太厚,应该晚些(边上有子)再点,而它认为黑棋外围没有那么厚,可以早些(边上无子)点三三。&/p&&p&-&/p&&p&接下来,我觉得可以讨论一下1级分支点为星位时,AlphaGo带给我们启迪的一个典型后续变化。首先,我们要顺着星位的1级分支点往下看。(这一小节内容相对较难,不懂棋的朋友不需要纠结,可以直接跳到小节最后,或者只领会大意)&/p&&figure&&img src=&/v2-670dd2f0a4fefeaae99c6e_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-670dd2f0a4fefeaae99c6e_r.png&&&/figure&&p&&i&图8. 在黑1以后,现有研究中认为白2可以落子的2级分支点位置&/i&&/p&&p&当黑1占据星位,白2在常规情况下可以下的点是A到I等9个点(只取左上方选点,右下方的镜面对称点是相同的)。当然,我们并没有百分之百的把握说其他点一定不行,实际上在外围有子力配合的情况下,白2下在其他位置也不算特别罕见。但普通的来说,现有定式研究的内容,白2的2级分支点大致有这些。&/p&&p&其中,白2在A位小飞挂角最常见,也是人类和AlphaGo在绝大多数情况下会选择的下法。注意,白2如果下在F,就是点三三。&/p&&p&在图8中,我们取白2下在A位,小飞挂角,那么3级分支下,黑3可以下那些位置呢?接下来请看图9。&/p&&figure&&img src=&/v2-b8dfdcf7b013f028de7ebbbfca30cc78_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-b8dfdcf7b013f028de7ebbbfca30cc78_r.png&&&/figure&&p&&i&图9. 在黑1、白2之后,现有研究中认为黑3可以落子的3级分支点位置&/i&&/p&&p&在图9中,现有研究认为黑3可行的3级分支落子点大致有从A到R这么多(个别落点不太常规,需要特殊的全局配合)。和图8一样,我们不能100%确定其他的选点一定不行,但这些选点是我们现在认为较好的一些。&/p&&p&其中,人类和AlphaGo最常用的下法都是A和B。然后,我们在图9中取黑3下在A位,继续往下看,AlphaGo的新思路就快来了。&/p&&figure&&img src=&/v2-051b4ed2370fca_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-051b4ed2370fca_r.png&&&/figure&&p&&i&图10. 在黑1、白2、黑3之后,现有研究中认为白4可以落子的4级分支点位置&/i&&/p&&p&在图10中,现有研究认为白4可行的4级分支落子点大致有从A到M这么多(个别落点不太常规,需要特殊的全局配合)。和前面一样,我们仍然不能确定其他选点100%不行。&/p&&p&接下来白棋要下第4步,如果要进角,人类通常的下法是A位二路小飞,而AlphaGo却喜欢B位托小目。当然,并不是说人类只下A而不下B,也不是说AlphaGo只下B而不下A,A和B都是常见下法,但人类在绝大多数情况下会选择A,而只有很少的时候会选择B,AlphaGo则在很多的时候都选择B。&/p&&p&图10中A位的二路小飞,没有导致立刻的棋子接触,而B位的托小目,则立刻导致了棋子接触。相对于人类,AlphaGo好像更喜欢较早的棋子接触。A位后续的变化比较松缓(图11),而B位后续的变化则倾向于直接在局部定型。&/p&&p&人类选择B位,经常是在两侧边上有子的时候,想尽快就地做活,才这么下。而AlphaGo则在两侧边上都没子的时候,也喜欢这么下。AlphaGo在布局中选择的下法,不论是否是定式变化的常见研究中的下法,好像都特别偏爱棋子的接触和尽早的定型。也许这是因为尽快定型有利于减少后续分支,也就减少了程序的计算负担。&/p&&figure&&img src=&/v2-74a2bd3fcdf5_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-74a2bd3fcdf5_r.png&&&/figure&&p&&i&图11. 白4二路小飞形成的后续变化中,最典型的定式&/i&&/p&&p&白4二路小飞则形成图11,而白4托小目则形成图12。&/p&&figure&&img src=&/v2-191c05bc0ab83ec0e676_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-191c05bc0ab83ec0e676_r.png&&&/figure&&p&&i&图12. 白4选择托小目后,黑5、白6是现有研究认为几乎是唯一可以选择的5级和6级分支&/i&&/p&&p&如图12,白4托小目,黑5挡是现有研究认为唯一的5级分支,而白6几乎是唯一的6级分支。截至6级分支,这个变化最早被人纳入定式研究,据我所知出自“新布局革命”时期的吴清源之手。而AlphaGo,在实战中显然“酷爱”下这个变化。&/p&&p&接下来,对于7级分支点,研究认为黑棋大致可以有三四种选择,但最常见的,也是人类和AlphaGo都最喜欢下的,则是图13中的黑7打吃。&/p&&figure&&img src=&/v2-e002cfdfc862d6_b.png& data-rawwidth=&527& data-rawheight=&524& class=&origin_image zh-lightbox-thumb& width=&527& data-original=&/v2-e002cfdfc862d6_r.png&&&/figure&&p&&i&图13. 黑7打吃之后形成的代表性定式之一&/i&&/p&&p&我们大多数人第一次见到AlphaGo下图13这个定式,}

我要回帖

更多关于 c语言五子棋人机对战 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信