能用英伟达quadro p6000 玩游戏p6000玩游戏吗？(假设买得起)

点击联系发帖人 时间：2017-12-14 23:18

英伟达 quadro k620

您的位置： &
英伟达称其显卡芯片史上最快专为VR游戏打造
日 | && | 【】&【】
与“”相关的研究报告
中研普华报道
&7月26日消息，据国外媒体报道，Nvidia（英伟达）今日宣布在其图形工作站显卡Quadro P6000采用了“世界上处理速度最快的图形处理芯片”。该显卡专为工程模型设计、虚拟现实游戏渲染等复杂操作开发。
Quadro P6000采用了新型的Pascal图形架构设计，其图形处理芯片由3840个处理单元组成。该显卡可达到12万亿次浮点运算，是上一代处理速度的两倍。
在加州阿纳海姆举办的Siggraph图形技术会议上，Nvidia专门面向艺术家、设计师、漫画家发布了这款产品。公司表示，新的工作站显卡配合升级软件有效提升专业人士的工作效率和创造力。
同时，Nvidia还发布了360度视频软件开发工具包。开发人员可通过开发包创建虚拟现实应用程序，拼合生成360度4K视频。此外其可将图形图像渲染至电影画质。
本文分享地址：
热门产业关键词
据工信部网站消息，工信部、国家发改委、中国工程院三部门近日联合印发《发展服务型制造专项行动指南》，指南确定主要...
工信部和发改委近日联合发布了“2016年宽带中国”的示范城市名单，旨在向全国推广宽带升级的发展目标。...
美国《财富》杂志于北京时间20日晚发布2016年世界500强企业名单，中国两岸三地上榜企业增加4家至110家，仅次于美国稳1...
25日，工信部副部长冯飞在“2016年上半年工业通信业发展情况新闻发布会”上透露，将加大政策力度，确保目前工业趋稳的...
大品牌&买放心7天×24小时
400-086-5388
深圳运营中心：深圳市中研普华管理咨询有限公司华南运营总部：深圳市福田中心区深南中路东风大厦12层邮编：518031 >>
全国免费服务热线：400-856--5388 客户服务专线：6 06 96
可研报告、商业计划书：6
市场调研、营销策划：6
兼并重组研究：6
IPO上市咨询专线：6 29596 VC/PE咨询专线：6
产业园区咨询：6
媒体合作：6 广告合作：6 网站合作：6 邮箱：传真：8
咨询QQ：5336038
Copyright (C)
All Rights Reserved. 版权所有 (简称) 中研普华TM 旗下网站(北京时间日)
去年大概这时候，对外公布了一款面向移动工作站的显卡，使移动工作站能够支持头盔，谈论了关于“ Ready”计划，并在去年了基于Maxwell 2集成2048个CUDA(统一计算设备架构)流处理器的专业级显卡Quadro M5500。
Quadro系列显卡
不仅如此，去年英伟达了基于Pascal架构的三款VR-Ready产品，包括GeForce 、GTX 1070以及GTX
1060，另外，英伟达还了专门为虚拟现实准备的超级显卡Quadro P6000，它适用于大型3D CAD模型、医学成像以及照片级别的渲染等，同时支持GPGPU计算功能。
随着2017年虚拟现实市场继续发力，英伟达似乎在虚拟现实领域的布局也越来越“大手笔”，这不，近日，该公司又对外宣布，旗下三款P4000、GP 100以及P5000，其中P4000适用于大型3D CAD模型、医学成像、DCC等，而P5000则增加了3D医学成像和地震勘探，最后GP
100可用于对要求极高的渲染程序(例如 CC Premier Pro、After Effects、Autodesk
Maya、Nuke)等。其中，Quadro P6000的在3D CAD模型以及GPGPU支持方面会比P4000和P5000更加优秀。
目前，英伟达的P4000、GP 100以及P5000这款VR-Ready显卡主要面向娱乐、工程、建筑、医学、虚拟现实(VR)以及设计等领域，公司暂时还未公布相关的售价，只是发布了三款规格，并于2017年3月份上市，但具体时间未公布，(微信号：BDVRbbs)也将进一步跟进，请继续关注。& 英伟达将使用专业显卡同时运行4款军队级VR应用！ ...
查看: 273|回复: 0
UID8086299主题阅读权限50帖子精华0积分1717金钱7544 荣誉0 人气0 在线时间20398 小时评议0
Lv.5游侠白银会员, 积分 1717, 距离下一级还需 283 积分
帖子精华0积分1717金钱7544 荣誉0 人气0 评议0
　　大家应该知道，在PC端，想要体验好的VR应用那就得配置一台拥有强大性能的主机，如果将VR应用到军事领域也不例外，都需要一款强大的显卡处理器。
　　如果说，目前消费者级的VR体验已经能够用“很棒”来形容，那么，军队级的VR应用与AAA游戏，可能会让你找不到形容词来表达震撼。不过，这些更高级的VR应用需要的也是更强大，或者说更笨重的设备去运行，直到英伟达Quadro P6000显卡的出现——这款性能强大的显卡处理器，将能够在Oculus Rift或HTC Vive上同时运行4款顶级的VR虚拟器。
　　据英伟达的官方博客，在11月28日到12月2日期间举行的I/ITSEC展会上，将使用其Quadro P6000图形图像处理器同时运行由Mass Virtual公司开发的军队VR应用。届时，英伟达将分别在Oculus Rift、HTC Vive上运行四款不同的军队VR模拟器，以展示这颗显卡处理器强大的性能。
　　Quadro P6000采用与Tesla P100 同款的GP100，拥有完整的3840个流处理器，搭配24GB GDDR5X显存，不过价格高达7000美元，也不是一般人能玩的起的。
Powered by> 英伟达发布Quadro系列GPU
为新型超算工作站提供技术支持
英伟达发布Quadro系列GPU
为新型超算工作站提供技术支持
oNews4月19日消息（记者&费倩文）&风头正劲的人工智能公司英伟达（NVIDIA）日前在北京召开媒体沟通会，在会上向媒体展示了近期发布的一系列基于Pascal架构的Quadro系列GPU产品，能够将台式工作站转变为具有突破性能力的超级计算机。&目前随着人工智能、虚拟现实的发展，同时对于照片级真实感的画质的要求也越来越高，随之而来的则是对图形和计算性的要求也日益提高。而英伟达基于Pasca架构推出了Quadro系列正是基于这样的背景，性能可以达到上一代产品的两倍。&据NVIDIA专业可视化业务高级总监Sandeep Gupte介绍称，现在有了Quadro驱动的超算工作站之后，可以让数据足不出户，在自己桌面的工作站上可以实现可视化、仿真照片级的真实感和虚拟现实，而不需要把数据复制和来来回回地传送了。&Quadro Pascal(TM)架构视觉计算平台的优势，官方介绍体现在以下几个方面：&统一仿真、HPC、渲染和设计。GP100将双精度性能与16GB的高带宽内存（HBM2）相结合，因此用户可以在设计过程中进行仿真，并高速采集逼真的多物理场仿真。客户能够将两个GP100 GPU与NVLink技术相结合，并扩展到32GB的HBM2，以在单一工作站上创建庞大的可视化计算解决方案。&探索深度学习。GP100提供超过20 TFLOPS的半精度计算，是在Windows和Linux环境中进行深度学习的理想开发平台。 &将VR集成到设计和仿真工作流程中&。VR 认证的Quadro GP100和P4000具有创建详细、逼真、沉浸式环境的能力，能够大规模实现更加宏大、更加复杂的设计体验。&照片级真实感设计的优势&。基于Pascal(TM)架构的Quadro GPU 渲染照片级真实感图像的速度为CPU的18倍&。&创建广阔的可视化工作区。可在多达四个5K显示器上以高分辨率和HDR颜色显示数据。&经济高效地构建超高分辨率及多显示屏配置。通过将多达8个P4000 GPU和两个Quadro Sync II显卡相结合，可通过单一机箱实现多达32个4K显示器的配置。&Quadro GPU包括GP100、P4000、P2000、P1000、P600和P400，还有P。从P400开始，主要是做一些比较简单、小型的工作，像Office、Photoshop、AutoCAD等等这些简单的应用，然后随着不同的版本，可以做越来越大、越来越复杂的工作，一直到最强劲的GP100。&NVIDIA专业可视化业务高级总监Sandeep Gupte介绍称，GP100基于GPU Pascal的架构，用的是Quadro的算法，它也可以有不同的计算核心，无论是单精度还是双精度，都能够形成非常好的性能。像单精度，性能能够达到20 &TFLOPS，这个单精度性能对于深度学习意义非常重大。单精度性能可以达到10，双精度可以达到5 TFLOPS。还可以把2个GP100用NV LINK这个技术连起来使用。&另外，GP100有16 GB的内存容量，而且这16 GB是来自于高带宽内存，就是所谓的HBM2。另外，它支持的显示器分辨率也包括4K、5K，它也经过了VR认证。也就是说，可以在桌面去做VR。&GP100一卡全能，设计和仿真都能够实现，对于计算机辅助工程（CAE），训练计算机做深度学习，以及电影内容的创作、产品渲染或者建筑师渲染工作都非常有帮助。（完）
{{news.author}}
{{news.timeFormat}}
正在加载......让工作站化身超级计算机，英伟达发布新一代Quadro显卡10 months ago184收藏分享举报文章被以下专栏收录关注人工智能学术和技术实现推荐阅读{&debug&:false,&apiRoot&:&&,&paySDK&:&https:\u002F\\u002Fapi\u002Fjs&,&wechatConfigAPI&:&\u002Fapi\u002Fwechat\u002Fjssdkconfig&,&name&:&production&,&instance&:&column&,&tokens&:{&X-XSRF-TOKEN&:null,&X-UDID&:null,&Authorization&:&oauth c3cef7c66aa9e6a1e3160e20&}}{&database&:{&Post&:{&&:{&isPending&:false,&contributes&:[{&sourceColumn&:{&lastUpdated&:,&description&:&提供专业的前沿科技信息&,&permission&:&COLUMN_PUBLIC&,&memberId&:,&contributePermission&:&COLUMN_PUBLIC&,&translatedCommentPermission&:&all&,&canManage&:true,&intro&:&关注人工智能学术和技术实现&,&urlToken&:&jiqizhixin&,&id&:23235,&imagePath&:&v2-d50a7b9dbdd.jpg&,&slug&:&jiqizhixin&,&applyReason&:&0&,&name&:&机器之心&,&title&:&机器之心&,&url&:&https:\u002F\\u002Fjiqizhixin&,&commentPermission&:&COLUMN_ALL_CAN_COMMENT&,&canPost&:true,&created&:,&state&:&COLUMN_NORMAL&,&followers&:56219,&avatar&:{&id&:&v2-d50a7b9dbdd&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&activateAuthorRequested&:false,&following&:false,&imageUrl&:&https:\u002F\\u002Fv2-d50a7b9dbdd_l.jpg&,&articlesCount&:286},&state&:&accepted&,&targetPost&:{&titleImage&:&https:\u002F\\u002Fv2-df7716a6bae02df7a644f0b795ea2aea_r.jpg&,&lastUpdated&:,&imagePath&:&v2-df7716a6bae02df7a644f0b795ea2aea.jpg&,&permission&:&ARTICLE_PUBLIC&,&topics&:[,4401],&summary&:&英伟达今天发布了基于其最新的 Pascal 架构的新一代 Quadro 系列显卡。该公司宣称，新的芯片组可将桌面工作站转变成为具有突破性能力的超级计算机，为不同行业的专业任务提供保障。新的 Quadro 芯片组可以为设计、工程和有关虚拟现实以及深度学习的各种领域…&,&copyPermission&:&ARTICLE_COPYABLE&,&translatedCommentPermission&:&all&,&likes&:0,&origAuthorId&:0,&publishedTime&:&T15:05:51+08:00&,&sourceUrl&:&&,&urlToken&:,&id&:2228779,&withContent&:false,&slug&:,&bigTitleImage&:true,&title&:&让工作站化身超级计算机，英伟达发布新一代Quadro显卡&,&url&:&\u002Fp\u002F&,&commentPermission&:&ARTICLE_ALL_CAN_COMMENT&,&snapshotUrl&:&&,&created&:,&comments&:0,&columnId&:23235,&content&:&&,&parentId&:0,&state&:&ARTICLE_PUBLISHED&,&imageUrl&:&https:\u002F\\u002Fv2-df7716a6bae02df7a644f0b795ea2aea_r.jpg&,&author&:{&bio&:&欢迎关注我们的微信公众号：机器之心（almosthuman2014）&,&isFollowing&:false,&hash&:&06a67981ced7a2e9f85c&,&uid&:493500,&isOrg&:true,&slug&:&ji-qi-zhi-xin-65&,&isFollowed&:false,&description&:&国内领先的前沿科技媒体和产业服务平台&,&name&:&机器之心&,&profileUrl&:&https:\u002F\\u002Forg\u002Fji-qi-zhi-xin-65&,&avatar&:{&id&:&v2-dd115d399e55c37e13890e&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&isOrgWhiteList&:true,&isBanned&:false},&memberId&:,&excerptTitle&:&&,&voteType&:&ARTICLE_VOTE_CLEAR&},&id&:539173}],&title&:&让工作站化身超级计算机，英伟达发布新一代Quadro显卡&,&author&:&ji-qi-zhi-xin-65&,&content&:&\u003Cp\u003E英伟达今天发布了基于其最新的 Pascal 架构的新一代 Quadro 系列显卡。该公司宣称，新的芯片组可将桌面工作站转变成为具有突破性能力的超级计算机，为不同行业的专业任务提供保障。新的 Quadro 芯片组可以为设计、工程和有关虚拟现实以及深度学习的各种领域提供硬件支持。这些显卡可以构建企业级视觉计算平台，为用户简化设计和模拟工作流难度，与上一代产品相比，新的显卡速度最多可以提升两倍。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E「开发者们的专业工作流已经充斥着人工智能、虚拟现实和照片级图像处理任务，这对计算设备硬件提出了新的挑战，」英伟达专业可视化副总裁 Bob Pette 说道。「我们的新一代 Quadro 系列提供了解决这些挑战所需的图形和计算性能，通过统一计算和设计，Quadro GP100 可以将普通桌面工作站转换成为超级计算机。」\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cstrong\u003EQuadro Pascal 视觉计算平台特性\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E本次推出的新一代 Quadro GPU 型号包括 GP100、P4000、P2000、P1000、P600 和 P400。这些芯片具有以下特点：\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cul\u003E\u003Cli\u003E\u003Cp\u003E统一化的模拟、HPC、渲染和设计：GP100 结合了前所未有的高精度性能与 16GB 高带宽内存（HBM2）。同时，用户可以通过 NVLink 技术将两个 GP100 并联，在单个工作站上实现庞大的视觉计算解决方案。\u003C\u002Fp\u003E\u003C\u002Fli\u003E\u003Cli\u003E\u003Cp\u003E探索深度学习：GP100 提供超过 20 TFLOPS 的 16bit 浮点精度计算，使其成为在 Windows 和 Linux 环境中深度学习的理想开发平台。\u003C\u002Fp\u003E\u003C\u002Fli\u003E\u003Cli\u003E\u003Cp\u003EVR 设计和模拟工作流：新产品线中的 Quadro GP100 与 P4000 被标记为「VR Ready」，具有构建精细，沉浸式虚拟视觉环境的能力，可以提供庞大、复杂的交互设计体验。\u003C\u002Fp\u003E\u003C\u002Fli\u003E\u003Cli\u003E\u003Cp\u003E加快图像设计速度：基于 Pascal 的 Quadro GPU 能以 CPU18 倍的速度输出照片级的图像。\u003C\u002Fp\u003E\u003C\u002Fli\u003E\u003Cli\u003E\u003Cp\u003E更加宽广的视觉体验：在高达四个 5K 显示器上以高分辨率和 HDR 颜色显示数据。\u003C\u002Fp\u003E\u003C\u002Fli\u003E\u003Cli\u003E\u003Cp\u003E经济高效：通过组合 8 个 P4000 GPU 和两个 Quadro Sync II 卡，可通过单个机箱带动多达 32 个 4K 显示器。\u003C\u002Fp\u003E\u003C\u002Fli\u003E\u003C\u002Ful\u003E\u003Cbr\u003E\u003Cp\u003E最新的显卡完善了整个英伟达 Quadro Pascal 系列，该系列目前包括 2016 年 10 月发布的 P6000、P5000 以及移动 GPU。整个英伟达 Quadro Pascal 系统支持最新的 Nvidia CUDA 8 计算平台，为开发者获取开发工具中最新的 Pascal 特征、性能强化、包括 nvGraph 在内的新库提供便利。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E这些新推出的显卡中，最引人注目的自然是其中性能最强的 Quadro GP100。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E基于英伟达 GP102 GPU 完全版，Quadro P6000 是第一个 Pascal 系列的高端 Quadro 显卡。这是一个明显的改变，自从启用 Kepler 和 Maxwell 架构之后，英伟达 GPU 的产品战略已经发生了变化。英伟达最强大的 GPU 不再同时兼顾三方使用者：客户、工作站和服务器。相反，服务器（和更广阔的计算市场）已经大到将所有赌注都压在了以计算为中心的 GPU 上。所以出现了 Big Pascal——独特的 GP100，而英伟达的图形工具则仍基于更小更传统（但依然非常强大）的 GP102。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E因为英伟达 GPU 这种设计上的分裂，目前还不清楚这一专注计算的新 GPU 会适应英伟达的哪条产品线。Tesla 仍然是服务器卡的骨干，所以它不可能会出现在消费级的 GeForce 产品中。那么 Quadro 的市场会如何？它的前几代产品迎合了包括图形和计算两个市场的高端用户（也可能因为之前几代 GPU 带有混合用途的性质）。答案不言而喻，Big Pascal 毕竟已在 Quadro 家族占有一席之位。最值得玩味的是英伟达自己也叫它 Quadro GP100。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003EQuadro GP100 是基于英伟达 GP100 GPU 的显卡，但公司没有给出一个简单的说明，这很大程度上是因为 GP100 在英伟达 Pascal GPU 家族中的独特地位。一方面，Quadro GP100 回归到英伟达 Quadro 的产品线中。它是灵活的万金油，能做所有事情——图形和计算——包括 Tesla 显卡无法提供的功能，这些之前都是由 Quadro K6000 这样的显卡完成。另一方面，它不一定是英伟达最强大的工作站显卡：理论上说，其 FP32 \u002F图形性能低于 Quadro P6000。那么，Quadro GP100 将会以什么样的姿态融入英伟达的大家族？\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cfigure\u003E\u003Cnoscript\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-fb997b1f6_b.jpg\& data-rawwidth=\&678\& data-rawheight=\&381\& class=\&origin_image zh-lightbox-thumb\& width=\&678\& data-original=\&https:\u002F\\u002Fv2-fb997b1f6_r.jpg\&\u003E\u003C\u002Fnoscript\u003E\u003Cimg src=\&data:image\u002Fsvg+utf8,&svg%20xmlns='http:\u002F\u002Fwww.w3.org\u002FFsvg'%20width='678'%20height='381'&&\u002Fsvg&\& data-rawwidth=\&678\& data-rawheight=\&381\& class=\&origin_image zh-lightbox-thumb lazy\& width=\&678\& data-original=\&https:\u002F\\u002Fv2-fb997b1f6_r.jpg\& data-actualsrc=\&https:\u002F\\u002Fv2-fb997b1f6_b.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cbr\u003E\u003Cp\u003E虽然 Quadro GP100 和 Tesla\u002FGP100 系列听起来很像，但前者具有更多的功能。虽然英伟达提供 PCIe 接口的 Tesla P100 显卡，但它们只能在服务器上使用，仅支持被动冷却；缺乏主动冷却意味着你不能把它们应用于常规工作站中。与之相反，Quadro GP100 是传统形式带有风扇和散热片的显卡，同时英伟达也将 Tesla 系列不具有的图形计算功能加入到了 GP100 中。这或许可以解释为什么英伟达没有使用专业显卡 P 系列的命名——转而将其放在 GPU 系列之下。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cfigure\u003E\u003Cnoscript\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-bd4e600aa1eec7075661_b.jpg\& data-rawwidth=\&905\& data-rawheight=\&798\& class=\&origin_image zh-lightbox-thumb\& width=\&905\& data-original=\&https:\u002F\\u002Fv2-bd4e600aa1eec7075661_r.jpg\&\u003E\u003C\u002Fnoscript\u003E\u003Cimg src=\&data:image\u002Fsvg+utf8,&svg%20xmlns='http:\u002F\u002Fwww.w3.org\u002FFsvg'%20width='905'%20height='798'&&\u002Fsvg&\& data-rawwidth=\&905\& data-rawheight=\&798\& class=\&origin_image zh-lightbox-thumb lazy\& width=\&905\& data-original=\&https:\u002F\\u002Fv2-bd4e600aa1eec7075661_r.jpg\& data-actualsrc=\&https:\u002F\\u002Fv2-bd4e600aa1eec7075661_b.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cbr\u003E\u003Cp\u003EQuadro GP100 面向不同用户。对于那些需要一台适合 GP100 显卡工作站的计算机用户来说，Quadro GP100 就是他们的选择。它能提供所有 GP 100 的核心功能，包括 ECC 存储器，半速 FP64，倍速（打包）FP 16 指令集。另外一个杀手锏就是，Quadro GP100 为 PCIe 引入了一个新的 NVLink 连接器，能让一对 Quadro 在一种双向 NVLink 配置中连接起来，这样 PCIe 就有了低延迟数据传输的好处，也可以接入 NVLink 存储器。很显然，这是目前 Tesla PCIe 显卡所不具备的。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E正如英伟达所言，这款产品会很受计算机用户欢迎，他们对此很有信心，理由也很充分。Tesla P100 已经成了神经网络程序员中的抢手货，现在，研究人员们又有了适合工作站的显卡。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E与此同时，该产品的第二市场也是传统的高端 CAD\u002FCAE 市场。对于那些需要快速 FP64 性能和 ECC 存储器的工作站显卡（为了实现最大的精确性和可靠性）的特别用户来说，Quadro GP100 是第一个自 K6000 后提供此种功能的 Quadro 显卡。可以说，这是一个利基市场，因为几乎所有的 CAD 用户都不需要那种可靠性，但是，对于那些从事复杂工程模拟之类工作的用户来说，这个产品非常具有吸引力（更别提这是英伟达的又一个利润市场了）。满足这一市场需求也让 Quadro GP100 显得与众不同，因为这是唯一的一款开启图形功能的 GP100 显卡。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E不过，当涉及到图形工作载荷时，Quadro GP100 和 P 6000 之间的区别就变得很模糊了。Quadro P6000 能够达到 12Tflops 的 FP32，而 GP 100 的描述是「大于 10 Tflops」, 同样 Quadro GP100 的纹理吞度量大约能达到这个数字的 83%。当然，纸面性能并非全部，但是，在纯信号吞吐限制场景下，P6000 的速度会更快。这也是更加紧凑（以及可制造）GP102 较之庞大的 GP100 的优势所在。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cfigure\u003E\u003Cnoscript\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-c6a65f63a03a1057cac332ecc8bb2834_b.jpg\& data-rawwidth=\&1034\& data-rawheight=\&609\& class=\&origin_image zh-lightbox-thumb\& width=\&1034\& data-original=\&https:\u002F\\u002Fv2-c6a65f63a03a1057cac332ecc8bb2834_r.jpg\&\u003E\u003C\u002Fnoscript\u003E\u003Cimg src=\&data:image\u002Fsvg+utf8,&svg%20xmlns='http:\u002F\u002Fwww.w3.org\u002FFsvg'%20width='1034'%20height='609'&&\u002Fsvg&\& data-rawwidth=\&1034\& data-rawheight=\&609\& class=\&origin_image zh-lightbox-thumb lazy\& width=\&1034\& data-original=\&https:\u002F\\u002Fv2-c6a65f63a03a1057cac332ecc8bb2834_r.jpg\& data-actualsrc=\&https:\u002F\\u002Fv2-c6a65f63a03a1057cac332ecc8bb2834_b.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cbr\u003E\u003Cp\u003E这里，一个出其不意的设计是 HBM2 存储器以及相关的 ROPs。英伟达正在专门兜售 Quadro GP100，在合适的适用场景下，能提供最快的诠释性能。英伟达并没披露 Quadro GP100 的官方存储频率，不过，如果类似 Tesla 对应的产品，那么，每秒达 720G，Quadro P6000 仅达每秒 432G。加上 ROP 计数上的优势——英伟达仍然没有披露 GP100 的 ROP 计数，不过，根据我们对 GP102 架构的了解，128ROP 的猜测是靠谱的——而且，Quadro GP100 纯像素处理能力要比 P6000 强劲 60%。考虑到 CAD\u002FCAE 任务非常依赖于像素处理能力，对于某些 Quadro 用户来说，这是一个摸得到的优点。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E它的一个缺点是存储容量。虽然由于 GDDR5X 更好的实际容量 Quadro P6000 能提供 VRAM 24 GB，但和所有的 GP100 产品一样，Quadro GP 100 最多是 HBM2 16GB。\u003C\u002Fp\u003E\u003Cp\u003E这意味着对大数据集用户而言，单个 Quadro GP100 是好的选择，只是比 P6000 能获得的容量更小一点。值得一提的是，英伟达正在兜售 NVLink 帮助解决容量问题，但或许这种问题根植于计算，而非图显中。\u003C\u002Fp\u003E\u003Cfigure\u003E\u003Cnoscript\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-fa308ede1e7_b.jpg\& data-rawwidth=\&678\& data-rawheight=\&183\& class=\&origin_image zh-lightbox-thumb\& width=\&678\& data-original=\&https:\u002F\\u002Fv2-fa308ede1e7_r.jpg\&\u003E\u003C\u002Fnoscript\u003E\u003Cimg src=\&data:image\u002Fsvg+utf8,&svg%20xmlns='http:\u002F\u002Fwww.w3.org\u002FFsvg'%20width='678'%20height='183'&&\u002Fsvg&\& data-rawwidth=\&678\& data-rawheight=\&183\& class=\&origin_image zh-lightbox-thumb lazy\& width=\&678\& data-original=\&https:\u002F\\u002Fv2-fa308ede1e7_r.jpg\& data-actualsrc=\&https:\u002F\\u002Fv2-fa308ede1e7_b.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cbr\u003E\u003Cp\u003E除了 GPU 底层，Quadro GP100 集成了 Quadro 系列硬件所有典型的特征。这包括 4 DisplayPort 的 1.4 端口、显示输出的单个 DVI 端口，英伟达也把它分类为 VR Ready 系列产品。同时，显卡后方是 Quadro Sync 和 Stereo 连接器（connectors) 分别进行同步更新与四倍缓冲立体（quad-buffered stereo）。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E同今天发布的其他 Quadro 显卡一样，英伟达希望 Quadro GP100 能赶在今年三月份发货。目前价格尚未确定，据悉它的价格将会比 Quadro P6000 稍微高一些。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cb\u003E机器之心报道\u003C\u002Fb\u003E\u003C\u002Fp\u003E&,&updated&:new Date(&T07:05:51.000Z&),&canComment&:false,&commentPermission&:&anyone&,&commentCount&:39,&collapsedCount&:0,&likeCount&:184,&state&:&published&,&isLiked&:false,&slug&:&&,&isTitleImageFullScreen&:true,&rating&:&none&,&titleImage&:&https:\u002F\\u002Fv2-df7716a6bae02df7a644f0b795ea2aea_r.jpg&,&links&:{&comments&:&\u002Fapi\u002Fposts\u002F2Fcomments&},&reviewers&:[],&topics&:[{&url&:&https:\u002F\\u002Ftopic\u002F&,&id&:&&,&name&:&NVIDIA （英伟达）&},{&url&:&https:\u002F\\u002Ftopic\u002F&,&id&:&&,&name&:&深度学习（Deep Learning）&},{&url&:&https:\u002F\\u002Ftopic\u002F&,&id&:&&,&name&:&显卡&}],&adminClosedComment&:false,&titleImageSize&:{&width&:1920,&height&:1080},&href&:&\u002Fapi\u002Fposts\u002F&,&excerptTitle&:&&,&column&:{&slug&:&jiqizhixin&,&name&:&机器之心&},&tipjarState&:&inactivated&,&annotationAction&:[],&sourceUrl&:&&,&pageCommentsCount&:39,&hasPublishingDraft&:false,&snapshotUrl&:&&,&publishedTime&:&T15:05:51+08:00&,&url&:&\u002Fp\u002F&,&lastestLikers&:[{&bio&:null,&isFollowing&:false,&hash&:&3a8f16ac84e77661dcfbbbdb45bf28cf&,&uid&:034200,&isOrg&:false,&slug&:&ma-pei-run&,&isFollowed&:false,&description&:&&,&name&:&请叫我绿贱君&,&profileUrl&:&https:\u002F\\u002Fpeople\u002Fma-pei-run&,&avatar&:{&id&:&v2-672d77f33e681da58fd2d06ed613c5c5&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&isOrgWhiteList&:false,&isBanned&:false},{&bio&:null,&isFollowing&:false,&hash&:&ddbdcd72bed&,&uid&:769000,&isOrg&:false,&slug&:&ye-lu-da-shi-54&,&isFollowed&:false,&description&:&&,&name&:&耶律大石&,&profileUrl&:&https:\u002F\\u002Fpeople\u002Fye-lu-da-shi-54&,&avatar&:{&id&:&da8e974dc&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&isOrgWhiteList&:false,&isBanned&:false},{&bio&:&&,&isFollowing&:false,&hash&:&c4dd690eae138ad5c1e066a&,&uid&:72,&isOrg&:false,&slug&:&benyi-lin&,&isFollowed&:false,&description&:&&,&name&:&benyi lin&,&profileUrl&:&https:\u002F\\u002Fpeople\u002Fbenyi-lin&,&avatar&:{&id&:&da8e974dc&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&isOrgWhiteList&:false,&isBanned&:false},{&bio&:&研发工程师&,&isFollowing&:false,&hash&:&fcba0d532b009dade0b20&,&uid&:52,&isOrg&:false,&slug&:&long-gang-62-42&,&isFollowed&:false,&description&:&&,&name&:&隆刚&,&profileUrl&:&https:\u002F\\u002Fpeople\u002Flong-gang-62-42&,&avatar&:{&id&:&335f661c417aa87311ccf&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&isOrgWhiteList&:false,&isBanned&:false},{&bio&:&The Ultimate Online Game Platform&,&isFollowing&:false,&hash&:&bdcbc3f42dabaf2f6e96c818&,&uid&:253800,&isOrg&:false,&slug&:&steampowered&,&isFollowed&:false,&description&:&Steam guarantees instant access to more than 1,800 game titles and connects its 35 million active users to each other—and to us. Through Steam, fans can easily buy, play, share, modify, and build communities around Valve products as well as titles from other independent game studios. Steam is available in 237 countries and 21 different languages.&,&name&:&Steam Powered&,&profileUrl&:&https:\u002F\\u002Fpeople\u002Fsteampowered&,&avatar&:{&id&:&v2-d4defb20d49&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&isOrgWhiteList&:false,&isBanned&:false}],&summary&:&\u003Cimg src=\&http:\u002F\\u002Fv2-fb997b1f6_200x112.png\& data-rawwidth=\&678\& data-rawheight=\&381\& class=\&origin_image inline-img zh-lightbox-thumb\& data-original=\&http:\u002F\\u002Fv2-fb997b1f6_r.png\&\u003E英伟达今天发布了基于其最新的 Pascal 架构的新一代 Quadro 系列显卡。该公司宣称，新的芯片组可将桌面工作站转变成为具有突破性能力的超级计算机，为不同行业的专业任务提供保障。新的 Quadro 芯片组可以为设计、工程和有关虚拟现实以及深度学习的各种领域…&,&reviewingCommentsCount&:0,&meta&:{&previous&:{&isTitleImageFullScreen&:false,&rating&:&none&,&titleImage&:&https:\u002F\\u002F50\u002Fv2-9ca6c68fa3ae7eeaddcb532fae56abbe_xl.jpg&,&links&:{&comments&:&\u002Fapi\u002Fposts\u002F2Fcomments&},&topics&:[{&url&:&https:\u002F\\u002Ftopic\u002F&,&id&:&&,&name&:&科学&},{&url&:&https:\u002F\\u002Ftopic\u002F&,&id&:&&,&name&:&人工智能&},{&url&:&https:\u002F\\u002Ftopic\u002F&,&id&:&&,&name&:&机器学习&}],&adminClosedComment&:false,&href&:&\u002Fapi\u002Fposts\u002F&,&excerptTitle&:&&,&author&:{&bio&:&欢迎关注我们的微信公众号：机器之心（almosthuman2014）&,&isFollowing&:false,&hash&:&06a67981ced7a2e9f85c&,&uid&:493500,&isOrg&:true,&slug&:&ji-qi-zhi-xin-65&,&isFollowed&:false,&description&:&国内领先的前沿科技媒体和产业服务平台&,&name&:&机器之心&,&profileUrl&:&https:\u002F\\u002Forg\u002Fji-qi-zhi-xin-65&,&avatar&:{&id&:&v2-dd115d399e55c37e13890e&,&template&:&https:\u002F\\u002F{id}_{size}.jpg&},&isOrgWhiteList&:true,&isBanned&:false},&column&:{&slug&:&jiqizhixin&,&name&:&机器之心&},&content&:&\u003Cblockquote\u003E\u003Cp\u003E\u003Cem\u003E在阿西莫夫的《基地》系列科幻小说中，天才哈里·谢顿几乎完美地预测了银河帝国的衰落和之后相当长一段时间的发展。随着近年来机器学习技术的兴起，基于数据的预测在搜索引擎、定向广告和个性化推荐等许多特定的应用领域取得了很大的发展成果，但在更加广泛的科学发现预测、政治预测、社会事件预测乃至人类文明发展的预测上，机器学习还能实现同样的成就吗？而今天我们又已经在这些领域走到哪一步了呢？今日，Science 推出了一个关于「预测（prediction）」的专题，通过多篇文章解读了上述多个领域的研究进展和面临的挑战。机器之心选择了其中几个主题进行了详细编译，其余的则进行了一些摘要介绍 (篇幅限制没有列出参考文献）。想要更详细了解该专题内容的读者可参阅：\u003Ca href=\&https:\u002F\\u002F?target=http%3A\u002F\u002Fscience.sciencemag.org\u002Fcontent\u002F355\u002F6324\& class=\& wrap external\& target=\&_blank\& rel=\&nofollow noreferrer\&\u003ETable of Contents - February 03,
(6324)\u003Ci class=\&icon-external\&\u003E\u003C\u002Fi\u003E\u003C\u002Fa\u003E\u003C\u002Fem\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003C\u002Fblockquote\u003E\u003Cp\u003E\u003Cstrong\u003E序言\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E人类从远古时代通过萨满烟熏内脏的方式开始就一直不断尝试着预测未来。正如本专题所探讨的，预测现在是一门高速发展的科学。该文章探讨了如下问题：怎样分配有限的资源、一个国家是否会陷入冲突中、谁将有可能赢得选举或发表一篇影响巨大的论文以及在这样一个新兴领域中如何建立标准。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E社会科学家和机器学习社区正在学习新的分析工具，从而从乱糟糟的数据中分离出真正有意义的模式。新工具是令人兴奋的，但是如果只是使用框架上的软件包而没有完全去理解它，那么就会导致一些灾难。这一专题的几位作者描述了平衡机器学习方法和人类因素的现实目标的重要性。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E在 20 世纪 50 年代，著名作家艾萨克·阿西莫夫想象了心理史学的图景，其中计算机可以通过庞大的数据集预测帝国的兴亡。现在科学还不能完全做到这样，就像上一次美国大选那样。新闻报道和相关的报告也都描述了最新的科学技术进展，科学家们也相信随着方法的改进和验证数据源的增长，选举和其他社会实践将变得越来越可以预测。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E当在多学科交叉领域中努力解决问题时，如将人类对语义的理解和能处理 TB 级数据的算法结合起来，成功似乎将会到来。研究人员可能仍然远远不能做出政策制定者所期望精度的预测，但是他们现在能够预想的情景能帮助塑造一个更好的未来。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cstrong\u003E一、预测武装冲突：是时候调整我们的期望了吗？\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cblockquote\u003E\u003Cp\u003E\u003Cem\u003E摘要：这篇文章介绍了预测政治暴力（political violence）的一般性挑战，特别是相比于其它类型的事件（比如地震）的挑战。什么是可能的？什么又不太现实？我们的目标是揭穿关于预测暴力的神话，以及说明这一领域的实质进展。\u003C\u002Fem\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003C\u002Fblockquote\u003E\u003Cp\u003E如果「大数据（big data）」可以帮助我们找到合适的合作伙伴、优化酒店房间的选择和解决许多其它日常生活中的问题，那么它也应该能够通过预测致命冲突的未来爆发来拯救生命。这是许多将机器学习技术应用于来自互联网和其它来源的新且大规模的数据集的研究者的希望。鉴于世界上仍还有政治暴力所带来的苦难和不稳定，这一愿景是冲突研究者在政策影响和社会控制上的终极前沿。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E话虽如此，但在学术的冲突研究上，预测仍然是非常有争议的。仅有相对很少的冲突专家尝试过明确的冲突预测。此外，还没有建好的早期警报系统可以作为决策的可靠工具，尽管目前已经有一些重大努力了。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E近年来，我们已经看到了一系列想要填补这一空白的文章出现，它们利用了大规模数据收集和计算分析领域内的最新进展。这些研究中的任务是预测在给定的国家和年份是否有可能发生国际或国内的冲突，并借此创建全球暴力冲突的年度「风险地图（risk maps）」。最开始的预测模型基于当时政治学领域新兴的定量方法（quantitative methodology）且依赖于简单的线性回归模型。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E但是，人们很快就认识到这些模型无法捕获冲突预测的多变影响和复杂的相互作用。这种认识导致了机器学习技术的引入，比如神经网络，这是一种持续至今的分析趋势。在这些模型中，生成暴力后果的风险因素的互动是从数据中归纳式地推断出来的，而且这个过程通常需要高度复杂的模型。今天，冲突预测工作的主要主要部分仍然是在年度上的国家层面分析，也有一些研究已经将其预测的时间范围推至了未来数十年。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E最近，新的可用数据和改进过的模型让冲突研究者可以理清政治暴力的时空动态（temporal and spatial dynamics）。其中一些研究可以给出月度或日度的预测。这样的时间划分需要修正已有预测模型。比如说，在 [5] 中提出的方法基于以色列-巴勒斯坦冲突的冲突事件数据。该分析使用一个区分高强度和低强度冲突的模型，基于 1996 年到 2009 年的数据生成了 2010 年的预测。另一些方法的目标是利用新类型的预测器（predictor），比如战争相关新闻报道。因为它们能够以远远更高的时间频率上扑捉到政治紧张，这些报道被证明是比传统的结构变量（structural variables，如民主的水平）更强大的战争发生预测器。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E其它研究则在尝试探索暴力的地方性变化（subnational variation），不仅试图预测冲突将在何时发生，更要预测会在何地发生。空间分解（spatial disaggregation）可以让冲突预测按行政单位产生，比如区或市或任意基于网格的位置。这一领域已有的研究重点是特定的国家和冲突。比如 Weidmann 和 Ward 为波斯尼亚的内战生成了市级水平的预测，如图 1 所示。另外也有为非洲的空间网格单元（spatial grid cells）得到的类似的暴力预测。同样，空间预测模型的复杂性的跨度可以非常大，从空间回归模型到更灵活但也更复杂的机器学习模型。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cfigure\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-bb19d34fa3c5e391bd5aa1_b.jpg\& data-rawwidth=\&1280\& data-rawheight=\&654\& class=\&origin_image zh-lightbox-thumb\& width=\&1280\& data-original=\&https:\u002F\\u002Fv2-bb19d34fa3c5e391bd5aa1_r.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cem\u003E图 1. 波斯尼亚市级水平的内战暴力预测。（左图）1995 年 6 月在 7 个市级单位实际发生的暴力事件（暗红）。（右图）[7] 中描述的时空模型预测到的暴力（淡红）。画有斜纹的图案表示不正确的预测。尽管有 4 个市级单位的冲突得到了正确的预测，但该模型还是错过了 3 个实际发生的冲突，并错误地预测了 4 个市级单位会发生暴力。而且正如大多数冲突预测案例一样，许多区域仍然是和平的而且也符合预测（以灰色表示）。\u003C\u002Fem\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cstrong\u003E预测的愿景和陷阱\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E很显然，在冲突预测领域确实出现了一些可观的进步。使用明确的和客观的统计标准，更新的方法比传统的解释性模型实现更高水平的样本外准确度（out-of-sample accuracy）。和过去的暴力案例的因果解释相反，样本外预测（out-of-sample forecasting）可以实现不用于拟合模型的事件预测。依赖于先进的定量技术的研究者也取得了具体的预测成功。比如，在 Political Instability Task Force 委托的一份报告中，Ward 及其团队提前 1 个月预测了泰国 2014 年 5 月 7 日的军事政变。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E此外，在解决罕见事件预测的挑战上也取得了一些进步。标准的、现成可用的机器学习模型通常适用于不同的输出之间相对平衡的问题。而暴力与和平的预测却并不是这样的问题，其中大部分时间所检查到的单元都是和平的。这个问题可以通过不同的重采样（resampling）技术来解决，这能实现该模型的远远更高的整体预测准确度。Muchlinski 等人应用这样技术在 2001 到 2014 年的样本上预测了内战。他们的模型正确地预测了 20 次内战中的 9 次，而传统的回归模型没有预测正确。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E该文献还表明以样本外预测（out-of-sample prediction）为重心有助于防止包含进可能会恶化预测表现的解释性的长列表。更一般而言，这样的分析也是一个有用的提醒：过去事件和未来事件预测的因果解释是不同但相关的实证表现的标准。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E尽管有这样的进展，但要说能拯救生命的冲突预防（conflict prevention）已经马上就能实现还是过于乐观。此外，这一领域还远远没有达到民意调查机构和经济预测机构所能接受的政策影响。为什么会这样呢？\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E也许最严重的问题在于在完全认识围绕和平与冲突的根本复杂性上的普遍失败。与相对结构化的机构决策设置（institutional decision-making settings，如在微观层面上的投票和消费者行为）相反，冲突过程通常包含一个难以处理的施动因素（actor）集合，这些施动因素以一种让人惊讶的而且从定义上打破规则的方式交互。这些情形可通过基本和固有的复杂性进行特征化，其允许的是实现「模式预测（pattern prediction）」而不是准确的特定事件的经验预测。在缺乏充分了解所有理论上的组件的交互方式以及缺乏足够用于测量相关变量的数据的情况下，我们所能希望的只有在能增加冲突的概率的结构特征的基础上的风险评估（risk assessment）。因此，至少在宏观层面上，要根据之前在稍不复杂的领域（如台球、行星运动或交通系统、）或更简单的政治环境（如选举竞争）上的成功来确定未来预测的表现是无效的；在这些更简单的问题中，理论原理得到了广泛的了解，而且相关事件发生的频率也很高。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E即便神经网络这样的机器学习技术能在底层数据捕捉非线性，但是地缘政治的变化改变了如国家及其边界这样的分析单位，这种改变带来了一个更基本的挑战，尤其是对于长期宏观预测来说。大多数宏观模型倾向于跟踪一组给定的现有状态到未来的属性，而忽略了领土变化的可能性，比如分裂与统一。然而，正如前苏联和南斯拉夫冷战结束带来的变化所展现的那样，这些国家的国家层面上的数据几乎没有为冷战结束后的预测提供指导。地域的变化之外，这些隐含的恒常性假设更普遍地适用于单位和因果机制效应之间的互动。这个问题阻碍了「交叉验证」的使用，这种方法会将数据集分成若干部分，其中一些是用来「训练」预测算法，还有一些是作为「抵抗（holdout）」部分，后面会用来测试算法。在一些将历史切成碎片这种做法的情况下，关于长期趋势的有价值信息会丢失，因为这种方法打乱了历史时期，把它们看成了是等效的（equivalent）。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E数据质量进一步阻碍了政治暴力预测的进展。与台球或行星运动轨迹不同，测量冲突的发生、地点和时间要难得多，而且这些预测与相当大的不确定性有关。对于许多暴力的决定因素，如经济状况，类似的问题也同样存在。即使在过去事件的统计解释测量上误差不是个问题，但它仍然对未来暴力行为的预测构成了挑战，同时还常常会降低暴力发生地点和时间预测的置信度。如果暴力测量结果与一个或更多的预测指标变量呈现系统性相关，那么会产生类型更多的严重错误。因为政治暴力往往是从新闻文章这样的次要来源（如新闻文章）编码而来的，所以高水平地暴力观察可能是源于高水平的实际暴力或者概率更高的报道（或者两者都是）。这使得预测很困难。扩大数据集——如在使用自动事件编码的几个项目中——可能加剧这一问题，因为它同样依赖次级来源。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E即便在预测研究上的最近进展很有前景，我们还是要警告从理论和政策上高估其重要性的倾向。如上面所讨论，样本外预测有助于理论建设，但是，这并不意味着有效的解释必须始终是预测性的。根据达尔文的理论，一些高度依赖路径的过程只允许特定情况下的事后解释。鉴于冲突过程的复杂性特征，特别是在宏观层面，这样的解释仍然可以提供关于具体机制和政策有效性的关键信息。此外，将预测表现作为唯一有效的经验评估标准是不明智的，特别是在预测模型非常复杂和不透明，以至于尚不清楚预测成功的驱动因素是什么的情况下。例如，模型集合上的贝叶斯平均是一种优雅归纳技巧，它从竞争模型中汇聚了大量数据，但除非理顺理论上的问题，否则整体结果可能只不过是理论上的黑箱而已。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E做政策相关的预测需要谨慎的原因研究还有一些。学者们给出的预测通常都假设政策制定者最要想要的是预测性的风险评估，因为这些东西能让他们通过配置预防性资源和干预减少潜在冲突。然而，这些希望假定了政策干预的效用已被广为人知。事实上，无理论的预测在不了解冲突的驱动因素的情况下很少能指导干预。因此，谨慎执行政策分析评估冲突减少措施带来的因果效用是有效政治宏观预测的先决条件。考虑到获得关键社会指标的可靠信息是有困难的，尤其在发展中国家，在许多情况下，一些基本描述和解释建模可能比预测更迫切需要。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cstrong\u003E推荐\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E有许多方法可以改善现有的冲突预测工作，例如，涉及到方法论和结果的沟通。在一些情况下，这需要更多用户友好的方式来呈现结果，比如报告现有和预测的趋势，而不仅仅是基于花哨估计技术的接收者操作特征（receiver operating characteristic，ROC）曲线。透明性还要求关于采样周期的关键假设和不确定性测量在多个场景中基于备选假设的情况下能被明确陈述和经过鲁棒性测试。否则，研究者的错误估计可能会传达一种错误的确定感。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E为了评估新方法的附加值，分析师们需要更好地比较他们从复杂的预测机制中得出的预测与简单的基线模型。它最纯净的形式，比如一个基线模型，能简单地预测出过去没有给现在带来变化。例如，Lim 等人用一个基于 agent 的复杂模型预测了前斯拉夫种族暴力的位置。虽然该模型的预测精度乍一看令人印象深刻，进一步的检查发现，这种表现与一个在地图上随机标出暴力事件（塞尔维亚和黑山共和国除外）的模型差不多。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E最终，在政治暴力这个问题上，希望大数据通过某种无理论的「蛮力」产生某种有效的预测是错误的想法。自动的数据提取算法，比如基于社交媒体的网页抓取和信号探测，可能会加剧政治紧张局势，但这并不意味着这些算法能以较高的时空精度预测低概率冲突事件。只有研究人员考虑到数据质量和代表性的局限性，大型自动编码的数据集才能发挥用处。这样一来，团队工作的人类「超级预测员」仍然能在一般政治事件预测上击败的不仅是更专业的专家，还包括预测市场和其他自动化的方法就不足为奇。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E总体上看，我们坚决相信冲突预测非常有用，也值得投入研究。但是，未来的预测研究需要识别由人类系统的大量历史复杂性与偶然性导致的内在局限。如冷战的结果和更多的最近历史事件表面，像「英国退欧」和「特朗普大选胜利」这样的历史性「事件」经常会讽刺脱离语境的样本外的推算（out-of-sample extrapolation）。讨论经济发展长期预测的难度时，Milanovic 提醒我们「可以也确实会改变的变量数量，历史中（『自由意志』）人物的角色」，以及战争和自然灾害的影响是如此之大，以至于即使是一代人中最优秀的头脑所作出的大趋势预测也很少正确。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E然而，同时，时空范围更有限的预测——例如预测的一个给定的处于内战的城市的短期暴力轨迹——是完全可能的，因为它们不太可能受到这些发展的影响。因此，该领域的挑战是，要在社会和政治世界固有的复杂性与我们准确预测政治暴力的能力的相关局限之间找到一个平衡点。最近收集冲突事件的非总体和空间直观（spatially explicit）的数据加快了，结果表明，在有限的时空半径内，政策相关的预测是可行的，同时潜在用处也非常大。然而，超出这些限制，大量的理论和经验的不确定性往往压倒了预测的尝试。在这样的情况下，在生成可能的情景这个任务上，预测建模作为一种启发式工具，而不是作为具体政策建议的生产工具，或许会更有用。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cstrong\u003E二、科学学领域中基于数据的预测研究\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E摘要：想要预测发现的愿望——提前知道将由谁在何时何处发现什么，几乎渗透了现代科学的所有方面：从个人科学家到出版商，从资助机构到招聘委员会。本文调查了「科学的科学（science of science，科学学）」的新兴和跨学科领域，以及使我们得知科学发现的可预测性的因素。而后我们将讨论改进源自科学的科学的未来机遇及科学社区中积极和消极的潜在影响。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E想要预测发现的愿望——提前知道将由谁在何时何处发现什么，几乎渗透了现代科学的所有方面：从个人科学家到出版商，从资助机构到招聘委员会。本文调查了「科学的科学（science of science，科学学）」的新兴和跨学科领域，以及使我们得知科学发现的可预测性的因素。而后我们将讨论改进源自科学的科学的未来机遇及科学社区中积极和消极的潜在影响。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E目前，对预测发现——对何人何时何地发现何物提前有些想法——的渴望几乎遍及现代科学的所有方面。个人科学家通常预测哪些研究问题或课题会是有趣的、有影响力的，并且可获得资金支持。出版商和资助机构评估手稿或项目意见书时，部分是通过预测其未来的影响力进行的。员工招聘委员会也会预测哪些候选人员会在其职业生涯中作出重要的科学贡献。对于通过税费资助大部分科学研究的社会大众来说，预测也是重要的。我们能使科学发现过程更有可预测性，就能将资源更高效地用于推动有价值的技术、生物医学和科学方面的进步。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E尽管存在这种普遍的需求，我们对如何发现的理解仍然是局限的，并且个人、出版商、资助机构或招聘委员会做出的预测中相对来说极少是通过科学方式做出的。那么，我们如何能知晓哪些是可以预测的，哪些是无法预测的？尽管将发现与发现者相分离会存在困难，但该论文的首要关注点是科学的科学：为科学性地理解导致科学发现的社会过程（social processes）而进行一种跨学科工作。（是为了对科学哲学的现时思考及科学家如何在个别科学挑战方面取得进展，请看（1）\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E这种预测发现的兴趣可以向前追溯近 150 年，一直追溯到哲学家 Boleslaw Prus () 和经验主义学派的社会学家 Florian Znaniecki () 的作品。特别是 Znaniecki，在其倡议下，设立了对科学社会进程的数据导向研究。在 20 世纪的大部分时间里，该目标进展缓慢，部分是由于好数据难获取，且大部分人满足于专家评判。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E今天，科学圈是一个巨大而又多变的生态系统，包含着数以百计的互相关联的研究领域，数以万计的研究人员和每年层出不穷眼花缭乱的新结果。这样惊人的体量和复杂度进一步扩大了对科学的科学研究的呼声并激发了对这种类型测量量化方法的研究，比如对过去成果的引用、新成果的产生、职业生涯轨迹、资金赞助、学术奖励等等。数字技术使得这些信息的生成量巨大，而研究人员则正在开发新的强大的计算工具来分析这些信息。举个例子，为了自动量化某些专业科学问题研究的进展，自动提取和分类论文中的相关内容。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E目前普遍认为，通过挖掘这些信息所得到的预测远比专家的意见更为客观精确。书目数据库和在线平台——比如，Google Scholar、PubMed、Web of Science、JSTOR、ORCID、EasyChair、和「altmetrics,」——正在使研究人员对科学进展的深入洞见进入一个新的时代。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E这些努力也带来了一个引人争议的问题：我们最终能够预测重要的发现和它们的发现者吗？就像 Yoshinori Ohsumi 的诺贝尔奖——对动物细胞的自我吞噬系统的相关工作。我们还不知道答案，但这项工作肯定会使我们在科学研究这一社会活动的理解上更进一步。举个例子，一些科学发现是很容易被预测的（图.1）。随着理论和证据的累积，很明显一个发现将迫在眉睫，就像一幅拼图中间就缺了那一小块一样。人类基因序列的确定和引力波的观测就是这种发现的很好例子。另一方面，一些发现似乎不可能被预测，因为它们可能代表了促使我们重新思考整个问题的那一小块拼图或者是发现了正在发掘的那一部分的新用法。尽管隐喻着这样的关键创新的小块有时是当下显而易见的，就像基因编辑技术，而有时这些隐喻又需要时间以使得其余的相关部分进入我们的视野，就像青霉素（第一种抗生素）的例子，我们用了 15 年才实现它。\u003C\u002Fp\u003E\u003Cfigure\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-97db63b155c51d424f60c4f508f006e4_b.jpg\& data-rawwidth=\&1280\& data-rawheight=\&534\& class=\&origin_image zh-lightbox-thumb\& width=\&1280\& data-original=\&https:\u002F\\u002Fv2-97db63b155c51d424f60c4f508f006e4_r.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cem\u003E图 1：多意外才能算是一项发现？\u003C\u002Fem\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E科学发现在相对于它们各自的已知知识的不可预见性这一问题上而各有不同。为了说明这一观点，我们把 17 个主要科学发现的例子从完全无法预计（如抗生素、基因编辑技术、以及宇宙微波背景辐射）到可以预知（如引力波、DNA 的结构、人类基因的编码）进行排列。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E通过使用已发表成果以及科学生涯中的现代数据，科学学的研究人员们已经开始定义一些在各个领域内普遍认同的量化特征，而这些洞见正重新定义科学学可预见性的极限。以下四个领域具体体现了这些成果：对过去发现的引用量、谁得到了相关的研究职位、科学的生产力以及在职业生涯中主要发现的时机。但是，基于这些方面的工作同样也暗示了它受限于数据驱动的对科学发现的预测。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E现代的文献数据库允许研究者轻松汇总和研究引用量，这提供了一种方便但也有争议的科学影响力测量方式。50 多年之前，de Solla Price () 在许多知名的成果中识别出了驱动引用量的基本机制，其中当前可见度和幸运事件能驱动一个正向反馈循环，这能放大未来的可见性 (4)。这种「择优依附（preferential attachment）」机制解释了论文之间的引用如此不均衡的原因，为什么有的论文能够得到比典型论文多数百倍乃至数千倍的关注。这个模型也能对一个发展中的领域内的引用积累情况能做出非常好的预测。一个带有论文的新旧程度及其固有吸引力等控制量的修改过的版本能为单篇论文的长期引用量估计提供预测，其能表明引用达到峰值的时间以及需要多少时间才能将一项发现变成一个常识 (6)。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E但是，一些发现并不遵循这些规则，这些例外表明，除了可见度、运气和正向反馈，还存在更多与科学影响力有关的因素。比如说，一些论文远远超出了由简单的「择优依附」所做出的预测 (5,6)。另外还有科学中的「睡美人」：在很长一段时间内休眠不被人注意的发现，之后突然得到了很大的关注 (7-9)。一项在过去 100 年来的近 2500 万份自然科学和社会科学出版物上的系统性研究发现「睡美人」在所有研究领域都有出现 (9)。比如，爱因斯坦、波多尔斯基和罗森在 1935 年的关于量子力学的论文；Wenzel 在 1936 年关于防水材料的论文；Rosenblatt 在 1958 年关于人工神经网络的论文。沉睡的论文的觉醒可能从根本上来说是无法被预测的，部分原因是在一项发现的影响显现之前，科学本身也必须取得进步。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E做出什么样的发现部分取决于谁在做这个发现以及他们接受的是什么样的科学家训练（10）。科学家生产力队伍的这些特点是受一小部分颇有声望的研究机构的博士项目驱动的，这是由用来训练大多数职业研究者的数据揭示出的。（11）作为这一优势的结果，研究议程以及少量项目的博士生人口统计学趋于驱动着科研偏好和整个生态系统的生产力构成。除了这一稳健的模式——85% 的新教员是来自博士项目到不同层次声望的研究机构——之外，到目前为止，教员安置显然是难以预测的。利用了职业生涯早期生产力、博士后训练情况、地理位置、性别方面等更多方面数据的模型几乎很难改善有关最终职位安置的结果，跟了解这个人的学术血统后的预测效果差不多（12）。这一背景下的准确预测或许需要不同的、更少接触到的数据，或者安置结果根本就是难以预测的，因为这取决于潜在不可测量的因素。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E通过测量科研生产力以及发表作品被引用情况，研究人员也已经调查过了科学家个人在职业生涯中的表现和成就的可预测性。一般常识认为生产力——粗糙得说就是发论文的数量——会在职业生涯早期趋于高峰，接下来是一条长长的、逐渐下降的曲线（13），或许日益增加的教学和服务任务影响了科研作品的数量，降低了创造力等。不过，近期的一项对四十多年的生产力数据分析（针对 2300 名计算机科学教育人员）表明，个体生产力存在巨大差异性（14）。通常，最富生产力的时间集中在成为首席研究人员的最初 8 年中（图 2），生产力高峰通常出现在首次升职之前。同时，近一半研究人员生产力最高峰的一年会出现得晚一点，有些研究人员的生产力最高峰出现在职业生涯晚期。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cfigure\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-7d0a89b6a659e9f416deb2b5cecbab8c_b.jpg\& data-rawwidth=\&1280\& data-rawheight=\&990\& class=\&origin_image zh-lightbox-thumb\& width=\&1280\& data-original=\&https:\u002F\\u002Fv2-7d0a89b6a659e9f416deb2b5cecbab8c_r.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cp\u003E\u003Ci\u003E图 2. 对于绝大多数研究人员来说，生产力高峰很早就出现了。\u003C\u002Fi\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E（左）热图表明 2300 名计算机科学教员职业生涯中，生产力最高峰年份出现的时间（以发表作品数量为准），从第一份教职开始，从左到右依次列开。（右）直方图对热图的横向进行了总结，表明，对于绝大多数研究人员来说，他们生产力达到最高峰的一年通常出现在创立自己实验室的 8 年内。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E过去的作品也意味着，职业生涯的早中期更有可能做出科学家个人最佳科学发现，比如，被引用最多的作品（15,16）。这一模式意味着主要发现的出现时间多少是可以预测的。不过，针对 10,000 名科学家发表作品历史的分析表明，实际上，一项发现的影响力和它在职业生涯中出现的时机，并无相关性。也就是说，当这位科学家论文按照从第一篇到最后一篇的顺序进行安排时，他们引用率最高的发现就是第一篇论文的可能性大致等于可能是第二篇、第十篇甚至最后一篇的可能性（图 3）。年轻科学家倾向于成为绝大多数最主要发现的发起人——这一发现因此也是他们通常更富生产力这一事实自然而然的结果，并不必然是职业早期能力提升的一个特征。仅凭简单的机会本身，个人的最佳发挥更有可能出现在这位科学家职业生涯更富创造力的阶段。\u003C\u002Fp\u003E\u003Cfigure\u003E\u003Cimg src=\&https:\u002F\\u002Fv2-b8cc0f9d63f08d1dc73889_b.jpg\& data-rawwidth=\&1280\& data-rawheight=\&946\& class=\&origin_image zh-lightbox-thumb\& width=\&1280\& data-original=\&https:\u002F\\u002Fv2-b8cc0f9d63f08d1dc73889_r.jpg\&\u003E\u003C\u002Ffigure\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cem\u003E图 3. 在一位科学家作品序列上任意一点的主要发现。\u003C\u002Fem\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E这幅栅格图展示了随机挑选的 150 位物理学家（17）所有作品的顺序，从第一篇到最后一篇，每一行圆圈代表了一为科学家发表作品的顺序。一行当中，蓝色圆点标记的是最高影响力的作品。蓝色圆点在表格里的不一致分布以及对应 10,000 调查者（顶部）柱状图的平坦表明，主要科学发现什么时候出现，并无规律可循。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E虽然每位科学家影响最显著的论文的相对时间可能无法预测，但预测论文会被引用的次数和它是两码事（17,18）。具体来讲，援引已发表论文会以系统、持续性的方式因科学家而异，这与科学家工作主体的可见性相关，但与研究领域无关。这种模式使我们能够预测一个科学家最优论文的被引用量。关于科学家个人巅峰时期和幅度的两个结果表明，个别科学家成就的某些方面极难预测，而在其他方面更容易些.\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E生产力和影响力当中，强健以及场外独立（field-independent）模式，以及研究建议评估中有关偏差的证据，对目前为大多数科学研究提供资金的方式提出了质疑。比如，观察及实验研究表明，女性、非白人研究者（19,20）或侧重于跨学科研究（21）的项目申请获得资助的可能性更低。同样，最具创造力与影响力的时间集中于科研生涯的前十年，这似乎证明将资金从较年长的科学家向年轻科学家转移的举措具有合理性。NIH 长期支持早期研究者便是一个显著实例，尽管其成功很有限——因为 NIH 对 40 岁以下科学家的奖励数量仍低于 30 年前的峰值（22）。另一方面，有人可能认为尽管外部资金不平衡，年轻的研究人员往往更有成效。科学的科学根据这些情况确定了一个重要的模式，但根本原因的确定则需进一步调查与主动性实验。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E引用、出版量、职业发展、学术奖项以及其他通用度量是最佳原始数量，而如今我们可能正在接近它们能够告知的关于科学生态系统及其发现生产的信息极限。这些度量是科学前沿进展的滞后指标，它们能够预测新领域的出现或重大发现的可能性也许会很低。科学的科学中存在一个根本问题：能否使用更及时或具体情境的科学家的工作数据来进行更准确的预测，例如论文的内容、预印本数据、科学研讨会、科研团队沟通、被拒稿件、资助申请及其同行评议，甚至是社交媒体。我们应当使用控制实验来揭示大型数字数据库中所观察的模式中的因果机制，并探讨可测量的量与我们的解释之间的关系，如引用计数如何反映感知的科学影响（23）。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E「... 我们有责任确保使用预测工具不会阻碍未来的发现，将弱势群体边缘化...」\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E其中引用和出版量是以往成功的度量，它们展现出创造愈发丰富的动态的反馈循环。当与具有现代科学出版、投资和聘用特性的超竞争力相结合时，由于在未来成功的机会的分配中有一部分基于最近成功的标记，这种反馈循环则可能在成功中产生显著的不平等。然而贯穿科学发现许多方面的深度不可预测性表明，过度依赖这些度量能够产生自我实现的预测（24），这最终缩小了科学创新的范围，并将注意力从潜在、基本但不可预测的进展中移走。未来研究的一个重要方向必定是制定成功的度量和不易受反馈循环影响的评价系统。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E而存在的一个隐患是：资助者、出版商和大学可能利用大型书目数据库来创建新的系统，自动评估项目申请、手稿或年轻学者的未来「影响」。这种数据挖掘工作应当非常谨慎。它们的使用由于侧重与以往成功的原始指标相关的细微相关性，便可能轻易对创新造成阻碍，并加剧现存科学系统的不平等。毕竟新的发现由于从未被看到过而非常有价值，而数据挖掘技术只能了解过去做了什么。自动化系统的必然出现使得科学界必须指导他们的发展与使用，以便纳入机器学习中的公平、问责和透明的原则（25,26）。我们有责任确保预测工具的使用不会阻碍未来的发现、边缘化弱势群体、排除新想法或阻碍跨学科研究与新领域的发展。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E就像生物生态系统适应选择压力一样，科学生态系统最终将适应不断变化的科学激励和需求（27）。随着压力改变，科学家们将适应或者退休，将生存与增殖的实践亲身传授给他们的学生。然而令人不安的是，诺贝尔奖获得者几乎每年都声称他们最大的发现在现存的研究环境中本不可能。2016 年，Ohsumi 声称「如今科学家愈发需要为他们的研究提供即时而明确的应用」（28）。这类对于未料想到的可预测型发现的普遍重视会孕育出另类的、更具冒险精神的科学家。而结果可能会是净化选择的一种危险形式，这种形式下的年轻科学家会优化他们的研究并向一种趋势靠拢，这种趋势与我们每年评出的具有突出科学贡献的科学家类型不相适应.\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E根据生态学及进化理论改进观点在更好地整体性理解并预测科学生态系统方面极具潜力。这方面的进展将有助于我们避免由于多样性的丧失而造成的创新上的损失。作为共同体，我们必须制定培养一个多元化的科学生态系统的制度，包括 Freeman Dyson 谈到的俯瞰远方的鸟和探索细节的青蛙（29）、逆向、流浪者、工具建设者等。然而，在科学家之间实现这种多样化选择的实际细节仍不清晰。真正的生态研究依赖于观察研究与主动性实验的结合。然而，科学的科学中的大多数工作纯粹是观察性的，并且增加主动性实验（30）将需要源于定义适应性景观的资助机构、出版商和管理员的关注、魄力和勇气。如果说科学的科学能够教我们什么，那便是科学本身可以用科学的方法探测，而我们定会愚蠢地忽略实验。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E在新的数据源、新实验和新想法的驱动下，我们期盼科学的科学可以产生更多有关社会过程并能导致科学发现的振奋人心的洞察。研究已经表明，这些发现的某些方面是可预测的，并且它们在很大程度上与以往发现的引用随时间积累的途径相关。然而在其他方面可能根本上就不可预测。这些限制在如今的大数据与人工智能时代是微不足道的见解，并表明用于产生科学发现的更可靠引擎可能是培养和保持科学家健全的生态系统，而非专注于预测个体发现。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cstrong\u003E三、超越预测：使用大数据解决政策问题\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E摘要：从医学到分配城市火警、卫生监察点等应用领域，机器学习预测方法硕果累累。不过，在预测和决策之间仍然存在不少鸿沟，我们需要了解基本假设以优化基于数据的决策行动。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E最近，科学、产业以及政府领域分析的爆炸增长，以寻求「大数据（big data）」的帮助来解决各种问题。日益增长的大数据应用使用了有监督的机器学习（SML\u002Fsupervised machine learning）工具。在描述这一工具有望用来解决临床医学问题时，Obermeyer 等人评论到：「机器学习……就像医生通过实习获得进步那样来解决问题：从数据中学习规则。开始是病人观测值，然后算法筛选大量变量、寻找可靠的预测结果的组合……机器学习的优势就是可以处理大量预测因素（predictor）——有时还惊人地预测因素比观测值还多，并以非线性、高度交互的方式将它们组合起来。」\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003ESML 技术最初出现在计算机科学和工程学领域，已被广泛用于工程应用，比如搜索引擎和图像分类。最近，用这一方法解决科学和政策问题的应用数量也越来越多。在公共领域，这一方法模型已经被用于刑事司法制度（2）；使用移动数据、卫星图像或谷歌街景（3、4、5）预测经济状况；分配城市火警、健康监察点等，以及各种城市应用。该技术已经被用于分类文本中的政治偏见（8）以及评论中的情感分析。在医学领域，基于有监督的机器学习预测算法已经被医院用于按照病人的并发症的风险预测病情，优先安排病人的医疗干预 (10)，该技术还被广泛用于多种其它医疗应用，包括个性化医疗（1）。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E有监督的机器学习的迅速普及部分归功于数据、计算技术以及资源、数据分析技术、开源软件方面的进步。另一个因素这些技术被设计用来解决的问题很简单。现成的预测技术要发挥作用几乎不用什么假设（assumption）：环境必须稳定、其行为正被研究的单元个体不会互动或相互干扰。在许多应用中，SML 可以被对问题领域所知甚少的科学家成功地加以应用。比如，Kaggle 公司主办的预测竞赛（\u003Ca href=\&https:\u002F\\u002F?target=http%3A\u002F\\u002Fcompetitions\& class=\& wrap external\& target=\&_blank\& rel=\&nofollow noreferrer\&\u003ECompetitions | Kaggle\u003Ci class=\&icon-external\&\u003E\u003C\u002Fi\u003E\u003C\u002Fa\u003E）中，赞助商提供数据组，来自世界各地的选手提交的作品常常能成功预测，无论其关于问题的背景多么有限。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E然而，对纯预测方法的局限性的关注要少得多。当这一方法被用于现成的预测，而没有理解基本假设或确保满足诸如稳定性等条件时，结论的有效性和有用性就会受到损害。一个更加深入的担忧时，只使用预测技术是否就能解决给定问题，或者是否需要对干扰的因果效应（causal effect）进行评估的统计方法。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003EKleinberg 等人（11）强调了这一情况，现有的 SML 技术可以部分（但无法全部）解决健康政策领域的资源分配问题。他们考虑的问题是决定是否通过医疗保险给否则不合格的病人做髋关节置换手术。他们使用 SML 预测概率（一个要进行关节置换手术的患者是否会因其他因素在一年内死亡），以及识别那些处在特殊高风险，不该进行关节置换手术的患者。他们认为：「好处会随着时间的推移自然显现，因此，如果某人能获得够久来享受手术的好处，那么手术才有意义；给不久就会死亡的病人置换关节没什么价值——浪费金钱，给生命的最后徒增不必要的痛苦。」\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E这类问题中，聚焦预测的基本原理是很明显的；我们知道，一个干预的平均影响，在某种世界状态下，也是负面的（如果病人很快死亡），因此，预测世界状态足以用来预测是否放弃手术这一决定。不过，作者强调了这一事实：纯粹的预测方法并不能解决更加复杂的问题，比如，在那些可能存活超过一年的病人中，哪些病人该被给予最高的手术优先性。一个完整的资源分配问题需要评估手术效果的异质性，比如，因为一些病人有更高的手术并发症。将稀缺资源优化分配给手术效果能最大改善其福利的病人，是一个更加困难的问题，这个问题太长需要回答反事实的问题：采取那些以前从未实施过的各种替代分配政策后，会发生什么？\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E在另一个资源分配样例中，产业领域很常见，就是使用 SML 预测客户流失（即消费者放弃一家公司服务）的概率，然后公司对那些具有高度流失风险的用户给予干预（比如扩大销售人员的服务范围），以这样的方式解决问题。Ascarza (12) 记录了采取这类举措的公司，然后使用借鉴自因果推理论文献的方法提供了经验证明：根据一个简单的预测模型来分配资源，并非最优的做法。高度流失用户组群和最优可能回应干预组群之间的重合只有 50%。因此，将留住用户的问题视为一个预测问题，为公司带来了更低的回报。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E公共领域的资源分配问题是指一个城市应该优化分配监察点的地点，以最小化安全或健康问题。纽约的 Firecast 算法是根据预测的违反概率来分配火警监察点。Glaeser 等人 (6) 发明了一个类似的系统用于分配健康监测点（这对波士顿餐厅）的位置，该系统得到了应用，初步估计每次检查后，30% 到 50% 的违法情况得到了改善。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E如何优化监测点分配的决策问题将直接归于预测领域——如果以下简化假设为真：（1）被检查单个单位的行为是固定的；（2）识别出问题时，能立刻低成本加以解决，成本并不因为单位（unit）不同而所有不同。知道哪个单位更有可能违法，等于知道哪个单位应该得到监察。不过，更加现实的环境还集成了不同单位的异质性：一个建筑可能因为老化的电路而处在更高的失火风险中，但另一些考虑会让置换老线路变得困难。另一些单位的预测风险更低，但是，更容易做出实质改善，改善成本也低廉。另一个考虑是回应（responsiveness）。如果违法被处以罚金，一些公司会比其他公司对罚金更加敏感。整体说来，解决城市监察点分配的问题包括评估监察政策的因果性：在新的监测点分配机制下，你希望这个城市里单位（比如，食物中毒率）的整体质量有什么样的提升？\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E因此，预测和因果推论是本质不同的两个问题（尽管密切相关）。只有分析师超过这些预测方法来做出假设时，因果推理才是可能的；这些假设通常不能被直接测试，因此需要领域专家来进行验证。已经有关于因果推论的横跨多学科（社会科学、计算机科学、医学、统计学、工程学以及流行病学）大型文献来分析这类问题（参看 Imbens and Rubin (13)）。使用并非从随机测试中获取的数据来评估因果关系的办法之一就是针对导致微分检测概率（differential inspection probabilities）的因素进行调整，然后根据特定餐馆健康结果预测检查的效果（或许使用审计）。近期的方法进展关注的是调节大数据应用中观察到的混杂因素（比如，14–16）这一文献的主题之一就是现有的来自 SML 的预测模型招致了因果效果预测中的偏差问题，但是，持续有效的因果估计能够通过修改 SML 技术得以实现。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E另一个用于估计因果效应的方法就是利用设计好的实验。Blake et al. (17) 使用了一个以城市为基础的双重差法（difference-in-difference methodology）来评估 eBay 的搜索广告的效果（因果）。就像许多搜索广告商，eBay 靠历史数据来测量搜索广告的好处，不过，也确实试着区分开因果性和关联性。而且，eBay 使用一个简单的预测模型（其中，点击被用来预测销售）测量了广告的效果，他们发现广告点击的投入回报（也就是说，由点击所贡献的 eBay 销售与广告点击成本之比）大约为 1400%。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E通过使用实验数据测量广告效果，作者发现真实的投入回报为 63%。天真的分析和实验结果之间存在鸿沟的部分原因是许多点击 eBay 搜索广告的用户本来是要从 eBay 买东西的。尽管点击广告强烈预示着一次交易——消费者通常会在点击之后迅速购物——实验揭示出，一次点击很难说有大的因果效应，因为不管怎么说，点击的消费者很可能要购物。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E除了资源分配问题之外，纯预测和因果推断之间的区别几十年来一直是很多领域内方法和经验研究的主题。经济学对这个区别特别关注，或许是因为一些最基本的经济问题，如在不同的价格下消费者的需求变化，不能通过纯预测模型来得到答案。举个例子，同一个产品在不同（假定的）的价格水平下，消费者的购买量是多少？虽然这个问题似乎看起来可以直接套用 SML，将价格水平设置为一个说明性的特征（feature）来预测出销售量的「结果」。在实际操作时，如果 SML 被用作一个估计价格与销售量之间的因果效应的方法，这个方法将会很失败。假设，一个分析师有酒店价格和入住率的历史数据。一般情况下，价格和入住量是正相关的，因为酒店既有的价格政策（经常通过利润管理软件来制定）明确规定当酒店预订越来越满时酒店提高价格。直接套用 SML 技术的应用是为回答以下类型的问题所设计：如果一个分析师被告知在某天，客房价格非比寻常的高，那么这天最准确的入住量预测是多少？正确的答案是入住量将很可能很高。相反，改变价格政策的影响问题是一个因果问题，并且一般经验表明如果公司执行一项新政策来系统性的提高酒店所有服务价格的 5%，那么酒店将很可能会有更多房间被入住。另一个不同系列的统计技术将可以用于回答这样的问题，或许可以利用数据中「自然的实验」即一个被称之为「工具变量」的方法 [13 是对这些技术的回顾]。最近，一些作者将 SML 的优势同这些传统小数据系列的方法结合起来了，为了用于估计典型因果效应和私人化的因果效应估计。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E预测与因果推断之间的区别之外，仅为预测而做的方法优化也不能顾及到其他因素，这些因素可能在数据驱动的政策分析或者资源分配上很重要。例如，动机和可操控性可以很重要。如果一个建筑或者餐厅所有者依据这些特征，预料到被审查的可能性很小，他或她将减少安全措施上的投入。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E在一个数据驱动政策的例子中，可操作性发挥了作用，不列颠哥伦比亚的市场定价系统（MPS）被用于对国有土地的木材收购的定价，这些国有土地是在长期租约下被分配给木材公司的。MPS 构建出一个可以预测的模型，这个模型所运用的数据来自拍卖中木材的售价，该模型可以用于预测如果将长期租约下的一片土地的收获木材拍卖所可能达到的价格。但是，一个租约持有者潜在很可能有在拍卖中人为低价竞标的动机，从而达到影响模型对长期租约下收获木材的价格预测，也即降低了他们长期租约下收获木材的成本。作为模型选择过程的一部分，MPS 的预测模型服从于仿真情境，使得任何单个大型木材公司都能实现各自的可操作性。这个已经实现的模型并不是一个具有最好的预测性能的模型，最好的预测模型具有期望拥有的鲁棒性而不是可操作性。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E在实际运用统计模型时，很多其他需要考虑的问题涌现出来。有时候让利益相关者理解一个已做出的决定的缘由是很重要的，或者决策者可能需要记住一个决策规则（如医生）。基于透明度和可解释性的考虑，或许会导致分析师们偏好模型的简单性而牺牲模型的预测能力。另外一个需要考虑的是公平性或者说歧视。美国贷放款的消费者保护法禁止实际应用中有依据种族的歧视。一些公司可能希望运用 SML 方法从工作申请者中挑选出可以面试的申请者；但是他们可能希望在算法中设置多样性目标，或者最起码可以阻止性别和种族的不平等。在 SML 的文献中可以看到这些问题在最近受到关注（如 21）。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E总的来说，大数据如果想要在商业、科学以及政策上实现其全部潜力，从有监督的机器学习的文献来看，需要有由新的计算机算法所构建的多学科方法；同时还能带来使用经验证据来引导政策的数十年多学科研究的方法和实际学习。一个不成熟的但是快速成长的研究采取了这样的一个方法：例如，2016 年的 ICML（International Conference on Machine Learning）对 SML 方法的因果推断（casual inference）、可解释性（interpretability）以及可靠性（reliability）分别组建研讨会，虽然谷歌（22）、Facebook（23）和微软（24）的多学科研究团队已经开发出了可以使用的工具包，且这些工具包拥有为实现因果推断、实验性的设计以及估计最优资源分布政策的可扩展算法。随着其他领域持续加入和 SML 研究团体一起用大数据来寻求现实世界政策问题的解决方案，我们预计数据驱动的政策在算法提升和成功实现上将会有更大的机会。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E\u003Cstrong\u003E四、预测人类行为：下一个前沿\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E机器学习的进步正在变革我们对线下（offline）和线上（online）人类行为的理解。从训练集中分类我们感兴趣的对象，无论这些对象是恐怖分子、需要维护的机器或包含恶意链接的电子邮件，其都代表了这一领域内的巨大成功。或许不存在一种机器学习算法能将所有都做好。虽然精度是至关重要的，但是可接受的精度程度是随着研究问题的变化而变化的，仅仅只有精度是远远不够的。研究人员经常解释为什么他们的预测是正确的，但是从不解释为什么他们的预测可能也是错误的。那么决策制定者同时了解这两部分的原因将有利于他们制定更好的决策。特别是在高风险的情况下，预测必须同时提供相应的解释，这样才能为进一步研究提供更深入场景理解。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E预测模型还必须为潜在的未来行动提供一个或多个解决方案，这样决策者才能更好地决策。如今的机器学习方法并不一定满足这三个标准。因为构成理想的预测算法还是取决于现实应用。通常，利益相关集团（如社会媒体平台和搜索引擎）将对精度有不同的定义，从而满足其特定的需求。此外，行业专家可以使用领域内广博的知识建议在数据集内包含相关的独立变量。通常，他们将使用由预测模型生成的技术精度测量和他们的学科中的内容结合起来解释预测结果，所有这些都表明在现实世界体系中，计算机科学家需要和其他利益相关者进行合作而取得深远影响的结果。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E在我们看来，下一代的预测模型需要解决以下四个主要的挑战。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E首先，更多数据总会获得更好的预测模型这一格言并不总是正确的，因为数据中的噪点可能会压垮预测模型。处理噪点、不完整和不一致数据的能力将会是下一代预测模型的核心。例如，在推特上识别「bots」就是寻求在政治候选人上持正观点，而忽略寻求其它结果的大量「bots」。例如传播垃圾邮件、寻求在其他主题上影响他们的观点或欺骗用户点击链接从而为他们创造利润的机器人。此外，许多推特的数据是受到限制的，在一些情况下甚至会故意产生误导。所以机器人开发者就需要确保他们的机器人逃避检测。\u003C\u002Fp\u003E\u003Cbr\u003E\u003Cp\u003E第}

淘宝游戏网