NVIDIA GTC演讲两个多张小龙八小时演讲视频 老黄放了多少大招

英伟达的GTC大会:2小时发布5大AI新品 股价暴涨17%|英伟达|开发者大会|GTC_新浪科技_新浪网
英伟达的GTC大会:2小时发布5大AI新品 股价暴涨17%
  今年的NVIDIA GTC开发者大会,与往年颇有些不同。
  北京时间5月11日00:00,万众瞩目的英伟达CEO黄仁勋Keynote演讲,在加州圣何塞举行。全场长达两个多小时,雷锋网记者在媒体中第一位入场,坐在了前排中央。然而,整场演讲下来,老黄并没有一句提到游戏。&
  本场主题演讲的话题涉猎面其实很广:VR、Volta、超算、GPU云服务、自动驾驶芯片、以及机器人训练。但是,所有这些话题都有一个共同点:要么基于AI、深度学习技术、要么为AI、深度学习技术服务。&
  英伟达也恰恰在GTC举办的同时,公布了2017年第一季度的财报。财务数据显示,NVIDIA在2017第一季度营收同比增长48%,达到19.4亿美元。在过去一年里,NVIDIA致力于深度学习的计算系统解决方案极大推动了语音识别、机器视觉、虚拟助手、自动驾驶等领域的发展,而其在各行各业的核心开发者也成为这家“核弹公司”源源不断的增长动力。
  看来,英伟达已经如同老黄所说,已完全转型成为领先的AI企业。本届GTC的主题,便是AI&深度学习。当然,还有划时代的深度学习硬件Volta。下面,便是本届GTC英伟达发布的五大革命性产品:Project Holodeck、Volta、英伟达GPU云、Xavier DLA,以及Isaac机器人模拟机。&
  Project Holodeck
  Project Holodeck是老黄发布的第一个产品,堪称是本届GTC的开胃菜。它将VR和AI的顶尖技术相结合,所构建的VR社交、工作空间。它有三大特点:
  照片级逼真的视觉
  物理交互
  协作&&
  其中最大的亮点,无疑是物理交互体验。老黄表示,虚拟共享空间必须要遵从物理定律,否则就无从营造真实世界般的沉浸感。相比之下,同属VR社交空间应用的 Spaces,并没有这么强调物理属性。
  英伟达与顶级跑车制造商科尼塞克合作,请科尼塞克创始人Christian Koenigsegg甚至利用VR化身(上图中的虚拟人)“现身”说法。
  演示中,有两个细节值得我们注意:
  当VR化身触摸方向盘时,其“手掌”并不会像网游那样穿过方向盘,而是能实实在在地握住它。雷锋网获知,用户还能在Project Holodeck里举起东西。这充分展示了“物理交互”。
  Project Holodeck导入了科尼塞克最新车型(上图)的全部三维数据——不仅仅是外观,还有内饰、零件。随老黄一声令下,整部车分解成一个个的独立零件;展示了让VR“不止于社交”的可能性。
  Project Holodeck将于9月开放体验。
  Volta架构
  没错,Volta终于来了。继Pascal(帕斯卡)之后的新一代GPU架构,在万众期待下亮相。对于绝大多数观众,不论GTC推出了多少AI工具,都无法遮掩Volta作为本届大会心脏的事实。
  毕竟,英伟达今后二至三年的GPU产品线,全都要由Volta供血。虽然Volta架构的游戏显卡最快在今年底才可能与大家见面,但通过深度学习卡,也可一窥Volta的满血性能。那么在本届GTC,英伟达推出了哪些基于Volta的产品?
  答案是 V100,以及基于它的深度学习计算机DGX-1和DGX Station。
  Tesla V100
  “迄今为止英伟达难度最高、最复杂的项目;
  耗费数千工程师数年光阴来完成;
  全世界有史以来最昂贵的计算机项目(研发支出为30亿美元)。”
  说的就是Tesla V100,基于新一代Volta架构。但英伟达在它身上实现的壮举远不止与此:
  Tesla V100的芯片面积是惊人的815平方毫米,约等于一块Apple Watch,真正达到光刻技术的极限。老黄说:“不可能做出比这再大的GPU芯片……我把这看做是几乎‘不可能实现的’,是制造技术的一项不可思议的惊人绩业。”&
  来自三星的16GB HBM2显存,带宽达到惊人的900 GB/s。
  详细规格见下图:
  Tensor Core
  相比Pascal,Volta有全新的张量运算指令,这就是Tensor Core。
  它既是指令也是数据格式,是4*4的矩阵处理阵列。它使得Volta的训练吞吐量达到了Pascal的12倍,推理吞吐量达到6倍。借助它,Tesla V100的张量运算能力达到120 TFLOPS。
  TensorRT
  它是Volta的高性能神经网络推理引擎,或者说编译器。目的是为推理运算快速地优化、验证、部署训练好的神经网络。
  老黄解释道:“训练完成之后,用于训练神经网络的框架会生成图。图需要为你使用的处理器进行优化、编译。我们把这称为TensorRT。”
  面向推理(inference)
  众所周知,深度学习运算可被分为训练和推理两部分。从前,N卡只关注训练,而在Tesla V100上,英伟达终于对推理“动真格”。老黄表示,从Volta开始,英伟达GPU将对训练、推理兼顾,可谓是革命性的突破。如图所示,Tesla V100的推理运算速度是Skylake CPU的十余倍不止。CPU、FPGA和TPU们怕了么?&
  性能对比&&
  这是Tesla K80、P100与V100三代架构的性能对比。在Caffe2、Microsoft Cognitive Toolkit(CNTK)、MXnet三大框架上,V100&取得了数倍的性能提升。以Caffe2为例,训练时间由K80的40多小时,缩减到V100的不到10小时。
  DGX-1V、DGX Station和HGX-1
  深度学习超级计算机DGX-1也把GPU升级为Volta,这便是DGX-1V。
  它内置八块Tesla V100,运算能力为惊人的960 Tensor TFLOPS。老黄表示,过去Titan X需花费八天训练的神经网络,用DGX-1V只需八个小时。它相当于是“把400个服务器装进一个盒子里”。
  售价149000美元,即日起接受预定,第三季度出货。
  DGX Station则是缩小版的DGX-1V,老黄称其为“Personal DGX”,堪称是终极深度学习PC。英伟达内部已经使用很久,每个工程师要么有DGX-1V,要么有DGX Station,再要么两个都有。这次,老黄决心把它推向市场。
  它内置四块Tesla V100,运算力因而是DGX-1V的一半。1500W功耗,使用水冷。售价69000美刀。
  另外一个基于Tesla V100的新硬件产品是HGX-1。这是英伟达与合作开发的公有云服务器。老黄声称,这是业内首个堪称标杆的云图形加速器。它内置八块Tesla V100,设计时就考虑了公有云服务器必需的多种任务处理与全能性。
  英伟达GPU云
  “这是世界上首个混合深度学习云平台”,老黄说。&
  每一名深度学习工程师大概都深有体会:在一台设备上创建、设置开发环境并不是一件省心的事。这花费的时间可能是整整一天,可能是一个星期、一个月,也可能灰心丧气干脆放弃。
  为解决这一开发者的痛点,英伟达推出了GPU云。它的亮点非常直接——在几分钟内设置好本地开发环境。而这,只需要打包下载一整套英伟达优化、整合好的深度学习软件包。开发者所有需要的库和框架都包含在内,并且用容器NVDocker隔离。
  它支持全部深度学习开发框架。当然,为利用云端成白上千GPU的强大计算力,开发者可一键在英伟达GPU云设立开发环境,上传工作进度。
  英伟达GPU云将在七月公测。
  开源Xavier DLA
  Xavier是英伟达的自动驾驶AI处理器。它的创新之处在于,整合了CPU、GPU以及DLA三大处理器的优点:
  雷锋网注:DLA即深度学习加速器,前段时间很火的TPU,便是DLA。&
  Xavier同时具备CPU的单线程性能,CUDA的并行加速能力,以及DLA的计算机视觉特殊功能。&
  老黄宣布,为加速深度学习技术的普及和进步,将开源Xavier DLA供所有开发者使用、修改。初期版本将在7月开放,完整版本将于9月公开。
  Isaac机器人模拟机
  Isaac(艾萨克)这个名字,来自于两个人:一是象征物理学的艾萨克·牛顿,二是象征&AI&的艾萨克·阿西莫夫。这是英伟达倾力打造的终极机器人AI虚拟训练环境。
  在真实世界人为训练机器人有先天的局限性:人力成本过高,风险大,耗时长,效率极低。解决的方案,便是在虚拟环境进行机器人训练。这有点类似于训练智能体的模拟器Deepmind Lab和OpenAI Gym。事实上,Isaac直接连通OpenAI Gym,借助后者的强化学习功能。
  充分利用了英伟达在物理引擎上的造诣,老黄表示,Isaac的目标是打造一个遵从物理定律的“alternate universe”(替代空间)。虚拟训练空间将完全遵从现实世界的物理定律,除了时间。理想的情况是,在模拟机中学习过的机器人,就相当于已经预训练过。&
  而在时间上,机器人AI将以多重“分身”在Isaac中进行训练,每轮训练中最聪明的那一个,将进入下一轮分配给每个智能体;再从中选出表现最好的那一个进入下一轮,取代上一轮的所有智能体……
  如此往复,以训练出最聪明的机器人AI。
巨星们也迎来了阶段性句号,他们现在要往管理岗位转型了。这不会...
直播一定要有造血能力,否则,融不到钱,那就是要命了。
老罗已然透支的个人商誉还能挥霍多久?NVIDIA发布史上最强大“核弹”:旗舰计算卡Tesla V100
NVIDIA发布史上最强大“核弹”:旗舰计算卡Tesla V100
不久前,NVIDIA正式发布了史上最强大的“核弹”--旗舰计算卡Tesla V100!据悉,Tesla V100是基于Volta架构的产品,内置了5120个CUDA单元,核心频率为1455MHz,搭载16GB HBM2显存,单精度浮点性能15 TFLOPS,双精度浮点7.5 TFLOPS,显存带宽900GB/s。 如此“堆料”让Tesla V100拥有超过210亿个晶体管,核心面积达到了创纪录的815平方毫米,采用的是12nmFFN工艺制造(其实是16nm深度改良)。 作为对比,上代旗舰Tesla P100不过只有3584个CUDA核心,拥有153亿个晶体管,核心面积610平方毫米(16nm FET+工艺)。同时,Tesla V100的二级缓存及寄存器大小也有所增加,L2缓存由Tesla P100的4096KB增加到了6144KB,每组SM单元的寄存器文件大小总数从14336KB增加到了20480KB。 NVIDIA表示,Tesla V100将首先用在用于深度学习超算DGX-1上,内部拥有8张Tesla V100计算卡,峰值计算性能高达960 TFLOPS,号称用8个小时就能完成TITAN X八天的工作量。 价格方面,DGX-1的售价为14.9万美元,约合人民币102万元。
本文仅代表作者观点,不代表百度立场。系作者授权百家号发表,未经许可不得转载。
百家号 最近更新:
简介: 关注游迅网,发现好游戏
作者最新文章&&|&&责编:魏景芳
今天(5月11日)凌晨,NVIDIA&GTC大会(GPU技术大会)开启,重头戏当然是CEO黄仁勋的主题演讲,一开始黄仁勋就抖干货:摩尔定律失灵,GPU崛起。NVIDIA&CEO黄仁勋(图片来自baidu)黄仁勋在演讲中称,最近几年摩尔定律开始失灵,人们需要花越来越多的成本来换取计算能力的微小增量。与摩尔定律逐渐失灵形成对比的是GPU的崛起,随着人工智能与深度学习的兴起,以GPU的计算已经随处可见,NVIDIA的GTC大会的参会者每年也在以爆发式的速度增长着。简单寒暄之后,老黄便开始发威,黑科技(Holodeck等、DRIVE&PX平台)、新GPU——Tesla&V100、GPU云服务……马上为你奉上黄仁勋在两个小时主题演讲中发布的五大革命性产品:VR多人交互平台&Holodeck、全新Volta架构、NVIDIA&GPU云、车载平台DRIVE&PX,以及Isaac机器人模拟机,这到底都是些什么黑科技呢?◆&VR多人交互平台:Project&HolodeckVR多人交互平台:Project&Holodeck(图片来自baidu)这个VR多人交互平台Holodeck具备三大特点:照片级真实的模型、遵循真实物理法则、适宜交流合作。其中最大的亮点,无疑是物理交互体验,也就是在这个虚拟世界是遵循物理定律的,当你伸手抓住方向盘时候,手指不会穿过方向盘,两人之间或者三、四个人之间也可以做牵手等的动作交互。黄仁勋表示,虚拟共享空间必须要遵从物理定律,否则就无从营造真实世界般的沉浸感。相比之下,同属VR社交空间应用的Facebook&Spaces,就没有这么强调物理属性。Project&Holodeck最早在今年9月就会开放SDK给大众使用,进一步推进多人VR的发展。◆&全新Volta架构以及Tesla&V100全新Volta架构以及Tesla&V100(图片来自baidu)Volta架构是继Pascal之后的新一代GPU架构,单个计算单元比原本的速度快了12倍。预计今后两、三年NVIDIA的GPU产品线,全都要搭载Volta架构处理器。Volta架构的首款GPU就是Tesla&V100。根据NVIDIA介绍,这款GPU采用的是台积电的12nm&Finfet工艺,有210亿个,同时具有5120个CUDA处理内核,说白了就是无敌快。Tesla&V100(图片来自baidu)老黄马不停蹄的介绍了三款基于Tesla&V100的新产品:超级电脑DGX-1、小型超级电脑DGX&Station以及专用于云计算的HGX-1。超级电脑DGX-1——新版的DGX-1配备了8块Tesla&V100,官方称TITAN&X需要8天完成的计算量,DGX-1只需要8小时!售价14.9万美元,相当于102.8万人民币,今天起开放预售,三季度开始发货。新版DGX-1(图片来自baidu)小型超级电脑DGX&Station——对计算能力要求不是特别高的可以选择这款小型超级电脑。它配备了4块Tesla&V100显卡,售价6.9万美元,相当于47.6万人民币,同样是今天开放预售,第三季度发货。DGX&Station(图片来自baidu)HGX-1是一款专门用于云计算的超级电脑,适用于公有云、深度学习、图形渲染、CUDA计算等,与DGX-1一样,配备了8块Tesla&V100,售价14.9万美元。◆&NVIDIA也要开始做云了!NVIDIA&GPU云(图片来自baidu)NVIDIA在GTC大会上正式推出了自己的云——NVIDIA&GPU&CLOUD。不过黄仁勋介绍,与亚马逊和微软不同,这是一款专门针对深度学习的云。黄仁勋在演讲总说:“现在有关深度学习的太多了、框架太多了、不同类型的GPU也太多了,一个人要从零开始搭建一个深度学习的项目真是太困难了。”NVIDIA&GPU云将可以简化这一过程,从演示视频可以看到,用户登录了NVIDIA云之后,只需要3步就可以创建自己的深度学习项目:第一步,选择计算环境(既可以选择NVIDIA云、亚马逊云等,也选择本地GPU计算);第二步,接入数据库(可以选择现有数据库如ImageNet,或者自己上传);第三步,选择框架(如Caffe、TensorFlow等)。黄仁勋称,这个项目今年7月就进入BETA测试,Xavier&DLA深度学习加速平台将全面开源,用户可以在此基础上进行编程,优化深度学习效果。◆&车载AI计算平台DRIVE&PX车载AI计算平台DRIVE&PX(图片来自baidu)自动驾驶一定是必聊话题,这已经成为NVIDIA发力的重要领域。黄仁勋在会上宣布NVIDIA将和丰田合作,计划在未来几年把搭载NVIDIA技术的丰田自动驾驶汽车开上路。现在已经有200个开发者/企业正在使用DRIVE&PX车载AI计算平台,甚至有做无人驾驶飞机的企业也在其中。黄仁勋介绍了DRIVE&PX平台的三项新功能:地图构建(Mapping&ro&Driving):车辆可以通过扫描环境、监测路上特征、进而创建高精地图、最终实现车辆定位与自动驾驶。副驾辅助(Co-Pilot):虽然我们现在不能立刻为世界的所有地方构建高精地图,但在我们已经创建了的地方,如从家里去公司,车辆可以在特定路程为你实现自动驾驶。守护天使(Guardian&Angel):有时即使你没有开启自动驾驶模式,AI系统依旧会一直在线。比如你在一个十字路口看到绿灯,正准备开车前行时,系统忽然禁止你前行,因为刚好有车闯红灯冲过来,◆&超级黑科技:Isaac机器人模拟世界Isaac机器人模拟世界(图片来自baidu)Isaac是英伟达倾力打造的终极机器人AI虚拟训练环境。老黄介绍,Isaac这个名字,来自于两个人,一个是象征物理学的艾萨克·牛顿,另外一个是象征AI的艾萨克·阿西莫夫。在真实世界人为训练机器人有先天的局限性:人力成本过高,风险大,耗时长,效率极低。NVIDIA提供的解决方案是,在虚拟环境中进行机器人训练,这有点类似于训练智能体的Deepmind&Lab和OpenAI&Gym。事实上,Isaac正是直接连通了OpenAI&Gym,借助后者强化学习功能。黄仁勋表示,Isaac的目标是打造一个遵从物理定律的“替代空间”。虚拟训练空间将完全遵从现实世界的物理定律,除了时间。理想的情况是,在模拟机中学习过的机器人,就相当于已经预训练过。◆&NVIDIA财报利好&股价飙升本周三,NVIDIA发布第一财季财报,其中营收19.4亿美元,同比涨幅达48.4%。净收入5.07亿美元,同比涨幅更是高达126%。随后,NVIDIA股价大涨了17.83%,刷新历史纪录,今天股价仍在继续攀升。在人工智能浪潮中,NVIDIA抢占先机,现在,我们需要用全新的眼光去审视NVIDIA这家图形芯片巨头了!【延伸阅读】本文属于原创文章,如若转载,请注明来源:.cn/638/6389142.htmlNVIDIA GTC 演讲两个多小时 老黄放了多少大招?-ZAKER新闻
今天是 NVIDIA GTC 大会最受关注的一天,原因无他,就是 NVIDIA CEO 兼创始人黄仁勋的 Keynote 演讲。对于为何将最为重要的内容放在日程的后半段,NVIDIA 员工有这么一种说法:我们不希望老黄的演讲对于财报发布和股价评估带来过多的乐观影响。无论真相如何,这几年利润稳定、股价飞升的 NVIDIA,确实是有如此的底气的。主题为 "I am AI" 的开场片,采用 AI 自述的形式,将人工智能定义为多个创意和学习。NVIDIA 近年来,也逐渐摆脱了只是显卡公司的牢笼,不断发力于 VR,人工智能,深度学习以及自动驾驶等方面。老黄依旧是皮衣少年 style 登场,他从摩尔定律和 Dennard scaling 法则的瓶颈聊起。当计算机的运算能力大幅提高,光在晶体管上做文章已经无法得到这两则定律带来的计算机效率边际增长日益减少。这要求我们在摩尔定律之后寻找新的发展道路。NVIDIA 的解决方案是 GPU 和 CUDA 并行计算平台,这带来了一系列机器运算架构的改变。在最近 5 年中,全球的 GPU 开发者增长了 11 倍。深度学习的大爆炸时代带来更多的可能。其中一个趋势是机器日趋自动化,开始自主学习。这将是一个自动化的自动化时代。在人工智能发展的新时代,NVIDIA 致力于为 AI 的进一步变革提供力量,其中包括:和开源框架、系统、器合作,提供 AI 研发更好的平台;和斯坦福大学、多伦多大学、清华大学、东京大学等多个顶尖学府的实验室合作,致力于多领域的应用型 AI 研究;成立 Inception Program,通过在不同领域帮助多个创业公司,进一步触及 AI 应用的多个领域。目前这个项目已经包含 1300 个 AI 创业公司。AI 的飞速发展伴随着一个问题:出于对运算的要求,计算机模型的复杂程度日益提高。在现场,老黄发布了 NVIDIA 新一代芯片 Tesla Volta 100,应对这一趋势。Volta 100 拥有 5120 个 CUDA,16GB HBM2 显存以及 210 亿颗晶体管,研发费用达到了 30 亿美元。接下来,老黄发布了搭载搭载 8 个 Tesla V100 芯片的 DGX-1 人工智能超级计算机。NVIDIA 将其定义为 AI 研究者的必要工具。DGX-1 相当于 400 个的工作能力,在原来 TITAN X 上需要跑 8 天的内容现在只需要 8 小时。DGX-1 的定价是 149000 美元,将于 2017 年第三季度出货。老黄在现场还承诺,现在下单会收到搭载 Pascal 芯片的 DGX-1,NVIDIA 会提供免费更新,升级为 Volta 芯片。同时,NVIDIA 还发布了较小版本的人工智能超级计算工作站 DGX Station,搭载 4 个 Tesla V100 芯片。可以看作是 DGX-1 的个人版本。DGX Station 定价 69000 美元,将于今年第三季度出货。NVIDIA 在深度学习愈发关注机器推理部分,因而推出了相关的深度学习推理优化引擎 TensorRT。TensorRT 可以帮助经过神经网络更快地处理大规模数据,可以提高训练效率 12 倍,推理效率 6 倍。通过数字来横向对比,Intel 的 Broadwell CPU 每秒可以处理 100 张图片,5 年前的 K80 芯片能够每秒处理 200 张,一年前的 P100 芯片每秒处理 600 张,而最新发布的 Volta 芯片速度达到了惊人的每秒 5,000 张图片。另一方面,V100 的测算能力将带来极大的冗余缩减。原先需要 500 个 CPU 节点完成的工作,可以用 33 个 V100 芯片来替代,在供电和冷却方面的能源需求,缩减了 15 到 25 倍。NVIDIA 和各家开源框架已有成熟的合作。为了更好地拓展 NVIDIA 的版图,同时让开发者能够接触到最新的深度学习框架,NVIDIA 推出基于自家 GPU 的世界上第一个深度学习综合云平台——集成 NVIDIA GPU Cloud 深度学习堆栈,测试版将于今年 7 月上线。搜狐科技现场拍摄:Tesla V100 和手机大小近似自动驾驶必须是演讲中需要提及的部分。老黄首先回顾了 NVIDIA 在这方面的成就,包括 NVIDIA 的自动驾驶试验车 BB8 的自动驾驶和辅助驾驶的相关功能,同时介绍了其他搭载 NVIDIA Drive PX 的车辆应用,包括 PACCAR 的货车和 BlueRiver 的农用车辆。此次 NVIDIA 放的大招是——宣布丰田集团的自动驾驶汽车将搭载 NVIDIA Drive PX 系统,双方合作推动自动驾驶的商业化进程。搭载下一代 Xavier 处理器的 NVIDIA DRIVE PX 平台可以实现每秒 30 万亿次深度学习计算,应和自动驾驶期间高频大量数据处理的需求。老黄表示," 丰田是一间传奇的车企,双方的工程师正在密切合作,希望未来几年内能够将自动驾驶的车辆上路使用。"老黄还在现场宣布,NVDIA 为自动驾驶设计的 Xavier 架构宣布开源,今年 7 月开放早期入口,9 月将完全开源。在机器人应用方面,NVIDIA 发布了 Isaac Robot Simulator 虚拟的机器人模拟器。这一系统以 Issac 命名,纪念发现重力的 Issac Newton 和首次提出人工智能三原则的科幻作家 Issac Asimov。开发者可以在这个平台上测试并模拟机器人和现实物体的互动。在现场,老黄展示了机器人 Ada 在系统中练习打曲棍球和冰球的场景。从某种意义上来说,NVIDIA 创造了一个专供机器人学习的平行时空。这个世界依然遵循物理规律,但可以超越时间的限制。这一系统在未来将有可能对公众开放。在黄教主的演讲开始之前还有一个很有意思的细节。早上八点全球媒体在 Press Lounge 在等待工作人员指示,准备入场的时候,无端端大家自发朝着 Keynote Hall 涌去,搞得现场的工作人员还要着急慌忙地把我们召回来重新列队排列。这种莫名的堪比邪教的自发行为,足以看出老黄黄教主的影响力。搜狐科技文 / 王羚捷美国旧金山报道
相关标签:
原网页已经由 ZAKER 转码排版
科技频道3小时前
科技频道2小时前
科技频道11小时前
科技频道3小时前
科技频道2小时前
科技频道2小时前
威锋网55分钟前
IT之家50分钟前
中关村在线1小时前
钛媒体36分钟前
TechWeb58分钟前
cnBeta19分钟前
智能界27分钟前
IT16833分钟前
TechWeb15分钟前}

我要回帖

更多关于 一小时演讲多少字 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信