重生之麒麟传说970玩游戏可以吗,传说中的npu能代替gpu与CPU吗

点击联系发帖人 时间：2017-09-03 16:50

重生之麒麟传说

华为麒麟970芯片解析：CPU无提升，亮点是集成NPU
来源:IT之家-IT
原标题：华为麒麟970芯片解析：CPU无提升，亮点是集成NPU　　不久之前，在“深商名企走进华为”活动中，华为消费者BG CEO、华为终端公司董事长余承东曾透露，以前做海思芯片是一个非常艰难的决定，因为做海思芯片，做得很差，要放弃的话是亏损，要不用它的话，永远成长不起来，要用它的话竞争力又很差。然而，华为还是选择坚持了下来，做到比较差、有点差，后来到慢慢接近一点，再到麒麟950开始慢慢领先，麒麟960领先。　　很显然，从严重落后到慢慢领先一路走上来，华为仍在不断突破。就在北京时间9月2日晚，在德国柏林的IFA 2017展会上，华为正式发布了新一代移动SoC芯片。华为余承东表示，麒麟970是华为首款人工智能移动计算平台，并且是全球首个集成独立AI人工智能专用NPU神经网络处理单元的移动芯片，所采用的是创新的HiAI移动计算架构。　　AI加持：全球第一枚集成NPU神经网络单元的移动芯片所谓的HiAI移动计算架构，主要有四部分组成，CPU、GPU、ISP/DSP和NPU。作为全球第一枚集成专用NPU的移动芯片，华为一开场就重点介绍NPU神经网络单元，声称在HiAI架构下AI性能密度大幅由于CPU和GPU，能够用更少的能耗更快的完成更多任务，大幅提升芯片的运算效率。当前位置：
&&&华为麒麟970处理器怎么样？麒麟970和骁龙835哪个性能好？
华为麒麟970处理器怎么样？麒麟970和骁龙835哪个性能好？
华为麒麟960处理器实现了多项创新，大量技术指标甚至领先高通骁龙821，实际性能上也有很多地方实现超越。
根据台湾媒体的最新报道，华为下一代麒麟970也已经在进行中，将是其第一款采用10nm工艺生产的手机芯片，继续由台积电代工。
麒麟970的具体消息不多，架构上可能仍是八核心，但基本确定集成基带会支持LTE Cat.12全球全模规格。
麒麟960搭载了四核A73、四核A53、八核Mali-G71，不过受制于台积电16nm工艺，CPU性能很彪悍的同时，GPU无法完全发挥。改用10nm可以大大缓解发热降频问题，就算规格基本不变，至少GPU性能也可以得到彻底释放。
在此之前，高通已经宣布了下代骁龙835，三星10nm工艺造，传闻称会采用自主或者A73新架构八核心，Adreno 540图形核心，支持四通道LPDDR4X-1866、UFS 2.1、LTE Cat.16全球基带(下载1Gbps)，并支持QC4.0快充，预计由三星Galaxy S8首发。
另外，联发科的下代十核Helio X30也是台积电10nm代工，目前已经率先进入量产阶段，明年第一季度即可出货。
Helio X30拥有两个A73、四个A53、四个A35核心和PowerVR 7XTP GPU，支持四通道LPDDR4X-1866、UFS 2.1、LTE Cat.10全球全模基带(三载波聚合)。
明年上半年，联发科还会拿出Helio X35，一大变化就是升级支持LTE Cat.12。
以上就是华为麒麟970处理器怎么样？麒麟970和骁龙835哪个性能好？的全部内容，希望可以帮助到大家。
Ta的热门文章
827人申请Xantour多用后座娱乐系统支架
1183人申请Comper智能体重秤
1826人申请352
2002人申请Vinci 1.5Pro 社交智能头机
3069人申请A11影院级4K蓝光导航硬盘播放机
￥1499【健腹器】SLENDERTONE健腹器：型动人生大有不同
￥109【ROMOSS】罗马仕（ROMOSS）太阳神移动电源/充电宝能量随时就位
￥299【NOERDEN智能手表S1】NOERDEN 智能手表S1：时尚与科技的完美结合
￥1099【乐歌M3S升降台】乐歌M3S升降台：久坐伤身站站就好了
￥249熊大大：石墨烯快充充电宝自带充电头
你还可以分享到以下地方，获得10蘑菇参与！
免费试用：
微信添加"亿智蘑菇"获取我们的服务
微博添加"亿智蘑菇"获取我们的服务
下次自动登录
使用第三方登录芯片之争：CPU、GPU、DSP、NPU，到底哪个更适用于深度学习？
我的图书馆
芯片之争：CPU、GPU、DSP、NPU，到底哪个更适用于深度学习？
雷锋网按：为保证内容的专业性，本文已邀深度学习芯片领域专家把关审核过，作者铁流。日前，Intel称将于2017年推出针对深度学习市场的CPU Knights Mill。据Intel宣传，Knights Mill 能充当主处理器，可以在不配备其它加速器或协处理器高效处理深度学习应用。可以说，继中国寒武纪和星光智能一号、IBM的真北、谷歌的 TPU，以及英伟达专门为人工智能定制的GPU之后，Intel也加入该领域的竞争。那么，这多深度学习处理器都有什么特点，又有什么优势和劣势呢？| CPU、GPU：用轿车运货在英伟达开发出针对人工智能的定制GPU，并坚持DGX-1 系统之后，Intel也不甘落后，在收购深度学习创业公司 Nervana Systems之后，Intel也公布了用于深度学习的Xeon Phi家族新成员，在深度学习处理器领域开辟新战场。在不久前，Intel还发布了一些Xeon Phi 的基准测试结果，其声称内容总结如下：1、四片 Knights Landing Xeon Phi 芯片比四片 GPU要快 2.3 倍；2、在多节点系统中， Xeon Phi 芯片的能比 GPU 更好地扩展38% ；3、128 块 Xeon Phi 的服务器组成的系统要比单块 Xeon Phi 服务器快 50 倍，暗示着 Xeon Phi 服务器的扩展性相当好；4、使用Intel优化版的 Caffe 深度学习框架时，Xeon Phi 芯片要比标准 Caffe 实现快 30 倍。一言蔽之，Intel的众核芯片在深度学习上比英伟达的GPU更为高效。不过，英伟达也随之反击，声称这是Intel使用了其旧的基准测试结果，并表示：1、如果英特尔使用更新一点的 Caffe AlexNet 实现结果的话，它就会发现四块上代英伟达 Maxwell GPU 实际上比四块英特尔 Xeon Phi 服务器集群快 30%。2、另外，一旦英伟达的 GPU 从 28nm 的平面工艺转移到 16nm 的 FinFET 工艺上时，GPU的性能和效率还会有很大的提升。3、对于深度学习，英伟达还强调更少的高性能节点无论如何都会比更多低性能节点好。并以其最新的 DGX-1为例，认为DGX-1比 21 个 Xeon Phi 服务器集群快一点，比四个 Xeon Phi 服务器集群快 5.3 倍。笔者认为，Intel的众核芯片也在一定程度上吸取了GPU的优势，性能不俗，但短时间看还是GPU有优势。不过，无论是针对人工智能的众核芯片还是定制版的GPU，本质上都不是专用处理器，实际上是拿现有的、相对成熟的架构和技术成果去应对新生的人工智能，并没有发生革命性的技术突破。其实，Intel和英伟达是在使用现有的比较成熟的技术去满足深度学习的需求，众核芯片和定制版GPU在本质上来说依旧是CPU和GPU，而并非专门针对深度学习的专业芯片，这就必然带来一些天生的不足。打一个比方，用众核芯片和GPU跑深度学习，就类似于用轿车去拉货，受轿车自身特点的限制，货物运输能力与真正大马力、高负载的货车有一定差距。同理，即便是因为技术相对更加成熟，Intel和英伟达的芯片在集成度和制造工艺上具有优势，但由于CPU、GPU并非针对深度学习的专业芯片，相对于专业芯片，其运行效率必然受到一定影响。| DSP：和真正神经网络芯片有差距6月20日，中星微“数字多媒体芯片技术”国家重点实验室在京宣布，中国首款嵌入式NPU（神经网络处理器）芯片诞生，目前已应用于全球首款嵌入式视频处理芯片“星光智能一号”。媒体称，“星光智能一号蕴含了当前计算机领域最前沿的生物人脑神经网络仿生学创新技术，且对严重依赖国外进口产品的中国集成电路产业来说，也是实现‘弯道超车’的一次踊跃尝试。它标志着我国在神经网络处理器领域的研究和开发上取得了重大突破；使我国视频监控行业发展由模拟时代、数字时代跨入智能时代，在全球确立领先地位。”不过，在经过仔细分析后，所谓“中国首款嵌入式神经网络处理器”很有可能是一款可以运行神经网络的DSP，而非真正意义的神经网络专用芯片。上图是星光智能一号发布的系统架构图。共包含四个NPU核，每个NPU核包含4个内核，每个内核有两个流处理器（Dataflow Processor），每个流处理器具有8个长位宽或16位宽的SIMD运算单元。每个NPU核的峰值性能为38Gops（16位定点）或者76Gops（8位定点）。除了多核流处理器本身用于完成卷积运算外，星光智能一号集成了一个超长指令字（VLIW）处理器用于完成神经网络中的超越函数等运算。另有256KB的L2Cache以及DMA模块用于大块数据的搬移。从其低位宽的定点运算器推断，星光智能一号仅可支持神经网络正向运算，无法支持神经网络的训练。从片上存储结构看，星光智能一号基于传统的片上缓存（Cache），而非像最近流行的神经芯片或FPGA方案一样使用便签式存储。因此，在技术上看星光智能一号是典型的“旧瓶装新酒”方案，将传统的面向数字信号处理的DSP处理器架构用于处理神经网络，主要在运算器方面作了相应修改，例如低位宽和超越函数，而并非是“狭义的”神经网络专用处理器，如IBM的“真北”芯片。因此，星光智能一号其实是DSP，而非NPU，能够适用于卷积神经网路（CNN），而对循环神经网络（RNN）和长短期记忆网络（LSTM）等处理语音和自然语言的网络有可能就无能为力了。换言之，星光智能一号暂时只面向机器视觉任务，而不能用于语音和自然语言类的问题。其实，这种用传统SIMD/DSP架构来适配神经网络的技术思想在国际上已有不少先例，甚至有成熟的产品，例如CEVA公司的XM4处理器、Cadence公司的Tensilica Vision P5处理器、Synopsys公司的EV处理器等。| NPU：为深度学习而生的专业芯片从技术角度看，深度学习实际上是一类多层大规模人工神经网络。它模仿生物神经网络而构建，由若干人工神经元结点互联而成。神经元之间通过突触两两连接，突触记录了神经元间联系的权值强弱。每个神经元可抽象为一个激励函数，该函数的输入由与其相连的神经元的输出以及连接神经元的突触共同决定。为了表达特定的知识，使用者通常需要（通过某些特定的算法）调整人工神经网络中突触的取值、网络的拓扑结构等。该过程称为“学习”。在学习之后，人工神经网络可通过习得的知识来解决特定的问题。由于深度学习的基本操作是神经元和突触的处理，而传统的处理器指令集（包括x86和ARM等）是为了进行通用计算发展起来的，其基本操作为算术操作（加减乘除）和逻辑操作（与或非），往往需要数百甚至上千条指令才能完成一个神经元的处理，深度学习的处理效率不高。因此谷歌甚至需要使用上万个x86 CPU核运行7天来训练一个识别猫脸的深度学习神经网络。因此，传统的处理器（包括x86和ARM芯片等）用于深度学习的处理效率不高，这时就必须另辟蹊径——突破经典的冯·诺伊曼结构。以中国的寒武纪为例，DianNaoYu指令直接面对大规模神经元和突触的处理，一条指令即可完成一组神经元的处理，并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。另外，神经网络中存储和处理是一体化的，都是通过突触权重来体现。而冯·诺伊曼结构中，存储和处理是分离的，分别由存储器和运算器来实现，二者之间存在巨大的差异。当用现有的基于冯·诺伊曼结构的经典计算机（如X86处理器和英伟达GPU）来跑神经网络应用时，就不可避免地受到存储和处理分离式结构的制约，因而影响效率。这也就是专门针对人工智能的专业芯片能够对传统芯片有一定先天优势的原因之一。用数字来说话，CPU、GPU与NPU相比，会有百倍以上的性能或能耗比差距——以寒武纪团队过去和Inria联合发表的DianNao论文为例——DianNao为单核处理器，主频为0.98GHz，峰值性能达每秒4520亿次神经网络基本运算，65nm工艺下功耗为0.485W，面积3.02平方毫米mm。在若干代表性神经网络上的实验结果表明——DianNao的平均性能超过主流CPU核的100倍，但是面积和功耗仅为1/10，效能提升可达三个数量级；DianNao的平均性能与主流GPGPU相当，但面积和功耗仅为主流GPGPU百分之一量级。| 结语就现阶段而言，传统芯片厂商（如CPU、GPU和DSP）对于深度学习市场非常重视，因此利用他们巨大体量和市场推广、销售能力，大力推广用这些传统芯片来进行深度学习处理，其本质上也是对现有的技术进行微调，用传统SIMD架构来适配神经网络。然而，由于传统CPU、GPU和DSP本质上并非以硬件神经元和突触为基本处理单元，相对于NPU在深度学习方面天生会有一定劣势，在芯片集成度和制造工艺水平相当的情况下，其表现必然逊色于NPU。正如前文所述，无论是再好的轿车要去拉货，也不可能和真正大马力、高负载的货车相比。雷锋网注：本文为雷锋网独家文章，转载请联系授权并保留出处和作者，不得删减内容。
馆藏&35822
TA的最新馆藏
喜欢该文的人也喜欢麒麟970处理器有多强？华为想要引领优势全靠它
公众号：发布时间： 03:41
【TechWeb报道】现在手机平台的发展速度已经超乎几年前的预料，要知道现在任何一台手机的性能已经超越了数年前的PC，我们通过手机，不仅可
以接打电话、使用社交工具，还能办公、娱乐影音甚至简单的制图等等，一些较为复杂的工作也能通过移动终端完成。这样的进步与微处理器的发展密不可分。提起手机处理器，今年上半年高通上市的骁龙835手机每款都能惊艳四座，但下半年还会有更多重量级产品登场，比如搭载了A11处理器的苹果新
iPhone，刚刚发布不久的联发科X30手机魅族Pro
7。前面两个例子都是来自于台积电的10nm工艺制程处理器，其实还有一款手机即将在秋季登场，他就是华为的Mate
10，这款手机搭载的处理器同样是10nm工艺制程的海思麒麟970。华为旗下的海思一直为华为品牌手机提供处理器产品，从最早的Mate时代就开始了一直持续至今，而海思处理器也在不断更新换代，还未登场的麒麟
970在业内颇受重视，虽然只有华为自家的品牌可以使用（仅限于华为和荣耀部分中高端机型）。那么麒麟970为什么值得期待呢？它究竟能否继续引领华为品牌在国内No.1的市场优势？我们一起来了解一下这颗处理器。10nm工艺有多牛?刚才我们提到了，下半年手机新品处理器除了骁龙835之外，最大的看点就是基于台积电的10nm工艺制程，已知采用台积电10nm工艺首发的就是联发科X30处理器，也就是在魅族Pro
7高配置版本上搭载的产品，当然可不止这一款处理器是台积电10nm工艺出品，另外两个都比它还要大，他们分别是刚才提到的苹果A11和麒麟970，前
者不用多说了，苹果产品只在自家iPhone上使用，而且由于侧重点不同很难与其他平台手机相提并论，但性能绝对是不容小觑的。后者就是我们今天要聊的主
角。台积电10nm工艺已经不是什么秘密，今年上半年的时候，台积电联合CEO刘德音表示，基于10nm工艺的处理器预计下半年发货，果不其然出现在联
X30上面，并不是大家猜测的麒麟970首发。根据业内的说法，实际上麒麟970是台积电10nm工艺的第一款定案芯片，不过后来X30的速度加快不久前
正式发布了。在数学上看，纳米（nm）是0.米的意思，顾名思义10nm就相当于是0.米，也许这样形容非常抽象，实际上是
其制程是指在芯片中，线最小可以做到10纳米的尺，缩小晶体管的最主要目的就是为了要减少耗电量，借助缩小闸极长度，电流可以用更短的路径从Drain端
到Source端。从16nm缩短到10nm工艺之后，更小的芯片中塞入更多的晶体管，增加整体晶体管数量有利于处理器的性能和更稳定的运行。芯片可以保持与上一代相
同的尺寸就增强性能，或者保持性能的前提下大幅度缩小尺寸等等。另外哟偶遇降低耗电量，所以可以增加频率来提升性能或者降低整体功耗，当然要看你具体怎么
使用和需求了。当然了，尺寸缩小是受到物理条件制约的，并不是可以无限制缩小，到现在的10nm工艺制程已经是非常困难的事情了，甚至之前有人断言进入20nm以
下的世界会非常难，但现在看这个说法不攻自破，但要想保持10nm工艺制程下的良品率和效益也不容易。举个例子，1个原子的尺寸大约是1.0nm，而
10nm就相当于让100颗原子来列成一条直线，制作过程中有原子掉出或是有杂质，就会产生不知名的现象，影响产品的良率。当然10nm工艺成熟后展示的高性能和低功耗也是手机厂商说向往的。当然还有一个因素就是工艺成熟度，也影响处理器的性能，比如同样是
6s手机，有台积电16nm处理器版本和三星14nm工艺版本，按理说应该是三星的14nm工艺更先进，但由于成熟度不够，所以有人发现实际上三星处理器
更费电，而且性能表现也不够好，这主要是因为工艺不够成熟的原因，虽然苹果对此发表看法，认为不会因为处理器的差异而影响手机整体使用感觉，但
iPhone 7开始苹果就使用台积电独家代工处理器了。虽然台积电10nm工艺来的比三星晚了一些，但使用这种工艺的麒麟970还是值得期待的。麒麟970的部分信息首次曝光尽管该处理一直处在保密阶段，但天下没有不透风的墙，尤其是这款处理器的手机在上市之前还要进行多种项目的测试和适配，当然了，只要保密措施得当，正式发布之前可以做到大体信息不公开，但挡不住某些环节出现问题，部分信息提前曝光。根据网络上公开的信息显示，麒麟970采用的是基于台积电10nm工艺，8核64位架构，四个Cortex-A73和四个Cortex-
A53，GPU为Mali-G72 MP8。处理器支持LTE Cat.12、Wi-Fi
802.11和蓝牙4.2。可以支持最高4200万像素摄像头，显然足够未来两年手机使用的了。这次曝光的信息显示，A73的四颗大核心最高可以达到2.8GHz主频，这四个大核心和四个小核心并不是同时完全运行的，四个大核心的主要作用是在
手机需要大规模运算和高性能负载的时候启动，他们意味着麒麟970最强的性能，也就是上限。四个核心满载运作带来的就是麒麟970的真正性能，比如在加载
一些应用尤其是游戏的时候，它们会高效运作。而只是待机或者更简单的操作的时候，往往使用的是四个A53核心，这时候处理器整体处在较低功耗下运行，比较
节约电力，发热量也会降低。基本上大小核的设计是现在处理器比较主流的方案。不过可惜的是这次A53核心的最高频率并没有曝光，但这四个核心对于最高性能影响不大。从曝光的参数上看，未来麒麟970如果工艺成熟，性能开发的和麒麟960差不多的情况下，可以在计算能力上提升至少30%，而图形处理能力也可以提升很多。因此华为Mate 10手机在性能方面还是很有看点的。人工智能芯片是不是噱头前不久华为终端CEO余承东曾经在上半年业绩发布会上公布了一条消息，华为将会在下半年推出人工智能（AI）芯片，有分析师认为这将会让华为成为第
一家推出AI芯片的手机厂商，而且这款芯片应该就是麒麟970。消息一出舆论纷纷，有人认为华为的做法非常前卫大胆，也有不少人认为这就是噱头。那么麒麟970究竟有没有人工智能的基因在其中呢？根据分析，这次华为970应该是加入了寒武纪IP，也就是人工智能处理单元。寒武纪是中国科学院
计算技术研究所专门为人工智能设计的专用芯片，今年已经开始获得了专项资金和一定的产业化能力，希望模仿人类神经元和突触进行深度学习的处理器。如果麒麟970真的加入了寒武纪IP，那么的确是增加了在AI方面的运算能力和性能。其实加入辅助处理单元的方式也不是什么新鲜事了，苹果处理器加
入了M协处理器，而上一代华为麒麟960也增加了诸如DSP、ISP、i6 Sensor
Processor等专用处理单元。未来处理器有针对的多样化处理是趋势，可以通过这些处理单元极大的提升在专门场景下的性能。这也是谷歌为什么要开发
TPU的原因。如果单纯从处理器上看，这应该不仅仅是噱头，但从用户层面上看，与手机应用相关的AI场景少之又少，计算也往往是通过云端处理的。所以对于现在的层面看对于个体用户来说，很难找到实际价值所在，未来如何展现具体的实用性，恐怕要等待华为官方的介绍了。总体来说，麒麟970应该不会让大家对Mate 10的性能失望，但也不会有太多惊喜。唯独值得我们期待的就是与AI相关的部分了。小编只想说：到时看看界面的流畅性就知道了！这些文章很精彩，看得忘了走路：—END—
内容要点：}

淘宝游戏网