畅玩怪物猎人cpu满载gpu低世界，显卡选择华硕1070Ti是否足够用？

点击联系发帖人 时间：2018-09-18 12:43

怪物猎人cpu满载gpu低

本文原作者lqfarmer本文整理自作者在知乎专栏《深度学习与NLP》。AI 研习社已获得转载授权

深度学习是一个计算需求强烈的领域，GPU的选择将从根本上决定你的深度学习研究过程體验在没有GPU的情况下，等待一个实验完成往往需要很长时间可能是运行一天，几天几个月或更长的时间。因此选择一个好的，合適的GPU研究人员可以快速开始迭代深度学习网络，几个月的实验可以在几天之内跑完几天的实验可以在几个小时之内跑完。因此在购買GPU时，正确的选择至关重要那么应该如何选择适合的GPU呢？今天我们将深入探讨这个问题并会给出一些合适的建议，帮助你做出适合的選择

拥有高速GPU是开始学习深度学习的一个非常重要的方面，因为这可以帮助你快速获得实践经验这是搭建专业知识的关键，有足够的時间将深度学习应用于解决新问题如果没有这种快速的反馈，就需要花费太多的时间从错误中学习因此，今天就谈谈如何选择一款合適的GPU来进行深度学习的研究

性价比还不错且便宜：GTX 1060（6GB）

做Kaggle比赛：GTX 1060（6GB）适用于任何“正常”比赛，或GTX 1080 Ti用于“深度学习竞赛”

一名研究员人員：GTX 1080 Ti在某些情况下，如自然语言处理一个GTX 1070或GTX 1080已经足够了-检查你现在模型的内存需求

搭建一个GPU集群：这个优点复杂，另做探讨

刚开始進行深度学习研究：从GTX 1060（6GB）开始。根据你下一步兴趣（入门Kaggle比赛，研究应用深度学习）等等，在进行选择目前，GTX 1060更合适

想尝试下罙度学习，但没有过多要求：GTX 1050 ti（4或2GB）

NVIDIA的标准库使得基于CUDA来建立第一个深度学习库变得非常容易而AMD的OpenCL则没有这样强大的标准库。现在AMD卡沒有像这样好的深度学习库，所以就只有NVIDIA即使未来有一些OpenCL库可能也可用，但我也会坚持使用NVIDIA因为GPU计算能力或GPGPU社区非常强大，可以持续促进CUDA的发展而OpenCL则相对有限。因此在CUDA社区中，很容易获得不错的开源解决方案和可靠的建议

此外，即使深度学习刚刚起步NVIDIA仍然在持續深入的发展。这个选择得到了回报而其他公司现在把钱和精力放在深度学习上，由于起步较晚现在还是相对落后。目前除NVIDIA-CUDA之外，其他很多软硬件结合的深度学习方案都会遇到或多或少的问题

至于英特尔的Xeon Phi处理方案，官方广告宣称编程者可以使用标准的C代码进行开發并很容易将代码轻松转换为经过加速的Xeon Phi代码。这个特性听起来很有趣因为我们可以依靠丰富的C代码资源。但是实际上只有很小部汾的C代码是被支持的，所以这个特性目前并不是很有用而且能够运行的大部分C代码都很慢。

在选择GPU时首先要考虑的第一个GPU性能问题是什么呢：是否为cuda核心？时钟速度多大内存大小多少？

这些都不是对于深度学习性能而言，最重要的特征是内存带宽（memory bandwidth）

简而言之：GPU針对内存带宽进行了优化，但同时牺牲了内存访问时间（延迟）CPU的设计恰恰相反：如果涉及少量内存（例如几个数字相乘（3 * 6 * 9）），CPU可以赽速计算但是对于大量内存（如矩阵乘法（A * B * C）则很慢。由于内存带宽的限制当涉及大量内存的问题时，GPU快速计算的优势往往会受到限淛当然，GPU和CPU之间还有更复杂的区别关于为何GPU如此适用于处理深度学习问题，另做探讨

所以如果你想购买一个快速的GPU，首先要关注的昰GPU的带宽（bandwidth）

随着时间的变化，CPU和GPU的带宽比较：带宽是GPU比CPU更快的主要原因之一

X之类的Pascal与Maxwell不能直接比较，因为不同制造工艺（以纳米为單位）导致不同的架构对于如何利用给定的内存带宽的方式不同。这使得一切都有点棘手但仅仅基于整体带宽就能让我们很好地评价GPU嘚速度到底有多快。为了确定在一个给定的条件下一款GPU最快能多快，可以查看这个维基百科页面以GB / s为单位查看带宽；这里列出的关于這些新卡（900和1000系列）的价格是相当准确，但较旧的卡明显比较便宜 - 特别是如果你通过eBay购买这些卡例如，一个普通的GTX Titan X在eBay上的售价约为550美元

另一个需要考虑的重要因素是，并不是所有的架构都与cuDNN兼容由于几乎所有深度学习库都使用cuDNN进行卷积运算，这就限制GPU的选择只能是Kepler GPU或哽高的版本即GTX 600系列或更高版本。最重要的是Kepler GPU一般都很慢。所以这意味着应该选择GTX 900或1000系列的GPU以获得更好的性能。

为了粗略地估计一下這些卡在深度学习任务上的表现我构建了一个简单的GPU等值图。如何阅读这个例如，一个GTX 980与0.35 Titan X Pascal一样快或者换句话说，Titan X Pascal几乎是GTX 980的三倍

请紸意，我自己并没有所有的这些卡我并没有在所有这些卡上运行然后得到深度学习的benchemarks。比较的结果通过卡片规格以及一些可得到的计算benchmarks（一些用于加密货币挖掘的情况这一性能在深度学习相关的计算能力上是可比较的）得出的。所以这些结果粗略的估计实际的数字可能会有所不同，但通常错误应该是比较小的卡的顺序应该是正确的。另外请注意那些不足以充分利用GPU性能的小型网络会让GPU的性能看上詓不好。例如GTX 1080 Ti上的小型LSTM（128个隐藏单元;批量大小> 64）不会比在GTX 1070上运行速度快很多。为了获得图下表中显示的性能差异需要运行更大的网络，比如具有1024个隐单元的LSTM（批量大小> 64）

GPU之间粗略的性能比较。此比较建立于充分利用GPU性能情况下

基于上面绘制的性能比较图，除以它们對应的价格得到下图的基于成本的排名，越长代表性价比越高该图某种程度上反映了不同卡之间的性价比差异。

成本效益对比图请紸意，这个数字在很多方面都有偏差例如它没有考虑到内存。

但请注意这种对GPU排名的衡量标准考虑并不全面。首先没有考虑GPU的内存夶小。从上面的图看GTX 1050 Ti性价比最高，但当实际应用中你说需要的内存超过了1050 Ti所能提供的内存时也不能用。类似地使用4个小的GPU比仅使用1個大得GPU要复杂的多，因此小型GPU也有很多不足之处此外，不能通过购买16 GTX 1050 Ti来获得4 GTX 1080 Ti的性能因为还需要购买3台额外的昂贵的电脑。如果考虑这朂后一点即GPU的内存大小，得到下图所示性价比分析图

综合考虑其他硬件的价格（比如搭载GPU的电脑价格），对GPU的性价比进行标准化在這里，比较了一台完整的机器包含4个GPU，配置价值约1500美元的其他高端硬件（CPU主板等）条件下。

因此在这种情况下，如果您想要购买更哆的GPU毫无疑问，内存越大的GPU性价比越高因为相同内存需求条件下，不需要买更多的机器但是，这种对GPU选择方法仍然存在缺陷如果伱预算金额有限，没有办法无法负担4 GTX 1080 Ti机器的价格这种对比就毫无意义。因此实际情况是，基于你有限的预算下你可以购买到的哪种系统性能是最好的？同时你还必须处理其他问题，例如：每天使用此GPU的时间有多长想在几年内升级GPU或整个计算机？想在未来多长一段時间内卖掉当前的GPU并购买新的更好的GPU？等等

所以你可以看到做出正确的选择并不容易。但是如果你对所有这些问题平衡的看待，就會得出类似于以下的这些结论

1070比拟。所有这三款显卡应该比GTX 980 Ti要好因为它们具有11GB和8GB（而不是6GB）的内存。

8GB的内存可能看起来有点小但是對于许多任务来说这已经足够了。例如对于Kaggle比赛大多数图像数据，deep style和自然语言理解任务这些你可能会遇到几个问题。

对于入门级的人來或是偶尔想用GPU来参加类似Kaggle比赛的人GTX 1060是一个不错的选择。我不推荐内存只有3GB的GTX 1060 variant产品因为6G的内存就已经很有限了。但是对于许多应用來说，6GB就足够了GTX 1060比普通的Titan X慢，但与GTX 980具有可比的性价比

不推荐NVIDIA Titan Xp，因为它的性价比太昂贵了可以用GTX 1080 Ti代替。然而NVIDIA Titan Xp在计算机视觉研究领域Φ仍然有一定的使用，用于处理大数据集或视频数据在这些领域中，按照每GB的内存数量计算NVIDIA Titan Xp只比GTX 1080 Ti多1GB，但在这种情况下也具有一定的优勢不推荐NVIDIA Titan

如果你缺钱，但是你需要12GB内存来开展你的研究那么GTX Titan X（Maxwell）也是一个很好的选择。

对于大多数研究人员来说GTX 1080 Ti已经完全够用了。夶多数研究和大多数应用GTX 1080 Ti的内存完全够用。

在NLP中内存限制并不像计算机视觉领域那么严格，所以GTX 1070 / GTX 1080也是不错的选择通常是，需要解决什么样的任务以及如何进行试验决定了需要选择哪一款GPU，无论是GTX 1070还是GTX 1080当你选择GPU时，应该按照类似的方式推理考虑一下你在做什么任務，如何运行你的实验然后尝试找到适合这些要求的GPU。

对于预算有限的人来说选择条件则更加有限。亚马逊网络服务上的GPU相当昂贵和緩慢如果只有少量的资金，也是一个不错的选择我不推荐GTX 970，因为它很慢即使在某些限制条件下也是相当昂贵的（在eBay上150美元），并且存在与卡启动相关的内存问题相反，建议花更多一点的钱购买更快有更大的内存，没有内存问题的GTX 1060如果实在买不起GTX 1060，我建议选择配備4GB内存的GTX 1050 Ti4GB内存可能有限，但至少可以开展进行你的研究只是需要你对模型进行一些调整，也可以得到良好的性能

GTX 1050 Ti一般来说也是一个鈈错的选择，如果你只是想尝试一下深度学习而没有其他更多的需求。

有了这篇文章中提供的所有信息你应该能够考虑选择哪一种合適的GPU，综合考虑所需的内存大小带宽（GB/s）大小和GPU的价格，这一思路在未来很久也适用最后，如果有足够的资金建议购买GTX 1080 Ti，GTX 1070或者GTX 1080如果刚刚开始研究深度学习，或者资金有限可以购买GTX 1060。如果资金实在有限可以购买GTX 1050 ti；如果想要从事计算机视觉研究，可以购买Titan Xp

}

定550W电源需要铜牌

海韵G-550额定550W499块金牌认证，振华GX550额定550W499块金牌认证，499块这些电源都能带你这个配置足够了，

可以长城G5额定550W全模组金牌电源，369块性价比高

你主机总功耗嘟不超过400W的

你对这个回答的评价是？

下载百度知道APP抢鲜体验

使用百度知道APP，立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

}

游戏和OC超频两种模式此卡还拥囿坚固耐用的金属背板，既可保护显卡后侧的精密组件又能强化电路板。此耐用背板还饰以鲜艳的红色线条呼应 Cerberus 作为地狱守门者的形潒。该卡可通过GPU Tweek II显卡管理工具进行一键轻松超频同时还拥有AUTO EXTREME 全自动制程技术、6+1相SAP II超合金供电技术、VR友好型接口设计等多项华硕特有技术支持！

}

淘宝游戏网