英伟达发“新核弹”，但你不应该只看产品-虎嗅网

老黄又发“新核弹”了，但这次很多地方都变了。

温哥华13号当地时间下午4点钟，英伟达（NVIDIA）CEO黄仁勋在正在举办的计算机图形学年度会议SIGGRAPH上，放出了一个重磅更新——英伟达下一代的GPU架构“图灵（Turing）”，以及应用Turing架构的对应Quadro系列专业显卡产品。

对于每一代GPU架构都会渗透、影响自家全系列产品的英伟达来说，这绝对算是一件大事。但你应该关注的，却远不止新产品本身。

关于全新的图灵（Turing）架构

在发布会现场，老黄为了说明“图灵”的强大，专门拿它和“帕斯卡（Pascal）”架构（均为最强旗舰芯片）进行了一个对比。

晶体管数量：帕斯卡有（GP102核心）118亿个晶体管，而图灵则有186亿个晶体管，相比之下增长了57.6%；
芯片面积：帕斯卡芯片大小为471平方毫米，图灵为754平方毫米；
存储性能：帕斯卡的容量为24GB、等效带宽为10GHz，图灵的显存容量上升到48+48GB（需要通过NVlink将双卡互联），等效带宽上升到48GHz。

就这几个数字来看，提升幅度其实还蛮大。尤其是在晶体管数量上。从虎嗅现场了解的情况来看，“图灵”将会采用12nm工艺，相比“帕斯卡”的14/16nm工艺已经有所提升，但芯片实际尺寸的“暴涨”依旧非常明显。这种程度的改变，实际上对芯片制造的良品率和之后的散热，都提出了比较大的挑战。

除了上面提到的，还有另外几个对比值得细看：在CUDA处理器数上，“帕斯卡”最多拥有3840个，“图灵”对应的是4608个，提升约20%。但“图灵”还拥有“帕斯卡”没有的Tensor Core和RT Core，其中Tensor Core可以输出高达125TFLOPS的深度学习运算能力、200TOPS的INT8深度学习运算能力，而RT Core则可以完成每秒十亿次的光线追踪模拟运算。

最后是互联能力，这次发布的专业卡RTX 8000，能够通过NVlink技术直接在双卡之间形成一条100GB/s的传输通道，让每颗GPU都能利用上96GB的显存空间。

黄仁勋在现场介绍新架构的一些细节

整体对比下来，似乎都是华丽丽的提升。但我们不能忘了另外一个前辈架构“伏特（Volta）”的存在。我们再拿“伏特”的数据和“图灵”简单去做个对比。

晶体管数量：“伏特”（GV100）拥有211亿个晶体管，“图灵”为186亿个晶体管；
芯片面积：“伏特”（GV100）为815平方毫米，“图灵”为754平方毫米；
显存形式：“伏特”采用的是直连的4颗HBM显存，主要通过显存位宽来提升整体的显存带宽；而“图灵”采用的GDDR6显存，则主要依靠运行频率来提升整体显存带宽；
CUDA处理器数量：“伏特”（GV100）拥有5376个（实际中部分被屏蔽），“图灵”为4608个；
Tensor处理器数量：“伏特”为672个，“图灵”为576个；
Tensor运算能力：“伏特”为125TFLOPS（深度学习运算能力），“图灵”为150TFOLPS。

从这些结果来看，其实能够可以看到一个非常明显的趋势，“图灵”其实和2017年末登场的“伏特”在一系列参数上有很高的相似度，但两者在实际形态上又相差甚远。

至少从现在来看，“图灵”所采取的一系列变化，关键词都是“实用性”，换个角度来说就是尽可能将最高端的“伏特”架构的部分能力和经验重新组合，打造出更低成本的解决方案，并由此打造出最新一代的GPU基础架构。

其他一些值得关注的点

1、新架构首发选择在专业显卡产品线中

就英伟达自身的显卡历史而言，新架构的GPU首发通常都是选择在主流消费级产品之上，大部分都是旗舰产品打头。这一规律直到定位相对模糊的TITAN X才有所动摇，并最终在“伏特”架构这一代时完全被打破。

如果说首发还不能解释一切的话，那么老黄在发布会接近尾声的一张PPT上其实也表达出了自己的想法：“‘图灵’架构将打开价值2500亿美元的虚拟特效工业”。

性能可观，售价更加可观的RTX系列专业显卡

这一“转舵”操作的源动力，最大可能还是游戏市场的“成长天花板”愈发明显，相比汽车、移动市场这些尚需要时间的市场，专业视觉应该是英伟达赢面最大、最有希望短时间见成绩的细分领域了。

2、专业卡都来了，游戏卡还会远么

网上泄露的GTX1180Ti显卡照片，大概率是PS的

早在今年6月底，其实就已经有消息传出——英伟达将携新显卡登录德国科隆游戏展。此次“图灵”架构的首发，则基本直接坐实了新显卡将在科隆登场的计划。

但究竟专业显卡核心细节、性能在转向消费级产品时会做哪些调整，暂时仍是一个谜团。最值得期待的或许是全新的RT Core能否直接应用到游戏开发和运行当中，从而进一步提升游戏的显示效果。

3、英伟达正在逐渐走上产品细分道路

最近一两年间，英伟达各个领域的产品正在显示出一种自我细分的趋势：从最高端的、高制造成本的V100 GPU系列解决方案；到相对停滞的消费级显卡产品；再到开始集成多种专用处理器模块的最新自动驾驶平台新一代Xavier；最后是这次引入了全新RT Core设计的专业视觉产品。

可以看到英伟达各领域产品虽然都保留了同样的GPU运算部分，但差异部分的确越来越多，这在某种程度上也呼应了摩尔定律再次减缓的趋势。

已经在CPU领域出现的“通用计算发展瓶颈”，大概率也会在GPU领域出现，尽管基于并行计算的后者天生优于基于串行计算的CPU。但值得庆幸的是，至少对英伟达来说，并不会固执地“坚持”只走通用路线，而是集中精力“解决问题”。

这也是为什么，至少在可见的未来，用GPU架构将自身各个产品线“串联”起来的英伟达，已经在产品功能和生态打造上拥有的明显竞争优势。

写在最后：以上的大部分内容，基于我自己的猜测。再过3天英伟达就将发布自己最新一季度的财报，届时最新的趋势将有更明显的展示。