英伟达发“新核弹”,但你不应该只看产品
2018-08-14 15:58

英伟达发“新核弹”,但你不应该只看产品

老黄又发“新核弹”了,但这次很多地方都变了。


温哥华13号当地时间下午4点钟,英伟达(NVIDIA)CEO黄仁勋在正在举办的计算机图形学年度会议SIGGRAPH上,放出了一个重磅更新——英伟达下一代的GPU架构“图灵(Turing)”,以及应用Turing架构的对应Quadro系列专业显卡产品。




对于每一代GPU架构都会渗透、影响自家全系列产品的英伟达来说,这绝对算是一件大事。但你应该关注的,却远不止新产品本身。


关于全新的图灵(Turing)架构



在发布会现场,老黄为了说明“图灵”的强大,专门拿它和“帕斯卡(Pascal)”架构(均为最强旗舰芯片)进行了一个对比。


  • 晶体管数量:帕斯卡有(GP102核心)118亿个晶体管,而图灵则有186亿个晶体管,相比之下增长了57.6%;

  • 芯片面积:帕斯卡芯片大小为471平方毫米,图灵为754平方毫米;

  • 存储性能:帕斯卡的容量为24GB、等效带宽为10GHz,图灵的显存容量上升到48+48GB(需要通过NVlink将双卡互联),等效带宽上升到48GHz。


就这几个数字来看,提升幅度其实还蛮大。尤其是在晶体管数量上。从虎嗅现场了解的情况来看,“图灵”将会采用12nm工艺,相比“帕斯卡”的14/16nm工艺已经有所提升,但芯片实际尺寸的“暴涨”依旧非常明显。这种程度的改变,实际上对芯片制造的良品率和之后的散热,都提出了比较大的挑战。



除了上面提到的,还有另外几个对比值得细看:在CUDA处理器数上,“帕斯卡”最多拥有3840个,“图灵”对应的是4608个,提升约20%。但“图灵”还拥有“帕斯卡”没有的Tensor Core和RT Core,其中Tensor Core可以输出高达125TFLOPS的深度学习运算能力、200TOPS的INT8深度学习运算能力,而RT Core则可以完成每秒十亿次的光线追踪模拟运算。


最后是互联能力,这次发布的专业卡RTX 8000,能够通过NVlink技术直接在双卡之间形成一条100GB/s的传输通道,让每颗GPU都能利用上96GB的显存空间。


黄仁勋在现场介绍新架构的一些细节


整体对比下来,似乎都是华丽丽的提升。但我们不能忘了另外一个前辈架构“伏特(Volta)”的存在。我们再拿“伏特”的数据和“图灵”简单去做个对比。


  • 晶体管数量:“伏特”(GV100)拥有211亿个晶体管,“图灵”为186亿个晶体管;

  • 芯片面积:“伏特”(GV100)为815平方毫米,“图灵”为754平方毫米;

  • 显存形式:“伏特”采用的是直连的4颗HBM显存,主要通过显存位宽来提升整体的显存带宽;而“图灵”采用的GDDR6显存,则主要依靠运行频率来提升整体显存带宽;

  • CUDA处理器数量:“伏特”(GV100)拥有5376个(实际中部分被屏蔽),“图灵”为4608个;

  • Tensor处理器数量:“伏特”为672个,“图灵”为576个;

  • Tensor运算能力:“伏特”为125TFLOPS(深度学习运算能力),“图灵”为150TFOLPS。


从这些结果来看,其实能够可以看到一个非常明显的趋势,“图灵”其实和2017年末登场的“伏特”在一系列参数上有很高的相似度,但两者在实际形态上又相差甚远。


至少从现在来看,“图灵”所采取的一系列变化,关键词都是“实用性”,换个角度来说就是尽可能将最高端的“伏特”架构的部分能力和经验重新组合,打造出更低成本的解决方案,并由此打造出最新一代的GPU基础架构。


其他一些值得关注的点



1、新架构首发选择在专业显卡产品线中


就英伟达自身的显卡历史而言,新架构的GPU首发通常都是选择在主流消费级产品之上,大部分都是旗舰产品打头。这一规律直到定位相对模糊的TITAN X才有所动摇,并最终在“伏特”架构这一代时完全被打破。



如果说首发还不能解释一切的话,那么老黄在发布会接近尾声的一张PPT上其实也表达出了自己的想法:“‘图灵’架构将打开价值2500亿美元的虚拟特效工业”。


性能可观,售价更加可观的RTX系列专业显卡


这一“转舵”操作的源动力,最大可能还是游戏市场的“成长天花板”愈发明显,相比汽车、移动市场这些尚需要时间的市场,专业视觉应该是英伟达赢面最大、最有希望短时间见成绩的细分领域了。


2、专业卡都来了,游戏卡还会远么


网上泄露的GTX1180Ti显卡照片,大概率是PS的


早在今年6月底,其实就已经有消息传出——英伟达将携新显卡登录德国科隆游戏展。此次“图灵”架构的首发,则基本直接坐实了新显卡将在科隆登场的计划。


但究竟专业显卡核心细节、性能在转向消费级产品时会做哪些调整,暂时仍是一个谜团。最值得期待的或许是全新的RT Core能否直接应用到游戏开发和运行当中,从而进一步提升游戏的显示效果。


3、英伟达正在逐渐走上产品细分道路


最近一两年间,英伟达各个领域的产品正在显示出一种自我细分的趋势:从最高端的、高制造成本的V100 GPU系列解决方案;到相对停滞的消费级显卡产品;再到开始集成多种专用处理器模块的最新自动驾驶平台新一代Xavier;最后是这次引入了全新RT Core设计的专业视觉产品。


可以看到英伟达各领域产品虽然都保留了同样的GPU运算部分,但差异部分的确越来越多,这在某种程度上也呼应了摩尔定律再次减缓的趋势。


已经在CPU领域出现的“通用计算发展瓶颈”,大概率也会在GPU领域出现,尽管基于并行计算的后者天生优于基于串行计算的CPU。但值得庆幸的是,至少对英伟达来说,并不会固执地“坚持”只走通用路线,而是集中精力“解决问题”。


这也是为什么,至少在可见的未来,用GPU架构将自身各个产品线“串联”起来的英伟达,已经在产品功能和生态打造上拥有的明显竞争优势。


写在最后:以上的大部分内容,基于我自己的猜测。再过3天英伟达就将发布自己最新一季度的财报,届时最新的趋势将有更明显的展示。

如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定
赞赏文章的用户赞赏文章的用户2人赞赏