Nvidia探索将多GPU封装到一块:轻松打破旧架构极限
商业计算、可选研究、以及4K多屏游戏等需求,不断推升着对现代GPU的性能需求。根据一份近期的研究报告,Nvidia认为正在迅速接近当前GPU架构模型的极限,因此需要寻找新的方法去攻坚。当前这个想法仍处于模拟
商业计算、可选研究、以及 4K 多屏游戏等需求,不断推升着对现代 GPU 的性能需求。根据一份近期的研究报告,Nvidia 认为正在迅速接近当前 GPU 架构模型的极限,因此需要寻找新的方法去攻坚。当前这个想法仍处于模拟阶段,但文中提到的“多芯片模块 GPU”(MCM-GPU)的概念,有望最终将多颗 GPU 模块整合到一处。
在意识到 Nvidia 将很快难以通过当前架构榨取 GPU 性能之后,亚利桑那州立大学、英伟达、德州大学奥斯汀分校、以及巴塞罗那超算中心携手展开了研究。
此前,厂商还可以通过在每次制程迭代时堆积更多的流处理器来提升 GPU 性能。但遗憾的是,在单一模块中塞入更多晶体管的方法,已经变得越来越困难。
以 Nvidia V100 GPU 为例,其已经需要代工厂商(台积电)将制程推到 12nm 的极限。此外,制造规模越来越大的模块,其成本和相关问题也不可忽视(比如因制造错误遇到的数量减少)。
虽然 Nvidia 可以通过将多颗 GPU 装在一块 PCB 上的方式来提升显卡性能(比如 Tesla K10 和 K80),但当前仍有一些未能解决的问题 —— 比如跨多 GPU 的任务分配就需要编程来提升硬件效率。
于是研究人员们另辟蹊径,决定在封装技术上寻找新方法,让 Nvidia 可以将多个 GPU 模块(GPMs)封装到一块。这些 GPMs 比当代 GPU 要小一些,制造起来也更容易和便宜。
尽管人们对其性能仍有疑问,但研究人员声称近期基板技术的发展(PDF)已经能够帮助其部署一种快速、强健的模块通信互联架构。从理论上来讲,其带宽可达数 TB/s 。
在 Nvidia 内部 GPU 模拟中,研究团队将 MCM-GPU 堆到了 256 组 SMs,而 Pascal 架构仅为 56 组 SMs 。然后团队基于当前架构进行了预测,结果显示 MCM-GPU 可提速 45.5% 。
此外,在同一板子上进行的多 GPU 性能对比表明,MCM-GPU 有 26.8% 的领先优势。最后,有消息称 AMD 公司也有类似的点子(基于 Navi GPU)。
[编译自:TechReport , 来源:Nvidia(PDF)]
-
荣耀Magicbook笔记本正式发布 MX150独显/支持屏幕触屏
7月31日荣耀Magicbook笔记本在北京发布,这款笔记本电脑采用MX150独显,其中最大特色是支持屏幕触控。据悉,荣耀Magicbook笔记本将在8月1日凌晨0...
-
幽灵行动荒野多少钱 幽灵行动荒野steam售价
《幽灵行动荒野》多少钱?小编了解到,这款游戏有普通版、数字豪华版、黄金版。此外还针对其他地区推出特定发售版本,下面主要来给大家介绍幽灵...
-
AMD RX550入门显卡正式发布:2G显存售价559元
4月18日AMD推出RX580/570两款高端显卡之后,今天AMD再次发布了入门显卡RX550,这款香显卡面向低端市场,建议零售价尾为599元。根据官方介绍,RX5...
-
GT 1030又多了位小弟 GT 1030 DDR4显存版悄然上市
4月10日我们知道,显存规格越高,意味着显卡可以获得更良好的性能提升。而就在上个月(3月),GT1030DDR4显存版悄然上市,其中微星和技嘉等都已...