各花入各眼,一文看尽英伟达GTC 2022

在今年的秋季 GTC 上,英伟达展示了 RTX、AI、Omniverse的最新进展,还包括其在人工智能领域的新突破。下面我们一起看看今年又有哪些新花样吧。

Ada Lovelace GPU

在GTC 2022上,英伟达推出了第3代RTX架构——Ada Lovelac。据介绍,Ada GPU可实现2倍的传统光栅化游戏性能提升,对光线追踪游戏的性能提升可以高达4倍。相较上一代Ampere架构,Ada在相同功耗下可带来超过2倍的性能提升。

英伟达在 Ada 架构中引入了 DLSS 3,其可以在分辨率提升的同时自动补帧。DLSS 3 包含四个组件:新的光流加速器、游戏引擎运动矢量、卷积自动编码 AI 帧生成器和 Reflex 低延迟流水线。

黄仁勋表示:““DLSS 3 是我们最伟大的神经渲染发明之一。”

基于Ada Lovelace架构的GPU有三款:GeForce RTX 4090提供24GB版本,GeForce RTX 4080提供16GB和12GB版本。黄仁勋称此升级为“量子飞跃”,有望将游戏世界从一系列预先计算的图像转变为完全模拟的虚拟世界,为全模拟世界的创造铺平了道路。

GeForce RTX 4090拥有16384个CUDA核心和24 GB高速美光GDDR6X显存,在4K分辨率的游戏中持续以超过100 FPS运行,在功耗、静音、散热等方面的提升都非常显著。

GeForce RTX 4080 16GB 拥有 9728 个 CUDA 内核和 16GB 高速美光 GDDR6X 内存。借助 DLSS 3,在游戏中的性能是 GeForce RTX 3080 Ti 的2倍。RTX 4080 12GB 拥有 7680 个 CUDA 内核和 12GB 美光 GDDR6X 显存,性能跟3090 Ti同级。

RTX 40系列GPU的性能大幅提升,背后有着一系列技术创新的支撑:

  1. 架构上的改进:英伟达与台积电合作创建了针对GPU优化的4N定制工艺,使RTX 40系列能够集成760亿个晶体管、超过18000个CUDA核心,较上一代Ampere多了70%,性能功耗比提升高达2倍。

  2. SM流式多处理器:具有高达90 TFLOPS的着色器能力,吞吐量超过上一代产品2倍。

  3. 着色器执行重排序(SER):通过即时重新安排着色器负载来提高执行效率,从而更好地利用GPU资源。该技术可以实时重新调度任务,被黄仁勋称作是“与CPU的乱序执行一样的重大创新”,可将光线追踪性能提升2-3倍,整体游戏性能提升25%。

  4. 第三代RT Cores:有效光线追踪计算能力达到191 TFLOPS,是上一代产品2.8倍。

  5. 第四代Tensor Cores:新增Hopper FP8 Transformer Engine,FP8张量处理性能高达1.4 Petaflops,超过上一代使用FP8加速性能的5倍。

  6. Ada光流加速器:带来2倍的性能提升,使DLSS 3能够预测场景中的运动,使神经网络能够在保持图像质量的同时提高帧率。

  7. 双NVIDIA编码器(NVENC)将输出时间至多缩短一半,并支持AV1。OBS、Blackmagic Design DaVinci Resolve、Discord以及更多的公司都已在采用NVENC AV1编码器。

Hopper 和 Grace

大型语言模型(LLM)和推荐系统是当今最重要的两个AI模型。2017 年首次推出的基于Transformer 深度学习模型的LLM现在是AI研究中最活跃的领域之一,并且能够在没有监督或标记数据集的情况下学习理解人类语言。

Hopper是一款新的数据中心 GPU,在训练 Transformer 网络时性能提升了五倍。英伟达将 Hopper GPU 定位为一个突破口,可以降低训练这些大型模型的高昂成本。英伟达透露 Hopper 还打破了推理处理方面的现有限制,支持 300 个 LLM 模型的并发用户,比 A100 增加了 30 倍。

黄仁勋宣布 Hopper 现已投入生产,PCIe 版本将在下个月交付给戴尔、HPE、Supermicro、思科和联想等合作伙伴。

黄仁勋还分享了一些关于Grace的新细节,Grace是一款基于Arm的正在开发的服务器芯片,包括提供高于两倍当前服务器性能的目标。他还指出,与当今的 CPU-GPU 配置相比,Grace-Hopper 超级芯片将提供 7 倍的快速内存容量 (4.6TB) 和 8000 TFLOPS,包含 Grace Hopper 的系统将于 2023 年上半年上市。

Omniverse

元宇宙是互联网的下一个进化,将通过 3D技术 进行扩展。Omniverse 是英伟达用于构建和运行元宇宙应用程序的平台,Omniverse支持Ada Lovelace GPU。由此,Omniverse不仅能够加速各种复杂的3D工作流,还能够将光线追踪、AI和计算等复杂技术集成到3D流水线中,在VR中也能实现实时光线追踪。

黄仁勋表示,“英伟达 Omniverse Cloud是一款IaaS产品,可以连接在云上、本地和单个设备上,运行Omniverse应用。”

另外,英伟达 OVX 服务器专为横向扩展元宇宙应用程序而构建,第二代 OVX 系统将由 Ada Lovelace L40 数据中心 GPU 提供支持,该 GPU 现已全面投产。

DRIVE Thor

在如今的车辆中,自动泊车、停车、司机监控、后视镜、仪表盘和信息娱乐系统都由不同的计算机驱动。在未来,它们将通过软件交付,在中央计算机上运行。

为此,英伟达推出了 DRIVE Thor,它结合了 Hopper 变压器引擎、Ada GPU 和 Grace CPU。Thor为汽车的中央计算架构而生,用这一颗芯片打造一个控制器,即可同时为自动泊车、智能驾驶、仪表盘等多个系统提供算力。

新的 Thor 超级芯片具有2000万亿次浮点运算的性能,取代了DRIVE路线图上的Atlan,并提供了与DRIVE Orin的无缝过渡,后者拥有254个TOP性能,目前正在量产中。黄仁勋表示,Thor将成为机器人、医疗仪器、工业自动化和边缘人工智能系统的处理器。

英伟达的软件生态

英伟达的生态系统非常庞大,其拥有一个超过 350 万开发人员的软件生态系统,他们使用 英伟达的 550 个软件开发套件或 SDK 和 AI 模型创建了大约 3000 个加速应用程序。另外,在过去的 12 个月里,英伟达更新了 100 多个 SDK,并推出了 25 个新 SDK。

*本文系SDNLAB编译自Forbes网站


  • 本站原创文章仅代表作者观点,不代表SDNLAB立场。所有原创内容版权均属SDNLAB,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用,转载须注明来自 SDNLAB并附上本文链接。 本站中所有编译类文章仅用于学习和交流目的,编译工作遵照 CC 协议,如果有侵犯到您权益的地方,请及时联系我们。
  • 本文链接https://www.sdnlab.com/25956.html
分享到:
相关文章
条评论

登录后才可以评论

SDNLAB君 发表于22-09-21
0