科技流网
您的位置:科技流网 > 聚焦

英伟达芯片,再秀新肌肉

阅读量:8276   添加时间:2025-02-09 16:32   内容来源:证券之星   

如果您希望可以时常见面,欢迎标星收藏哦~

Nvidia 的RTX 神经纹理压缩 终于进行了基准测试,展示了该技术在实际 3D 工作负载中的能力。Compusemble在1440p 和 4K 分辨率的RTX 4090上对Nvidia 的新内存压缩技术进行了基准测试,结果显示与传统纹理压缩技术相比,使用 NTC 可将内存纹理大小减少 96%。

Compusemble 以两种模式测试了 NTC:“NTC 转码为 BCn”和“样本推断”。前者在加载时将纹理转码为 BCn,而后者仅解压缩渲染特定视图所需的单个纹素,从而进一步减少纹理内存大小。

在启用DLSS升级的 1440p 分辨率下,“NTC 转码为 BCn”模式将测试应用程序的纹理内存占用量减少了 64%,从 272MB 减少到 98MB。然而,“NTC 样本推断”模式将纹理大小显著减少到仅 11.37MB。与非神经压缩相比,这意味着内存使用率减少了 95.8%,与之前的神经压缩模式相比,减少了 88%。

Compusemble 的基准测试显示,启用 RTX 神经纹理压缩后,性能会略有下降。不过,基准测试人员在上一代 RTX 4090 上运行了此测试版软件,而不是当前一代 RTX 5090,因此这些性能下降可能会随着新架构的出现而缩小。

与 NTC 关闭相比,“NTC 转码为 BCn”模式的平均 FPS 下降幅度可以忽略不计,但 1% FPS 的低点明显优于 NTC 关闭时的常规纹理压缩。“NTC 样本推断”模式受到的打击最大,从 1,600 FPS 的中段范围下降到 1,500 FPS 的中段范围。1% 的低点显著下降到 840 FPS 的范围内。

在 1440p 分辨率下,使用 TAA 抗锯齿时,内存容量减少量相同,但 GPU 的性能行为有所不同。这三种模式的运行速度都明显快于 DLSS,运行速度接近 2000 FPS。在“NTC 样本推理”模式下,1% 的低点运行速度在 1,300 FPS 的中间范围内,与 840 FPS 相比有了很大的飞跃。

毫不奇怪,将分辨率提高到 4K 会显著降低性能。启用 DLSS 升级后,在“NTC 转码为 BCn”模式下,平均 FPS 在 1,100 FPS 范围内,在“NTC 样本推理”模式下,平均 FPS 略低于 1,000 FPS。两种模式的 1% 低点都在 500 FPS 范围内。禁用 DLSS 转而使用 TAA 抗锯齿的原始分辨率后,在“NTC 转码为 BCn”模式下,平均 FPS 提升到 1,700 FPS 范围,在“NTC 样本推理”模式下,平均 FPS 在 1,500 范围内。前一种 NTC 模式的 1% 低点略低于 1,100 FPS,而后一种模式的 1% 低点略低于 800 FPS。

最后,Compusemble 在 4K 分辨率下使用“NTC 样本推理”模式测试了协作向量,并启用了 TAA。启用协作向量后,平均帧速率在 1,500 范围内,禁用协作向量后,平均 FPS 骤降至略低于 650 FPS。同样,在启用协作向量的情况下,1% 的最低帧速率略低于 750 FPS;禁用协作向量后,1% 的最低帧速率略高于 400 FPS。

总结

Compusemble 的 RTX NTC 基准测试显示,Nvidia 的神经压缩技术可以大量减少 3D 应用程序的内存纹理占用,但却以牺牲性能为代价,尤其是在“样本推理”模式下。

DLSS 与原生分辨率性能的对比是最有趣的方面。原生分辨率下帧率的显著提升表明,用于处理 RTX NTC 的张量核心承受着巨大的压力,可能已经到了 DLSS 升级性能受到阻碍的地步,足以成为着色器核心的瓶颈。如果不是这样,我们应该看到 DLSS 模式的运行帧率高于原生 4K TAA 基准。

RTX 神经纹理压缩至少已经开发了几年。新技术使用现代 Nvidia GPU 中的张量核心来压缩 3D 应用程序和视频游戏纹理,而不是传统的块截断编码。RTX NTC 代表了自 1990 年代以来纹理压缩技术的首次大规模升级,允许比当今 GPU 能够运行的分辨率高出四倍的纹理。

该技术处于测试阶段,尚无发布日期。有趣的是,NTC 的最低要求似乎出奇地低。Nvidia 的 RTX NTC GitHub 页面确认最低 GPU 要求是RTX 20 系列GPU。不过,该技术也已验证可在 GTX 10 系列 GPU、AMD Radeon RX 6000系列 GPU 和 Arc A 系列GPU 上运行,这表明我们可能会看到该技术在非 RTX GPU 甚至游戏机上成为主流。

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

今天是《半导体行业观察》为您分享的第4031期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...