本文来自微信公众号“聚大模型前言”,【作者】Jackie。
据悉,英伟达RTX 5070 Ti、5090 D和5090显卡存在ROP(光栅操作流水线,也叫渲染输出单元)缺失的情况,这直接导致了至少4%的性能下降。考虑到英伟达官方承认的这一数据,此次问题的影响不容小觑。
此类问题并不罕见。AMD的Vega系列曾因多种封装技术故障,导致散热不佳,加上初始驱动糟糕,给用户带来了极差体验;英伟达自己的RTX 20系列也问题重重,显存出现故障,且RTX显卡在实际游戏中部分RT功能缺失。然而,此次RTX 50系列的问题更为严重。
TechPowerUp的调查发现,部分RTX5090显卡的ROP数量本应为176个,实际却只有168个;5070 Ti显卡的ROP数量从96个减少到88个,这一变化幅度高达9%,对性能的影响可能远超英伟达宣称的4%。尽管目前还无法确切知晓实际性能影响程度,但已有迹象表明,这一问题对不同分辨率和抗锯齿设置下的游戏性能产生了显著影响。面对这一问题,英伟达发布声明称,已确认这是一个罕见问题,受影响的显卡不到0.5%,平均图形性能影响为4%,且对AI和计算工作负载无影响,建议消费者联系制造商进行更换。但TechPowerUp指出,英伟达所说的“一个ROP单元缺失”,实际意味着8个ROP缺失,这一解释引发了更多质疑。
从技术层面深入分析,以RTX5090使用的GB202 GPU为例,其完整芯片包含多个组件,在制造过程中,英伟达通常会根据芯片情况,对部分组件进行禁用,以生产不同规格的产品。然而,此次ROP缺失问题的出现,可能是由于制造缺陷或过多相邻TPC(纹理处理集群)被禁用,导致与ROP的连接出现问题。但英伟达并未完全公开TPC与ROP的连接方式及相关技术细节,这使得外界只能进行推测。
在通常的产品质量把控环节,每一块芯片在出厂前都会经过严格测试,无论是在芯片制造工厂,还是在显卡组装工厂,都会进行电气测试和功能测试,且通常会使用至少两套软件进行检测。因此,很难相信英伟达对这一问题毫不知情。这不禁让人怀疑,英伟达是严重失职,未能检测出问题,还是明知有缺陷却依然选择发货。
此次事件对英伟达的品牌信誉造成了极大的冲击。一直以来,消费者购买英伟达产品,是因为其产品质量可靠、性能稳定。但此次RTX 50系列的问题,让消费者对英伟达产品的信任大打折扣,如今,打开英伟达产品包装盒,消费者不再能确定产品是否真如宣传所说。
对于整个显卡市场而言,英伟达此次的失误给AMD和英特尔带来了难得的机遇。目前,英伟达在消费者市场的口碑处于历史低谷,尤其是在游戏玩家这一重要群体中。如果AMD和英特尔能够抓住这个机会,在产品定价、性能提升以及推出新品等方面积极作为,就有可能抢占更多的市场份额。
不过,英伟达一贯以市场攻击性强著称,过往在产品发布遇挫后,如RTX20系列发布问题频出后,推出的RTX3080迅速调整策略,实现了市场逆转。此次面对RTX 50系列的问题,如果英伟达依然重视游戏市场,积极采取措施解决问题,加大研发和优化力度,提升产品质量,也有可能挽回局面。
参考资料:https://www.youtube.com/watch?v=LvBtfqU6svo
https://www.techpowerup.com/332884/nvidia-geforce-rtx-50-cards-spotted-with-missing-rops-nvidia-confirms-the-issue-multiple-vendors-affected