» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

比一下ps以来历代主机的性能吧

引用:
原帖由 KoeiSangokushi 于 2014-4-24 10:59 发表
posted by wap, platform: 小米 (MI 1S)

我就给你上上课
一、GPU实际效能不等于浮点性能,而是与流处理器性能有一个比值,每一定的GPU性能所需的流处理器性能,假设R500和R600为5,那么GCN为4,开普勒为2,而G80仅 ...
1:R500是分离渲染架构,只有PS和VS单元,没有统一流处理器
2:GCN是基于SIMD阵列的MIMD架构,开普勒是SIMT,前者不同于传统的VILW5和VILW4,后者和G80-GF110的SIMD也不完全一样,这一代双方的架构是二者互相借鉴的架构
3:从DX9初期开始ATI和NV就在显卡架构内用各种方式尽量解决标量指令执行效率低下的问题,比如R300允许Co-issue操作,G70支持2D+2D和3D+1D两种模式。R600的VILW5问题在于五个ALU被捆绑在同一个SIMD Shader内部,所有ALU共用一个指令发射端口,Shader必须获得完整的5D指令包才能让5个ALU同时运行,如果少于5条指令或者加入条件指令,执行效率就有折扣,但不代表任何情况下都有折扣。认为G80一个流处理器就可以完全等同于R600的5个?连NV自己都不敢说这话
4:就算NV从G80到GF100三代架构用的都是MIMD架构,每GPC的SM数不一样,每SM的流处理器数不一样,哪怕核心频率和CUDA分频都一样,三代架构每一代的单个流处理器性能也是不一样的

SIMD、MIMD、SIMT之间的思路区别和实际效能不同写一篇论文都写不完,用一个简单的比值就能简单概括两个公司几代显卡的浮点性能和实际表现的区别?你去找NV和AMD自己工程师看看有谁敢说这话不?我还没提同一个架构对ROP和纹理单元分配不同造成的影响

[ 本帖最后由 Nemo_theCaptain 于 2014-4-24 17:58 编辑 ]


TOP

引用:
原帖由 KoeiSangokushi 于 2014-4-24 15:58 发表

360采用的R500修改版Xenos不是X1900XT
它是世界上第一款采用统一渲染架构的GPU
拥有240个ALU(当时还没取SP的名字)
组成48组ALUs
虽然没有被正式命名为5D架构,但是实际上就是5D架构
Xenos不是分离渲染还用你教?Xenos跟R500是完全一样的东西么?我引用的原贴上面写的就是R500不是Xenos
再说Xenos只能算DX9.0c+,不算DX10,它把PS和VS合并了,但寄存器并不能完全满足DX10的需求



TOP

引用:
原帖由 KoeiSangokushi 于 2014-4-24 15:59 发表

这个比值关系经历了时间的考验,从2006年到2014年,均适用

每一定的GPU性能所需的流处理器性能,假设R500和R600为5,那么GCN为4,开普勒为3,而G80仅需1

当然我们都知道GPU具体的性能影响因素极多,但是这个 ...
G80到GF110这三代架构,NV的显卡核心和Shader都是分频的,9800GTX当然也不例外,一直到开普勒才取消这个设计
分频状态下Shader的频率高,其他设施处在分频前的较低频率上,对整个显卡流水线的延迟平衡有严重影响
所以我前面就说过除了Shader以外ROP和纹理单元这些设施对显卡最终性能的影响也很大,分频是NV独有的问题,不分频的显卡也有ROP数量的问题,5830、6790都是反面教材
抛开外围设施只谈Shader的RAW Power,那9800GTX就应该用1688MHz而不是675MHz

谈显卡性能不能抛开外围设施,760和7870的纹理单元都不一样还怎么比
要比去比外围设施完全一样的,比如这个6930,5870的纹理单元和ROP和7870一样多但我没见过同频对比评测就算了
http://www.inpai.com.cn/doc/hard/168475_30.htm
你抛开外围设施只比Shader的RAW Power,那9800GTX就得按照1688MHz算

再说AMD的VILW5都是贴图卡,碰到特效复杂的游戏头就大,就像当年GTX580面对HD5870在部分项目里领先不止18%一样,HD7870在部分项目里领先HD5870也不止18%,以后整个行业进入纯DX11架构,大幅领先的游戏还会越来越多


TOP

发新话题
     
官方公众号及微博