» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

比一下ps以来历代主机的性能吧

posted by wap, platform: 小米 (MI 1S)
引用:
原帖由 @ns2014  于 2014-4-24 12:53 发表
posted by wap, platform: Chrome

原来官方算法还不如你...
用来挖矿、算蛋白质有用,用来游戏没用

本帖最后由 KoeiSangokushi 于 2014-4-24 12:57 通过手机版编辑


TOP

再看看XBOX这几个:





TOP

引用:
原帖由 KoeiSangokushi 于 2014-4-24 10:59 发表
posted by wap, platform: 小米 (MI 1S)

我就给你上上课
一、GPU实际效能不等于浮点性能,而是与流处理器性能有一个比值,每一定的GPU性能所需的流处理器性能,假设R500和R600为5,那么GCN为4,开普勒为2,而G80仅 ...
1:R500是分离渲染架构,只有PS和VS单元,没有统一流处理器
2:GCN是基于SIMD阵列的MIMD架构,开普勒是SIMT,前者不同于传统的VILW5和VILW4,后者和G80-GF110的SIMD也不完全一样,这一代双方的架构是二者互相借鉴的架构
3:从DX9初期开始ATI和NV就在显卡架构内用各种方式尽量解决标量指令执行效率低下的问题,比如R300允许Co-issue操作,G70支持2D+2D和3D+1D两种模式。R600的VILW5问题在于五个ALU被捆绑在同一个SIMD Shader内部,所有ALU共用一个指令发射端口,Shader必须获得完整的5D指令包才能让5个ALU同时运行,如果少于5条指令或者加入条件指令,执行效率就有折扣,但不代表任何情况下都有折扣。认为G80一个流处理器就可以完全等同于R600的5个?连NV自己都不敢说这话
4:就算NV从G80到GF100三代架构用的都是MIMD架构,每GPC的SM数不一样,每SM的流处理器数不一样,哪怕核心频率和CUDA分频都一样,三代架构每一代的单个流处理器性能也是不一样的

SIMD、MIMD、SIMT之间的思路区别和实际效能不同写一篇论文都写不完,用一个简单的比值就能简单概括两个公司几代显卡的浮点性能和实际表现的区别?你去找NV和AMD自己工程师看看有谁敢说这话不?我还没提同一个架构对ROP和纹理单元分配不同造成的影响

[ 本帖最后由 Nemo_theCaptain 于 2014-4-24 17:58 编辑 ]


TOP

引用:
原帖由 Nemo_theCaptain 于 2014-4-24 15:54 发表

1:R500是分离渲染架构,只有PS和VS单元,没有统一流处理器,更不是VLIW5架构,5这个数是怎么得出来的?
2:GCN是基于SIMD阵列的MIMD架构,开普勒是SIMT,前者不同于传统的VILW5和VILW4,后者和G80-GF110的SIMD也 ...
360采用的R500修改版Xenos不是X1900XT
它是世界上第一款采用统一渲染架构的GPU
拥有240个ALU(当时还没取SP的名字)
组成48组ALUs
虽然没有被正式命名为5D架构,但是实际上就是5D架构

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-4-24 15:54 发表

1:R500是分离渲染架构,只有PS和VS单元,没有统一流处理器,更不是VLIW5架构,5这个数是怎么得出来的?
2:GCN是基于SIMD阵列的MIMD架构,开普勒是SIMT,前者不同于传统的VILW5和VILW4,后者和G80-GF110的SIMD也 ...
这个比值关系经历了时间的考验,从2006年到2014年,均适用

每一定的GPU性能所需的流处理器性能,假设R500和R600为5,那么GCN为4,开普勒为3,而G80仅需1

当然我们都知道GPU具体的性能影响因素极多,但是这个比值符合总体的图形性能差异,而所谓的浮点性能,则基本不能反应实际情况(除非是相同架构,这时候的浮点数值比例与流处理器性能比例一致)

举例来说,HD4850与9800GTX的性能关系=800/5*625/128/675=1.16
HD7870与HD5870的性能关系=1280/4*1000/1600*5/850=1.18
HD7870与GTX760的性能关系=1280/4*1000/1152*3/900=0.93

都非常的精确

[ 本帖最后由 KoeiSangokushi 于 2014-4-24 16:23 编辑 ]

TOP

引用:
原帖由 KoeiSangokushi 于 2014-4-24 15:58 发表

360采用的R500修改版Xenos不是X1900XT
它是世界上第一款采用统一渲染架构的GPU
拥有240个ALU(当时还没取SP的名字)
组成48组ALUs
虽然没有被正式命名为5D架构,但是实际上就是5D架构
Xenos不是分离渲染还用你教?Xenos跟R500是完全一样的东西么?我引用的原贴上面写的就是R500不是Xenos
再说Xenos只能算DX9.0c+,不算DX10,它把PS和VS合并了,但寄存器并不能完全满足DX10的需求

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-4-24 16:19 发表

Xenos不是分离渲染还用你教?Xenos跟R500是完全一样的东西么?我引用的原贴上面写的就是R500不是Xenos
再说Xenos只能算DX9.0c+,不算DX10,它把PS和VS合并了,但寄存器并不能完全满足DX10的需求
没错

TOP

另外可以比较一下WiiU和360的GPU
320*550/240/500=1.47

也就是说以360的GPU性能为1,那么
WIIU:1.47
X1:6.83
PS4:9.60

[ 本帖最后由 KoeiSangokushi 于 2014-4-24 16:39 编辑 ]

TOP

posted by wap, platform: Chrome
引用:
原帖由 @KoeiSangokushi  于 2014-4-24 16:32 发表
另外可以比较一下WiiU和360的GPU
320*550/240/500=1.47

也就是说以360的GPU性能为1,那么
WIIU:1.47
X1:6.83
PS4:9.60

假设R500和R600为5

wiiu的不就接近这个么,为什么又不要除了

TOP

引用:
原帖由 KoeiSangokushi 于 2014-4-24 15:59 发表

这个比值关系经历了时间的考验,从2006年到2014年,均适用

每一定的GPU性能所需的流处理器性能,假设R500和R600为5,那么GCN为4,开普勒为3,而G80仅需1

当然我们都知道GPU具体的性能影响因素极多,但是这个 ...
G80到GF110这三代架构,NV的显卡核心和Shader都是分频的,9800GTX当然也不例外,一直到开普勒才取消这个设计
分频状态下Shader的频率高,其他设施处在分频前的较低频率上,对整个显卡流水线的延迟平衡有严重影响
所以我前面就说过除了Shader以外ROP和纹理单元这些设施对显卡最终性能的影响也很大,分频是NV独有的问题,不分频的显卡也有ROP数量的问题,5830、6790都是反面教材
抛开外围设施只谈Shader的RAW Power,那9800GTX就应该用1688MHz而不是675MHz

谈显卡性能不能抛开外围设施,760和7870的纹理单元都不一样还怎么比
要比去比外围设施完全一样的,比如这个6930,5870的纹理单元和ROP和7870一样多但我没见过同频对比评测就算了
http://www.inpai.com.cn/doc/hard/168475_30.htm
你抛开外围设施只比Shader的RAW Power,那9800GTX就得按照1688MHz算

再说AMD的VILW5都是贴图卡,碰到特效复杂的游戏头就大,就像当年GTX580面对HD5870在部分项目里领先不止18%一样,HD7870在部分项目里领先HD5870也不止18%,以后整个行业进入纯DX11架构,大幅领先的游戏还会越来越多

TOP

引用:
原帖由 ns2014 于 2014-4-24 17:00 发表
posted by wap, platform: Chrome

假设R500和R600为5

wiiu的不就接近这个么,为什么又不要除了
因为都需要除以5,所以不用除了

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-4-24 17:01 发表

G80到GF110这三代架构,NV的显卡核心和Shader都是分频的,9800GTX当然也不例外,一直到开普勒才取消这个设计
分频状态下Shader的频率高,其他设施处在分频前的较低频率上,对整个显卡流水线的延迟平衡有严重影响
...
之所以这样定G80的比值,就是因为考虑到了核心频率和流处理器频率之间的关系(G80和G92时代是1比2.5,费米时代降低到了2.2左右但是显存带宽的提升却非常明显,所以大致还维系了这个体系)

[ 本帖最后由 KoeiSangokushi 于 2014-4-24 17:22 编辑 ]

TOP

posted by wap, platform: Chrome

................

本帖最后由 ns2014 于 2014-4-24 17:30 通过手机版编辑

TOP

引用:
原帖由 ns2014 于 2014-4-24 17:27 发表
posted by wap, platform: Chrome

你的意思是360的也要除5?
之前你在算x1和360的时候没有除
360本身是240,我算的时候直接写了48

TOP

posted by wap, platform: iPhone

游戏机之间用倍这个所谓的量化数据来比较超级没意义…
也只有pr才喜欢拿这个说事,所谓为了让消费者容易明白…
但你们爱较真干嘛就老纠结于这个pr数字呢?
革命级核心g80的马力不如ps3,实际表现呢?

TOP

发新话题
     
官方公众号及微博