» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] AMD高级副总裁兼首席财务官透露下一代主机研发中,本代主机的生命周期可能会短一些

引用:
原帖由 f0f0f0 于 2014-6-7 17:02 发表

纸面性能是指理论性能还是?
规模

HD2900仅有320个5D流处理器(等效64个)@600MHz和16个光栅化单元
G80则有128个流处理器@675Mhz和24个光栅化单元

至于带宽,因为HD2900的核心性能严重不足,所以这么大的吞吐完全用不上


TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 17:07 发表

Xenos在2005年的PC上没有同架构产品,一直到2007年的R600,AMD才在PC上搞出统一渲染
反倒是统一渲染做的最快最好的NV,RSX从忽悠中的7850级别最后变成相当于7600GT的阉割货,而且完全是从2005年的G70这个现成产品 ...
我一直是在说这个道理

况且那时候正是ATI最艰难的时期,拿出来的产品依然够说服力



TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:09 发表

VLIW5也好1D也好,看得不都是浮点吞吐么,理论FP32的话8800 GTX还不如2900 XT,怎么看也不是一半啊。
http://www.techpowerup.com/gpudb/192/radeon-hd-2900-xt.html
http://www.techpowerup.com/gpudb/187/gefo ...
不,我这里说的吞吐不是指浮点吞吐,而是指带宽吞吐

浮点这个概念从进入上个次世代起就在游戏中没有实际意义了,因为有太多DirectComputer相关的东西了,拿来算蛋白质挖矿倒是有用


TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:12 发表

我是说前面提的纸面性能一半的说法,上面那链接里也有纹理、像素填充率的理论值。
我已经解释了,就是GPU架构的规模

你说的纹理单元、像素填充率这些我没去看,因为瓶颈卡在了流处理器的渲染性能不足和ATI在当时不合理的光栅化单元设计所导致的低下抗锯齿性能上面

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:15 编辑 ]

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 17:19 发表

R600弱到这个地步的主要原因是ROP有重大BUG,开了抗锯齿直接变成残废,连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP,消除了BUG,为抗锯齿竭力优化
R600的纹理单元少了一些,在实际上依然 ...
芯片发热量的问题主要是由于HD2900搭载了512bit的位宽以及GDDR4显存

这两个玩意无论是规模还是发热量在当时都是非常庞大的存在(以G80的强悍,也只搭载了384bit的位宽和GDDR3显存就满足了需求,后期的G92更是精简到了256bit而依然保证了和G80持平的性能水准)

实际上由于HD2900的流处理器性能低下,这么大的带宽根本没有派上用场

而且HD2900XT更是走火入魔,把核心频率也拉到了740MHz(HD2900是600MHz),同时显存从512MB翻倍到了1GB,简直是火上浇油

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:31 编辑 ]

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:25 发表

这样比没意义,同厂家的跨代都不一定能单比ALU数量,前面那750 Ti白皮书里已经证明了这一点,虽然这是因为Kepler的一个缺陷特例。ROP的例子是前面说的Tesla 10和Fermi的对比。
因为你前面提到纸面性能我才去找的T ...
所以说你还是不够懂显卡

显卡这玩意,不同架构下的流处理器之间是有换算关系的

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:32 发表

有意义的就是实测浮点吞吐,一般宣传也就说SGEMM、DGEMM,没有什么一劳永逸的换算公式。
换算公式在不同架构间都是变化的

浮点吞吐毫无意义

HD4850就达到了1T,比费米还高

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 17:34 发表

05年NV能拿出G80架构产品一点都不搞笑
G80在06年春就流片成功了,之所以到06年春才搞定的原因不是架构先进,而是面积太大
如果NV为了主机等比缩减一个小核心,05年内就能流片,这样赶不上2005年的主机发售,但赶 ...
没错
HD5770功耗只有108瓦,DX9性能有GTX260+的95%,DX11性能更不用提(前者跑战地叛逆连队2开始流畅开DX11特效,后者直接不支持),而GTX260+功耗高达183瓦(新工艺版本)

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:35 发表

SP也好CC也好,比的就是浮点吞吐,ALU还比什么?既然有公式就说出来看看嘛,就NV而言,Kepler和Tesla、Tesla 10、Fermi、Maxwell都不一样。
我觉得你的误区真的很多,我再列一个:

很多人以为架构就是彻头彻尾的变革,全方面的效率提高

不对

新架构的本质用意就是在增加更多流处理器等核心规模(有时候也包含一些小特性)的前提下,不造成瓶颈效应

绝大多数情况下所谓的提升都是建立在有了更多的流处理器、或者更高的频率、或者更好的工艺达成的更高的集成度来完成的

就像AMD从Xenos进化到HD6870,本质的效率并没有改变什么(除了增加了DX11特性),尽管中间经历了多个有代号的架构进化

而HD6970就是一个较大的革新,因为改为了4D流处理器,GCN也只是这个架构的小规模修改版本的延续,效率上的提高并不算大

NV那边也是,从G80到GTX480,本质的效率也没有什么变动(硬要追究的话,其实反而是下降了的,因为费米比G80和G92的流处理器/核心分频比值降低了),而从GTX480到GTX680则是大幅度下降,因为流处理器架构发生了质变,目前就是类似于AMD的水平,麦克斯韦变动也未必会很大,更大的可能是,麦克斯韦进一步精简了流处理器的结构,同时加大了集成度,当然,小部件和新的小特性的修改和追加也肯定会有,但是不可能会有太多的质变

实际上,统一渲染架构的出现就是GPU历史上最大的变革,没有之一,在可预见的将来,也不会有比这更大的变革

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:52 编辑 ]

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:51 发表

而HD6970就是一个较大的革新,因为改为了4D流处理器,GCN也只是这个架构的小规模修改版本的延续,本质上变动很小

NV那边也是,从G80到GTX480,本质的效率也没有什么变动(硬要追究的话,其实反而是下降了的,因 ...
GCN的变动比HD6870到HD6970的变动小的多

后面那个580应该是680,我打错了

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:55 发表

AMD要哭了,VLIW5到VLIW4变化算大,16个1D标量的GCN变化算小。
我说的是效率上的

看清楚

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 17:57 发表

GCN改进的就是效率啊,而且除了效率结构上GCN改变也很大。
从效率上讲是换汤不换药的

每SIMD有16个Shader,每Shader有4流处理器
与每SIMD有4个Shader,每Shader有16个流处理器

从每单个流处理器效率角度来看,依然是跟4D架构等同效率

仅此而已

GCN最大的意义还是在于为堆更多的流处理器铺平了道路,解决了潜在的瓶颈

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 18:06 编辑 ]

TOP

引用:
原帖由 f0f0f0 于 2014-6-7 18:11 发表

http://www.anandtech.com/show/5261/amd-radeon-hd-7970-review/3
Cayman之前是指令级并行,依赖指令打包,GCN改为标量单元和线程级并行,效率确实有改进。
效率上的改进是非常小的

GCN和开普勒的流处理器换算比例大致在4比3(应该还差一点)

等到麦克斯韦,估计就是4比3了

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 18:19 发表

你说麦克斯韦能搞定15年之前的AMD所有产品倒是有可能
开普勒就算了吧
GCN2.0应该年内就出了
GTX680跟HD7970相当

后者还比前者早出一个季度(2011年11月,2012年3月)

实际上,进入GCN和开普勒时代后,显卡领域迎来了前所未有的性能接近时代

双方旗舰单GPU显卡的性能接近幅度可以说是历史上绝无仅有的

本质原因则是因为双方的架构理念前所未有的接近了

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 18:25 编辑 ]

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-6-7 18:25 发表

现在这个叫法很混乱,但基本认为Hawaii和Bonaire属于GCN1.1,本来它们的改进就达不到2.0的程度
2.0可能是今年的Tonga
总之AMD今年会拿出一个专门对付750的产品,而且架构会有进一步改进,这是基本确定的
R9 290(夏威夷)其实已经在流处理器方面堆到跟GTX780TI同等水准了(2816 vs 2880)
下面就是要进一步的提高效率
AN两家现在的流处理器效率已经是空前的接近了
GCN 2.0应该可以期待

TOP

发新话题
     
官方公众号及微博