打印

[新闻] AMD高级副总裁兼首席财务官透露下一代主机研发中，本代主机的生命周期可能会短一些

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

76^# 大中小发表于 2014-6-7 17:05 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:02 发表

纸面性能是指理论性能还是？

规模

HD2900仅有320个5D流处理器（等效64个）@600MHz和16个光栅化单元
G80则有128个流处理器@675Mhz和24个光栅化单元

至于带宽，因为HD2900的核心性能严重不足，所以这么大的吞吐完全用不上

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

77^# 大中小发表于 2014-6-7 17:09 显示全部帖子

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 17:07 发表

Xenos在2005年的PC上没有同架构产品，一直到2007年的R600，AMD才在PC上搞出统一渲染
反倒是统一渲染做的最快最好的NV，RSX从忽悠中的7850级别最后变成相当于7600GT的阉割货，而且完全是从2005年的G70这个现成产品 ...

我一直是在说这个道理

况且那时候正是ATI最艰难的时期，拿出来的产品依然够说服力

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

78^# 大中小发表于 2014-6-7 17:10 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:09 发表

VLIW5也好1D也好，看得不都是浮点吞吐么，理论FP32的话8800 GTX还不如2900 XT，怎么看也不是一半啊。
http://www.techpowerup.com/gpudb/192/radeon-hd-2900-xt.html
http://www.techpowerup.com/gpudb/187/gefo ...

不，我这里说的吞吐不是指浮点吞吐，而是指带宽吞吐

浮点这个概念从进入上个次世代起就在游戏中没有实际意义了，因为有太多DirectComputer相关的东西了，拿来算蛋白质挖矿倒是有用

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

79^# 大中小发表于 2014-6-7 17:13 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:12 发表

我是说前面提的纸面性能一半的说法，上面那链接里也有纹理、像素填充率的理论值。

我已经解释了，就是GPU架构的规模

你说的纹理单元、像素填充率这些我没去看，因为瓶颈卡在了流处理器的渲染性能不足和ATI在当时不合理的光栅化单元设计所导致的低下抗锯齿性能上面

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:15 编辑 ]

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

80^# 大中小发表于 2014-6-7 17:26 显示全部帖子

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 17:19 发表

R600弱到这个地步的主要原因是ROP有重大BUG，开了抗锯齿直接变成残废，连更老的显卡都没出现过这么离谱的问题
所以R700时代AMD重新设计了ROP，消除了BUG，为抗锯齿竭力优化
R600的纹理单元少了一些，在实际上依然 ...

芯片发热量的问题主要是由于HD2900搭载了512bit的位宽以及GDDR4显存

这两个玩意无论是规模还是发热量在当时都是非常庞大的存在（以G80的强悍，也只搭载了384bit的位宽和GDDR3显存就满足了需求，后期的G92更是精简到了256bit而依然保证了和G80持平的性能水准）

实际上由于HD2900的流处理器性能低下，这么大的带宽根本没有派上用场

而且HD2900XT更是走火入魔，把核心频率也拉到了740MHz（HD2900是600MHz），同时显存从512MB翻倍到了1GB，简直是火上浇油

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:31 编辑 ]

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

81^# 大中小发表于 2014-6-7 17:27 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:25 发表

这样比没意义，同厂家的跨代都不一定能单比ALU数量，前面那750 Ti白皮书里已经证明了这一点，虽然这是因为Kepler的一个缺陷特例。ROP的例子是前面说的Tesla 10和Fermi的对比。
因为你前面提到纸面性能我才去找的T ...

所以说你还是不够懂显卡

显卡这玩意，不同架构下的流处理器之间是有换算关系的

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

82^# 大中小发表于 2014-6-7 17:33 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:32 发表

有意义的就是实测浮点吞吐，一般宣传也就说SGEMM、DGEMM，没有什么一劳永逸的换算公式。

换算公式在不同架构间都是变化的

浮点吞吐毫无意义

HD4850就达到了1T，比费米还高

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

83^# 大中小发表于 2014-6-7 17:38 显示全部帖子

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 17:34 发表

05年NV能拿出G80架构产品一点都不搞笑
G80在06年春就流片成功了，之所以到06年春才搞定的原因不是架构先进，而是面积太大
如果NV为了主机等比缩减一个小核心，05年内就能流片，这样赶不上2005年的主机发售，但赶 ...

没错
HD5770功耗只有108瓦，DX9性能有GTX260+的95%，DX11性能更不用提（前者跑战地叛逆连队2开始流畅开DX11特效，后者直接不支持），而GTX260+功耗高达183瓦（新工艺版本）

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

84^# 大中小发表于 2014-6-7 17:47 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:35 发表

SP也好CC也好，比的就是浮点吞吐，ALU还比什么？既然有公式就说出来看看嘛，就NV而言，Kepler和Tesla、Tesla 10、Fermi、Maxwell都不一样。

我觉得你的误区真的很多，我再列一个：

很多人以为架构就是彻头彻尾的变革，全方面的效率提高

不对

新架构的本质用意就是在增加更多流处理器等核心规模（有时候也包含一些小特性）的前提下，不造成瓶颈效应

绝大多数情况下所谓的提升都是建立在有了更多的流处理器、或者更高的频率、或者更好的工艺达成的更高的集成度来完成的

就像AMD从Xenos进化到HD6870，本质的效率并没有改变什么（除了增加了DX11特性），尽管中间经历了多个有代号的架构进化

而HD6970就是一个较大的革新，因为改为了4D流处理器，GCN也只是这个架构的小规模修改版本的延续，效率上的提高并不算大

NV那边也是，从G80到GTX480，本质的效率也没有什么变动（硬要追究的话，其实反而是下降了的，因为费米比G80和G92的流处理器/核心分频比值降低了），而从GTX480到GTX680则是大幅度下降，因为流处理器架构发生了质变，目前就是类似于AMD的水平，麦克斯韦变动也未必会很大，更大的可能是，麦克斯韦进一步精简了流处理器的结构，同时加大了集成度，当然，小部件和新的小特性的修改和追加也肯定会有，但是不可能会有太多的质变

实际上，统一渲染架构的出现就是GPU历史上最大的变革，没有之一，在可预见的将来，也不会有比这更大的变革

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 17:52 编辑 ]

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

85^# 大中小发表于 2014-6-7 17:52 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:51 发表

而HD6970就是一个较大的革新，因为改为了4D流处理器，GCN也只是这个架构的小规模修改版本的延续，本质上变动很小

NV那边也是，从G80到GTX480，本质的效率也没有什么变动（硬要追究的话，其实反而是下降了的，因 ...

GCN的变动比HD6870到HD6970的变动小的多

后面那个580应该是680，我打错了

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

86^# 大中小发表于 2014-6-7 17:56 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:55 发表

AMD要哭了，VLIW5到VLIW4变化算大，16个1D标量的GCN变化算小。

我说的是效率上的

看清楚

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

87^# 大中小发表于 2014-6-7 18:03 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 17:57 发表

GCN改进的就是效率啊，而且除了效率结构上GCN改变也很大。

从效率上讲是换汤不换药的

每SIMD有16个Shader，每Shader有4流处理器
与每SIMD有4个Shader，每Shader有16个流处理器

从每单个流处理器效率角度来看，依然是跟4D架构等同效率

仅此而已

GCN最大的意义还是在于为堆更多的流处理器铺平了道路，解决了潜在的瓶颈

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 18:06 编辑 ]

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

88^# 大中小发表于 2014-6-7 18:13 显示全部帖子

引用:

原帖由 f0f0f0 于 2014-6-7 18:11 发表

 http://www.anandtech.com/show/5261/amd-radeon-hd-7970-review/3
Cayman之前是指令级并行，依赖指令打包，GCN改为标量单元和线程级并行，效率确实有改进。

效率上的改进是非常小的

GCN和开普勒的流处理器换算比例大致在4比3（应该还差一点）

等到麦克斯韦，估计就是4比3了

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

89^# 大中小发表于 2014-6-7 18:19 显示全部帖子

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 18:19 发表

你说麦克斯韦能搞定15年之前的AMD所有产品倒是有可能
开普勒就算了吧
GCN2.0应该年内就出了

GTX680跟HD7970相当

后者还比前者早出一个季度（2011年11月，2012年3月）

实际上，进入GCN和开普勒时代后，显卡领域迎来了前所未有的性能接近时代

双方旗舰单GPU显卡的性能接近幅度可以说是历史上绝无仅有的

本质原因则是因为双方的架构理念前所未有的接近了

[ 本帖最后由 KoeiSangokushi 于 2014-6-7 18:25 编辑 ]

TOP

KoeiSangokushi

魔神至尊

帖子: 18238
精华: 0
积分: 26631
激骚: 140 度
爱车
主机
相机
手机
注册时间: 2007-10-17

PS区生还者入格奖☆ TGFC 2014新年勋章☆☆☆☆ TGFC 2015新年勋章☆☆☆☆ TGFC 2017新年勋章☆☆☆☆ TGFC 2018新年勋章☆☆☆☆

发短消息
加为好友
当前离线

90^# 大中小发表于 2014-6-7 18:29 显示全部帖子

引用:

原帖由 Nemo_theCaptain 于 2014-6-7 18:25 发表

现在这个叫法很混乱，但基本认为Hawaii和Bonaire属于GCN1.1，本来它们的改进就达不到2.0的程度
2.0可能是今年的Tonga
总之AMD今年会拿出一个专门对付750的产品，而且架构会有进一步改进，这是基本确定的

R9 290（夏威夷）其实已经在流处理器方面堆到跟GTX780TI同等水准了（2816 vs 2880）
下面就是要进一步的提高效率
AN两家现在的流处理器效率已经是空前的接近了
GCN 2.0应该可以期待

TOP