» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] 巨硬的神秘力量:X1的ESRAM理论带宽从102GB/s飙升88%至192GB/s

Apparently, there are spare processing cycle "holes" that can be utilised for additional operations. Theoretical peak performance is one thing, but in real-life scenarios it's believed that 133GB/s throughput has been achieved with alpha transparency blending operations (FP16 x4).

前面有人說理論頻寬就是可以達到的實際頻寬,理論上是沒錯
但是微軟ESRAM這個192GB意義上跟我們一般的理論頻寬並不同
DDR3 GDDR5的理論頻寬就是指一次可以達到的最大資料量
微軟的作法是利用處理時間等待的時候可以去做其他讀寫動作
所以理論上是192GB但實際運用上的最高頻寬只有133GB
但是利用讀寫同時進行的這種算法最高頻寬依然是102GB
差別只是同時處理的資料流量可以到133GB,但是GPU一次往返的資料流量依然是102GB

Apparently, there are spare processing cycle "holes" that can be utilised for additional operations. Theoretical peak performance is one thing
比較有趣的是....各位有沒有發現這個能力其實是建立在GPU讓ESRAM去等的時間發揮出來的能力????
還是那句老話~~~~除非換GPU架構,不然ESRAM要發揮低延遲的能力實在很難


TOP

引用:
原帖由 你老闆 于 2013-6-29 07:14 发表
Everyone is developer,suddenly
看的懂數據跟原理跟是不是開發者完全兩碼事~~~~
記憶體存取這方面的原理其實很久沒有大進展了基本上都是一直疊床架屋下去
跟GPU一代變革過一代相去甚遠矣~~~~

文章最後還有提到GDDR5的高延遲可能對PS4的CPU有影響~~~~
不過CPU的延遲主要還是看自己的快取怎麼去緩衝比較重要吧~~~~



本帖最近评分记录
  • shinkamui 激骚 +2 感谢分享 2013-6-29 17:08

TOP

引用:
原帖由 KoeiSangokushi 于 2013-6-29 08:51 发表

你搞错了,133GB/S只是文章随便列举某一种带宽超过102GB/S时的用法而已
ESRAM支持192GB/S的用法
并不是最高仅支持133GB/S——如果真是这样,那文章也就不会提什么192GB/S了
Theoretical peak performance is one thing, but in real-life scenarios it's believed that 133GB/s throughput has been achieved with alpha transparency blending operations (FP16 x4).

閣下可以自己翻翻看這段~~~~~

這是這位開發者自己說的~~~~
理論的192GB上是一回事
實際使用上可能用到的是133GB
只是說明理論上頻寬的話就不會用is one thing, but in real-life
這樣的說詞了

according to sources who have been briefed by Microsoft, the original bandwidth claim derives from a pretty basic calculation - 128 bytes per block multiplied by the GPU speed of 800MHz offers up the previous max throughput of 102.4GB/s. It's believed that this calculation remains true for separate read/write operations from and to the ESRAM

還有這段~~~
ESRAM的讀寫頻寬依然是102GB,這個硬體數值實際上也沒有變大
只是利用ESRAM等資料的間隙來同時作讀寫的動作
同樣的技術SONY以前也說過用XDR同時寫入可以達到超過25.6GB的頻寬
只是實用性高低的問題

[ 本帖最后由 lkig 于 2013-6-29 12:55 编辑 ]


TOP

引用:
原帖由 KoeiSangokushi 于 2013-6-29 08:53 发表

PS4的CPU还能怎样缓存?CPU都是一样的美洲豹,一样的缓存规格
反倒是X1的CPU可以通过GPU利用到ESRAM做缓存(理论上)
CPU緩存????
就跟一般PC一樣啊~~~
這邊就要靠美洲豹自己了~~
難道你指望主記憶體來幫你做緩存????


X1的CPU透過ESRAM緩存????
ESRAM是接在GPU上的耶~~~~
你要這樣搞一樣要過DDR3這樣延遲不就又更大了????
再說ESRAM還是比CPU上的快取延遲高多了
就算把他接在CPU上也是於事無補~~~~~

TOP

引用:
原帖由 KoeiSangokushi 于 2013-6-29 13:51 发表
posted by wap, platform: Chrome

没发现有什么符合的,他说PS4可以用CPU缓冲来解决GDDR5不适合当系统内存的问题,我说PS4的CPU和X1一样,凭什么PS4就能解决?
你沒搞懂我說的~~~~
不是PS4可以靠CPU解決延遲問題......而是所有CPU的延遲問題都要靠自己解決~~~~
你要靠主記憶体解決延遲問題,說白了你的CPU根本就廢了


說穿了你搞錯一件最根本的問題了
CPU解決延遲問題靠的是自己的快取,不是靠主記憶體的低延遲來解決塞車問題~~~~
如果PS4的CPU有延遲問題,X1一定也會有因為兩者都是同一顆CPU
不可能靠DDR3跟GDDR5的延遲差異就有辦法改善~~~~
因為現存的記憶體包括ESRAM的延遲跟CPU的自己的緩存比起來都是飛機跟腳踏車的差別~~~
die 面積愈大 --> 電晶體訊號傳遞延遲愈高 --> 存取 latency 愈高
更別提你還要繞一圈從主記憶體裡抓東西

我再說白一點~~~~
也沒有一家主記憶體廠主打的是低延遲
只有CPU自己配的快取才會強調這一點


實際的例子可以去比較在A牌跟I牌快取差異
I牌多顆L3快取能減緩多少延遲增加多少性能
但是A牌本身緩存就有問題,你給他配什麼記憶體在解決緩存不如I牌這塊上一樣都沒救

[ 本帖最后由 lkig 于 2013-6-29 17:59 编辑 ]

TOP

发新话题
     
官方公众号及微博