» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[业评] eSRAM和CELL哪个更难开发?

引用:
原帖由 Nemo_theCaptain 于 2014-2-18 23:27 发表

一样,X1唯一的优势是ESRAM的延迟更小点,问题是游戏怎么能利用到这个延迟更小的优势,到现在没人能给出答案,就算有答案,也是边边角角
延迟小在后处理里面是有优势的,毕竟后处理很多时候就是不停的搬显存,带宽和延迟同样重要,计算方面反而需求比较小。然后现在游戏中后处理又耗费了超大部分(有的能超过60%)的时间片……

总之看怎么用了……我只是按pc上的开发说点理论可能性,不代表真有用。


TOP

另外还有个对延迟和带宽敏感的是通用计算,目前大多数通用计算的用法就是后处理,比用ps做的优势就是省带宽。虽然也有做渲染的,比如渐渐流行的tbdr,forward+之类,不过x1流处理器少了点,提升作用估计有限



TOP

引用:
原帖由 Nemo_theCaptain 于 2014-2-19 00:59 发表



这都是理论,实际应用的时候往往没等低延迟发挥出优势,X1的带宽和流处理器规模就先成为瓶颈了
后处理是带宽和延迟瓶颈,大多数后处理对计算要求不高。但渲染用法就不一样了。所以我说后处理可能有不少提升,但用于tbdr那样带重度计算的应该不行。


TOP

定制看的是长远性价比,但需要先期大量投资,还不一定能符合预期,是个赌博。ps3小输,x1目前看大输。

TOP

引用:
原帖由 lkig 于 2014-2-19 01:19 发表


按PC的話那就別提了~~~
PC目前GPU的發展方向是對延遲不明感強烈需求帶寬
GTX780 R290X延遲都比PS4嚴重多了
現在GPU爆多的處理單元本身對於延遲就不敏感
靠多工處理單元搞定大量資料而不是高速處理
等你算完也不會產生什麼延遲了~~~~
閣下的說法比較接近CPU快取的作法
但實際上就算CPU也不會想靠這種方法閃延遲~~~~

X1要發揮ESRAM的優勢反而是要閃掉PC的用法
看看有沒有辦法發揮高速優勢
不然大家一起套PC的用法就是註定被PS4壓著打
但是基本上X1的東西都是套PC的那套......
没错带宽肯定是重要的,但是后处理这种因为是反复多次的存取,一次延迟也许不多,来个几次就不行了,谁家的后处理就一个pass搞定的?然后带宽上esram也不比ddr5低,所以总体来说应该是有不少提升的。

PC目前GPU的發展方向是對延遲不明感強烈需求帶寬,这句用在计算上是对的,大多都是渲染。而传统渲染对带宽的需求很多时候是浪费的,因为每个thread之间不能直接共享,所以会多次读取相同内容。通用计算缓解了这个问题,thread group有可以shared的缓存,从前这么快的只有只读的寄存器,于是带宽需求降低了,但延迟需求还在,因为只要是一个全局显存访问,无论数据量多少,延迟都那么大。这时候esram就非常有用。

TOP

引用:
原帖由 lkig 于 2014-2-19 01:47 发表

問題是現在的GPU的運用沒人會刻意去增加讀取次數~~~
減少頻繁讀存的機會才是現在GPU的發展方向
一次延遲不多,多來幾次就不行了,這是當然~~~
所以像GTX780有能力的卡都是盡量利用大量單元把資料搞定
然後利用大 ...
确实没有人刻意增加读取次数,可是后处理必须多个pass,因为每个pass的输入是前一个pass的输出。那么问题就很明显了,这块数据不大不小,通常一个rt大小,放显存,那么带宽和延迟都是问题,现在有通用计算,可是组内共享缓存不够大,dx11只能32k,cuda也就大一点点,明显放不下,这时候esram就刚好了。我之前就说过,这个esram最好的用法就是拿来做超大的group shared memory。至于像GTX780有能力的卡都是盡量利用大量單元把資料搞定,对于后处理,每个pass需要算的内容不复杂,而且总量总是rt那么大,单元够了之后再多也没用,瓶颈不在那,在带宽和延迟上。至于后处理费的时间片比例,可以参考各个好画面游戏的ppt。对于原理不理解的话可以自己测试dxsdk的例子,弄个udk或是cryengine sdk试试更明显。

TOP

引用:
原帖由 lkig 于 2014-2-19 01:47 发表

問題是現在的GPU的運用沒人會刻意去增加讀取次數~~~
減少頻繁讀存的機會才是現在GPU的發展方向
一次延遲不多,多來幾次就不行了,這是當然~~~
所以像GTX780有能力的卡都是盡量利用大量單元把資料搞定
然後利用大 ...
还有你说卡王不在乎延迟,不知道你是怎么得来这个结论的。各家都很在乎,只是做起来很贵而已,intel显卡烂,但人家有制程,又不怕卖贵,就集成个128显存,性能就刷刷的上去了。

TOP

引用:
原帖由 lkig 于 2014-2-19 02:09 发表


王卡還在意價格嗎????
GTX780怕貴所以搞了高延遲????
反而是必須把性價比弄到極致的主機不怕貴去搞低延遲~~~閣下不覺得這個說法本末倒置了????
INTEL顯卡還是一樣爛一樣被高延遲的A跟N打~~~閣下這例子似乎是反 ...
你觉得卡王芯片还有地方放缓存么?另外你觉得哪个api支持这么做?游戏机是专用的,可以专门弄个api支持,通用的pc怎么搞?intel那个集成的也只能当显存用,就这样还能提高,这还不能说明问题么?看你的说话内容,应该不是搞开发的,如果不明白我说的,该去看看图形开发的资料,不是在这里跟我争。

[ 本帖最后由 shinkamui 于 2014-2-19 02:17 编辑 ]

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-2-19 02:20 发表

这就要怪微软Windows部门自己傻逼了
DX11.2那些新特性通过feature level可以让DX11.0的卡全部支持
但DX11.2本身只对Win8开放

不知微软这群何时傻逼回头是岸,出个补丁给Win7加上,上次DX11.1就是通过补丁偷摸 ...
是的,不过加上之后写dx11默认没法开debug,还得装win8的sdk…………ms的各种傻逼真心受不了,所以ms被打脸我无比开心…………


不过别打死就成……

[ 本帖最后由 shinkamui 于 2014-2-19 02:23 编辑 ]

TOP

引用:
原帖由 lkig 于 2014-2-19 02:22 发表


從價格改換成API跟不支援了啊~~~~
沒地方放緩存????API不支持????
閣下沒見過NV有計劃在卡上插EDRAM????
INTEL那個集成效率一樣不彰啊~~~
而且那個提升是吃頻寬還是低延遲????
到底你是要說明什麼????
所以说你该去学习,不是过来抬杠,我说的东西哪怕是初级开发者也能看明白了。

不会是马来三条8吧……

TOP

引用:
原帖由 cnlipeng 于 2014-2-19 16:39 发表

http://www.giantbomb.com/forums/ ... ure-1448545/?page=1
这里面说的好像6G的贴图可以放到14M的ESRAM里,能提升很大性能。不知是不是跟你说的是同一 ...
就是dx11.2的那个。其实就是mega texture的驱动实现版。能不能提升性能要看程序怎么写

TOP

发新话题
     
官方公众号及微博