» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[业评] eSRAM和CELL哪个更难开发?

引用:
原帖由 lkig 于 2014-2-19 01:47 发表

問題是現在的GPU的運用沒人會刻意去增加讀取次數~~~
減少頻繁讀存的機會才是現在GPU的發展方向
一次延遲不多,多來幾次就不行了,這是當然~~~
所以像GTX780有能力的卡都是盡量利用大量單元把資料搞定
然後利用大 ...
确实没有人刻意增加读取次数,可是后处理必须多个pass,因为每个pass的输入是前一个pass的输出。那么问题就很明显了,这块数据不大不小,通常一个rt大小,放显存,那么带宽和延迟都是问题,现在有通用计算,可是组内共享缓存不够大,dx11只能32k,cuda也就大一点点,明显放不下,这时候esram就刚好了。我之前就说过,这个esram最好的用法就是拿来做超大的group shared memory。至于像GTX780有能力的卡都是盡量利用大量單元把資料搞定,对于后处理,每个pass需要算的内容不复杂,而且总量总是rt那么大,单元够了之后再多也没用,瓶颈不在那,在带宽和延迟上。至于后处理费的时间片比例,可以参考各个好画面游戏的ppt。对于原理不理解的话可以自己测试dxsdk的例子,弄个udk或是cryengine sdk试试更明显。


TOP

引用:
原帖由 lkig 于 2014-2-19 01:47 发表

問題是現在的GPU的運用沒人會刻意去增加讀取次數~~~
減少頻繁讀存的機會才是現在GPU的發展方向
一次延遲不多,多來幾次就不行了,這是當然~~~
所以像GTX780有能力的卡都是盡量利用大量單元把資料搞定
然後利用大 ...
还有你说卡王不在乎延迟,不知道你是怎么得来这个结论的。各家都很在乎,只是做起来很贵而已,intel显卡烂,但人家有制程,又不怕卖贵,就集成个128显存,性能就刷刷的上去了。



TOP

引用:
原帖由 shinkamui 于 2014-2-19 02:04 发表

还有你说卡王不在乎延迟,不知道你是怎么得来这个结论的。各家都很在乎,只是做起来很贵而已,intel显卡烂,但人家有制程,又不怕卖贵,就集成个128显存,性能就刷刷的上去了。
王卡還在意價格嗎????
GTX780怕貴所以搞了高延遲????
反而是必須把性價比弄到極致的主機不怕貴去搞低延遲~~~閣下不覺得這個說法本末倒置了????
INTEL顯卡還是一樣爛一樣被高延遲的A跟N打~~~閣下這例子似乎是反例

我還是那句老話~~~
閣下何不想想如果減少延遲真的對現在GPU的性能有顯著提升
為什麼一堆王卡還不在乎的把延遲增加????
甚至現在PC顯卡要解決延遲問題也不是沒辦法
為什麼N跟A都不往這個方向發展????
我相信閣下也應該同意至少跟X1 PS4的架構相同的情形下
將來PC的發展只會延遲越來越高頻寬越來越大吧~~~~

當然閣下要認為卡王會怕貴主機不怕貴的話我也沒什麼好說的了

[ 本帖最后由 lkig 于 2014-2-19 02:15 编辑 ]


TOP

引用:
原帖由 lkig 于 2014-2-19 02:09 发表


王卡還在意價格嗎????
GTX780怕貴所以搞了高延遲????
反而是必須把性價比弄到極致的主機不怕貴去搞低延遲~~~閣下不覺得這個說法本末倒置了????
INTEL顯卡還是一樣爛一樣被高延遲的A跟N打~~~閣下這例子似乎是反 ...
你觉得卡王芯片还有地方放缓存么?另外你觉得哪个api支持这么做?游戏机是专用的,可以专门弄个api支持,通用的pc怎么搞?intel那个集成的也只能当显存用,就这样还能提高,这还不能说明问题么?看你的说话内容,应该不是搞开发的,如果不明白我说的,该去看看图形开发的资料,不是在这里跟我争。

[ 本帖最后由 shinkamui 于 2014-2-19 02:17 编辑 ]

TOP

引用:
原帖由 shinkamui 于 2014-2-19 02:16 发表

你觉得卡王芯片还有地方放缓存么?另外你觉得哪个api支持这么做?游戏机是专用的,可以专门弄个api支持,通用的pc怎么搞?intel那个集成的也只能当显存用,就这样还能提高,这还不能说明问题么?看你的说话内容,应 ...
这就要怪微软Windows部门自己傻逼了
DX11.2那些新特性通过feature level可以让DX11.0的卡全部支持
但DX11.2本身只对Win8开放

不知微软这群何时傻逼回头是岸,出个补丁给Win7加上,上次DX11.1就是通过补丁偷摸给Win7加上的

TOP

引用:
原帖由 Nemo_theCaptain 于 2014-2-19 02:20 发表

这就要怪微软Windows部门自己傻逼了
DX11.2那些新特性通过feature level可以让DX11.0的卡全部支持
但DX11.2本身只对Win8开放

不知微软这群何时傻逼回头是岸,出个补丁给Win7加上,上次DX11.1就是通过补丁偷摸 ...
是的,不过加上之后写dx11默认没法开debug,还得装win8的sdk…………ms的各种傻逼真心受不了,所以ms被打脸我无比开心…………


不过别打死就成……

[ 本帖最后由 shinkamui 于 2014-2-19 02:23 编辑 ]

TOP

引用:
原帖由 shinkamui 于 2014-2-19 02:16 发表

你觉得卡王芯片还有地方放缓存么?另外你觉得哪个api支持这么做?游戏机是专用的,可以专门弄个api支持,通用的pc怎么搞?intel那个集成的也只能当显存用,就这样还能提高,这还不能说明问题么?看你的说话内容,应 ...
從價格改換成API跟不支援了啊~~~~
沒地方放緩存????API不支持????
閣下沒見過NV有計劃在卡上插EDRAM????
INTEL那個集成效率一樣不彰啊~~~
而且那個提升是吃頻寬還是低延遲????
到底你是要說明什麼????

TOP

引用:
原帖由 lkig 于 2014-2-19 02:22 发表


從價格改換成API跟不支援了啊~~~~
沒地方放緩存????API不支持????
閣下沒見過NV有計劃在卡上插EDRAM????
INTEL那個集成效率一樣不彰啊~~~
而且那個提升是吃頻寬還是低延遲????
到底你是要說明什麼????
所以说你该去学习,不是过来抬杠,我说的东西哪怕是初级开发者也能看明白了。

不会是马来三条8吧……

TOP

引用:
原帖由 shinkamui 于 2014-2-19 02:25 发表

所以说你该去学习,不是过来抬杠,我说的东西哪怕是初级开发者也能看明白了。

不会是马来三条8吧……
是嗎????
學習了以後就能顛覆現在主流GPU的發展了啊~~~~
那閣下是不是準備去微軟應徵敎敎他們怎麼用ESRAM來打垮現在的N跟A了????
連INTEL那個蕊片都說不出個所以然~~~還能歸功給低延遲提升~~~~我也懶的跟閣下抬槓了
那就等著看看ESRAM怎麼發揮吧
還有如果微軟有下一代看他們還敢不敢佣低延遲這種好東西

TOP

引用:
原帖由 shinkamui 于 2014-2-19 02:16 发表

你觉得卡王芯片还有地方放缓存么?另外你觉得哪个api支持这么做?游戏机是专用的,可以专门弄个api支持,通用的pc怎么搞?intel那个集成的也只能当显存用,就这样还能提高,这还不能说明问题么?看你的说话内容,应 ...
顶一下。但是我深深的觉得 32esram 想要用好,渲染管线得用 Forward Based …… 1080p 对于 one 来说似乎只有一条路可走

比较漂亮的解决方式私以为是以 Remember me 的渲染思路为引导,“静态”化光照,将光照的负载延迟化 —— 异步环境图的刷新,异步SHProb更新,使用 Forward 管线 ubershader 一次成型(其实有一个好的 BRDF 就不错了,譬如最近流行的 Lambert + Blinn microfacet) …… HDR 缓冲勉强用 int10 来对应,再保留一个全尺寸 z 方便做一些后处理 …… 1080 正好刮干净

24H 连续变化什么的想想就算了吧。美术辛苦点相信效果还是会很不错的 ~

[ 本帖最后由 FXCarl 于 2014-2-19 03:15 编辑 ]

TOP

posted by wap, platform: SONY (Z1)
引用:
原帖由 @Nemo_theCaptain  于 2014-2-18 22:05 发表
Cell的难点是线程分配层面,eSRAM的难点是材质梳理和缓冲层面

就是一群专门给Cell写SDK的人,一个公司专门写底层程序这么多年还弄不出点名堂来才是该切腹自杀的存在(对,我说的就是AMD的傻逼驱动部门)
PS4的软硬件架构就是这群人负责的,SCEJ已经名存实亡
日本人自己弄工具和底层就PS

PS2、PS3和PSP的工具和底层都是SN System那群英国人弄的

PS4的硬件配置是美国人定的,设计还是日本人弄的

TOP

引用:
原帖由 天下围攻 于 2014-2-18 22:40 发表
619894
这张图好形象,一目了然~~~~~~

TOP

引用:
原帖由 KoeiSangokushi 于 2014-2-19 00:13 发表
posted by wap, platform: 小米 (MI 1S)

这代家用机寿命估计会非常长,从长远来看,单芯片方案肯定更有成本优势
单从芯片制造成本上看,单芯片有长期优势。

但是从产品整体营销来看,如果因为初期定价过高造成出货不利,以至于在前期和中期无法占据充足的市场份额,导致成本无法有效回收乃至整体销售乏力,那么从产品整体成本和财务角度而言,不见得会比多芯片有明显优势。

长期优势是不错,但一定要熬得到,熬得起咯

TOP

当然是CELL,ESRAM基本上世代的开发商都可以摸透。

TOP

引用:
原帖由 Mobilegate 于 2014-2-19 10:06 发表


单从芯片制造成本上看,单芯片有长期优势。

但是从产品整体营销来看,如果因为初期定价过高造成出货不利,以至于在前期和中期无法占据充足的市场份额,导致成本无法有效回收乃至整体销售乏力,那么从产品整体 ...
马后炮一下,其实这点优势真的太细微了,因为x1完全可以像360这样,前期cpu  gpu edram分开,后期集成在一块芯片上,比现在这样灵活太多,而且成本上也相差无几
现在直接输了,这个成本才是最高的

另外从升级换到角度说,直接用gddr5也是最好的,x1要向下兼容还不得不搞类似架构,本来以为x1这么干考虑兼容360,结果也没有,实在是微软选择了所有方案中最差的一种

[ 本帖最后由 yfl2 于 2014-2-19 10:17 编辑 ]
本帖最近评分记录
  • Mobilegate 激骚 +1 我很赞同 2014-2-19 10:24

TOP

发新话题
     
官方公众号及微博