» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM:性能提升明显 价格稍贵

引用:
原帖由 boboqpai 于 2013-4-29 13:38 发表
首先GPU这种数学浮点计算器对大缓存不敏感,但对内存带宽的提升却是立竿见影的。

其次很明显720的ESRAM更多的是照顾GPU,因为它对于CPU/GPU并不是对称的,CPU还需要通过北桥才能访问到ESRAM,能否进行统一编址还是 ...
通用计算极端需要大缓存


TOP

引用:
原帖由 boboqpai 于 2013-4-29 14:04 发表


巨硬之所以这样设计ESRAM就证明其考虑初衷并不是异构计算,就算是DirectCompute,GPU执行的部分也是以数学形式进行,对大缓存不敏感。
你一定没写过gpgpu程序,写过的就知道大缓存多重要。否则pixel shader就能做大部分事情了干嘛要出个compute shader



TOP

引用:
原帖由 boboqpai 于 2013-4-29 14:21 发表



Compute Shader前半部缓存在CPU里
真心不知道你在说什么。没写过的话,至少去看看例子。最简单的比如nbody,blur之类,看看性能是怎么提升的。


TOP

引用:
原帖由 boboqpai 于 2013-4-29 14:39 发表


直接说关键了,读写缓存方面的开销,Cerny提到了这个。
说了半天你还是没搞过,shader根本不存在什么前端后端的。看看书明白了再出来说话会死么?非要不懂装懂。

cerny的读写缓存开销分两点,一个是set device资源,一个是device计算时读写资源,就是更加说明了大缓存的重要性。

TOP

引用:
原帖由 boboqpai 于 2013-4-29 14:51 发表


Cerny的意思不是直接在内存set device?绕过缓存。
没法跟你说了,先去看dxsdk弄明白管线流程再说吧

TOP

引用:
原帖由 boboqpai 于 2013-4-29 15:30 发表
还是看实际效果吧,720的esram并不是本地缓存,ps4的做法也是第一次,都不知道效果怎样。
这个倒是说的没错。我也只是说大缓存非常有用,不过720的esram到底咋样,反正我是不知道……

TOP

引用:
原帖由 FXCarl 于 2013-4-30 13:07 发表


…… 总觉得异构计算的需求属于很微妙的领域。目前绝大多数抱怨速度不够快的应用场合对速度的容忍都很宽裕。譬如 Final Cut Pro 这种东西,出个片子总归几个小时,能提升数倍显然不错,但是此时又对数据拷贝多消 ...
物理计算用gpu的主要提升部分来自于碰撞检测,这个可以高度并行,而且有大量数据可以线程间共享,因此非常适合gpgpu。目前的瓶颈仍然是io。存储的数据结构是主要优化方向之一,包括在全局显存和共享缓存。另外就是建立良好的领域搜索结构,让访问不要那么随机。无论大量刚体还是流体,柔体,都是一样。

TOP

引用:
原帖由 boboqpai 于 2013-4-30 21:26 发表


这也矛盾,edram只会用在笔记本,而且只有搭载intel最强核显的cpu才会有edram,其他的没有。
台机人家都用独立卡去了,谁用intel核显啊。只有本子只用核显的没办法了只好增强一点。另外不排除intel做实验,反正买最高配核显的通常是不差钱的主。

TOP

发新话题
     
官方公众号及微博