» 您尚未登录:请登录 | 注册 | 标签 | 帮助 | 小黑屋 |

TGFC Lifestyle » 游戏业界综合讨论区 » 【英特尔版四两拨千斤】Haswell中的eDRAM：性能提升明显价格稍贵

打印

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM：性能提升明显价格稍贵

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

1^# 大中小发表于 2013-4-29 13:59 显示全部帖子

引用:

原帖由 boboqpai 于 2013-4-29 13:38 发表
首先GPU这种数学浮点计算器对大缓存不敏感，但对内存带宽的提升却是立竿见影的。

其次很明显720的ESRAM更多的是照顾GPU，因为它对于CPU/GPU并不是对称的，CPU还需要通过北桥才能访问到ESRAM，能否进行统一编址还是 ...

通用计算极端需要大缓存

TOP

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

2^# 大中小发表于 2013-4-29 14:15 显示全部帖子

引用:

原帖由 boboqpai 于 2013-4-29 14:04 发表

巨硬之所以这样设计ESRAM就证明其考虑初衷并不是异构计算，就算是DirectCompute，GPU执行的部分也是以数学形式进行，对大缓存不敏感。

你一定没写过gpgpu程序，写过的就知道大缓存多重要。否则pixel shader就能做大部分事情了干嘛要出个compute shader

TOP

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

3^# 大中小发表于 2013-4-29 14:26 显示全部帖子

引用:

原帖由 boboqpai 于 2013-4-29 14:21 发表

Compute Shader前半部缓存在CPU里

真心不知道你在说什么。没写过的话，至少去看看例子。最简单的比如nbody，blur之类，看看性能是怎么提升的。

TOP

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

4^# 大中小发表于 2013-4-29 14:45 显示全部帖子

引用:

原帖由 boboqpai 于 2013-4-29 14:39 发表

直接说关键了，读写缓存方面的开销，Cerny提到了这个。

说了半天你还是没搞过，shader根本不存在什么前端后端的。看看书明白了再出来说话会死么？非要不懂装懂。

cerny的读写缓存开销分两点，一个是set device资源，一个是device计算时读写资源，就是更加说明了大缓存的重要性。

TOP

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

5^# 大中小发表于 2013-4-29 15:09 显示全部帖子

引用:

原帖由 boboqpai 于 2013-4-29 14:51 发表

Cerny的意思不是直接在内存set device？绕过缓存。

没法跟你说了，先去看dxsdk弄明白管线流程再说吧

TOP

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

6^# 大中小发表于 2013-4-29 15:33 显示全部帖子

引用:

原帖由 boboqpai 于 2013-4-29 15:30 发表
还是看实际效果吧，720的esram并不是本地缓存，ps4的做法也是第一次，都不知道效果怎样。

这个倒是说的没错。我也只是说大缓存非常有用，不过720的esram到底咋样，反正我是不知道……

TOP

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

7^# 大中小发表于 2013-4-30 14:49 显示全部帖子

引用:

原帖由 FXCarl 于 2013-4-30 13:07 发表

…… 总觉得异构计算的需求属于很微妙的领域。目前绝大多数抱怨速度不够快的应用场合对速度的容忍都很宽裕。譬如 Final Cut Pro 这种东西，出个片子总归几个小时，能提升数倍显然不错，但是此时又对数据拷贝多消 ...

物理计算用gpu的主要提升部分来自于碰撞检测，这个可以高度并行，而且有大量数据可以线程间共享，因此非常适合gpgpu。目前的瓶颈仍然是io。存储的数据结构是主要优化方向之一，包括在全局显存和共享缓存。另外就是建立良好的领域搜索结构，让访问不要那么随机。无论大量刚体还是流体，柔体，都是一样。

TOP

shinkamui

混世魔头

帖子: 2497
精华: 0
积分: 15356
激骚: 141 度
爱车
主机
相机
手机
注册时间: 2006-2-2

发短消息
加为好友
当前离线

8^# 大中小发表于 2013-4-30 21:33 显示全部帖子

引用:

原帖由 boboqpai 于 2013-4-30 21:26 发表

这也矛盾，edram只会用在笔记本，而且只有搭载intel最强核显的cpu才会有edram，其他的没有。

台机人家都用独立卡去了，谁用intel核显啊。只有本子只用核显的没办法了只好增强一点。另外不排除intel做实验，反正买最高配核显的通常是不差钱的主。

TOP

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM：性能提升明显 价格稍贵

引用:

引用:

引用:

引用:

引用:

引用:

引用:

引用:

[新闻] 【英特尔版四两拨千斤】Haswell中的eDRAM：性能提升明显价格稍贵