小黑屋
原帖由 shinkamui 于 2013-4-29 14:26 发表 真心不知道你在说什么。没写过的话,至少去看看例子。最简单的比如nbody,blur之类,看看性能是怎么提升的。
查看详细资料
TOP
混世魔头
原帖由 boboqpai 于 2013-4-29 14:39 发表 直接说关键了,读写缓存方面的开销,Cerny提到了这个。
查看个人网站
原帖由 shinkamui 于 2013-4-29 14:45 发表 说了半天你还是没搞过,shader根本不存在什么前端后端的。看看书明白了再出来说话会死么?非要不懂装懂。 cerny的读写缓存开销分两点,一个是set device资源,一个是device计算时读写资源,就是更加说明了大缓存 ...
原帖由 boboqpai 于 2013-4-29 14:51 发表 Cerny的意思不是直接在内存set device?绕过缓存。
原帖由 boboqpai 于 2013-4-29 15:30 发表 还是看实际效果吧,720的esram并不是本地缓存,ps4的做法也是第一次,都不知道效果怎样。
魔王撒旦
魔头
魔神至尊
享受工作,享受生活。
银河飞将
“”公平与正义“”
原帖由 FXCarl 于 2013-4-29 21:33 发表 我是不觉得内存泄漏和统一架构有什么关系,顺带我也并不认为大多数的程序员需要关心这个方面 …… 老老实实的申请空间销毁对象,泄漏个毛线啊。我倒认为内存越多越毛病,数据挪来挪去的。 编程复杂度的问题更像是 ...
原帖由 boboqpai 于 2013-4-30 08:34 发表 来分析下,如果这颗edram对异构计算作用这么大,为什么intel不把它用在桌面?intel也只提到gpu性能。 前面说的720那颗esram不再同一总线同一控制器下,如果不能统一编址(共享数据),那意味着数据需复制到内存才能 ...
原帖由 FXCarl 于 2013-4-30 13:07 发表 …… 总觉得异构计算的需求属于很微妙的领域。目前绝大多数抱怨速度不够快的应用场合对速度的容忍都很宽裕。譬如 Final Cut Pro 这种东西,出个片子总归几个小时,能提升数倍显然不错,但是此时又对数据拷贝多消 ...