» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

deepseek新版是被国产芯片耽误了

看那堆论文就知道,DS的开发工具是极其特化的,甚至可以说是H800专用的。


TOP

引用:
原帖由 今夜打老虎 于 2025-8-17 14:03 发表
posted by wap, platform: Android
....几把鬼扯ds就是用n卡训练的,最多用昇腾跑推理。网上传了几天的屎泥潭今天才捡起来
8路H800支持训练的模型就那么大。
不换新平台,上限就锁死了。
N卡的新平台又买不到。



TOP

v3.1是典型的屎上雕花,模型还是那个大小,核心性能也止步不前,只是在Agent功能上强了些,但本来V3/R1这一块就是大短板提升了也不领先。
deepseek学习用设备的内存无法增长的困境暴露无遗。


TOP

引用:
原帖由 landmine 于 2025-8-26 08:43 发表
posted by wap, platform: Android
简中这么多屏蔽词,哪个ai都没法训练好,毕竟ai也要讲党性嘛
简中语料差的问题其实不重要了,Deepseek R1-Zero这种思考模型都已经开始不用人话思考,我觉得最终AI会自己掌握一套语言系统用于思考,输出只是翻译而已。

TOP

引用:
原帖由 stsun7 于 2025-8-27 09:15 发表
墙才是汉语文化圈最大的障碍吧
墙外汉语质量更差

我前面说了,对于单次推理的模型来说,语料的质量很重要。
但是对于推理模型来说,任何人类语言都不够格。
也就是,过了那个阶段了。

TOP

发新话题
     
官方公众号及微博