» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


 44 123
发新话题
打印

5090 32G这卡你觉得现在值多少钱?

posted by wap, platform: iPhone
引用:
原帖由 @李九十  于 2026-5-6 02:05 发表
本地大模型有什么好的推荐吗?视频方面的,现在做国产的最好的都是闭源的,抖音和快手吧?
视频就跑过一两个,还没仔细研究怎么玩,手里硬件几乎跑不动视频


TOP

引用:
原帖由 gogosky 于 2026-5-3 11:01 发表
posted by wap, platform: iPhone
高端硬件跳水太快了,普通人真的追不上,等价格稳定再说吧。
近些年顶级显卡的行情似乎并不是这样



TOP

posted by wap, platform: VIVO
本地跑大模型对大部分人来说都不是正道,智能程度差别太远,而且后面差距会越来越大。


TOP

本地跑大模型对普通人来说压根没啥意义

TOP

年前买的夜神,28000

纯打游戏

TOP

posted by wap, platform: Android
引用:
原帖由 @小坦克兵  于 2026/5/26 18:56 发表
年前买的夜神,28000

纯打游戏
价格挺美什么渠道

TOP

引用:
原帖由 SKY999 于 2026-5-26 19:14 发表
posted by wap, platform: Android
价格挺美什么渠道
线下实体店买的,这孙子从越南背回来的,咸鱼也有号,搬砖侠科技

TOP

posted by wap, platform: iPhone
Gemma4,Qwen3.5,Nemotron,这些30B左右的本地模型有一说一都干不了活,Agent就更别指望了,除非对SD和ComfyUI有需求

Mac mini+Hermes跑云端模型,或者直接跑Codex不要太香

TOP

posted by wap, platform: Chrome
我覺得qwen3.6-27b可以,當然如果不是本來就有這樣的機器,絕對直接買api划算。

TOP

引用:
原帖由 小坦克兵 于 2026-5-26 18:56 发表
年前买的夜神,28000

纯打游戏
朋友多大岁数了?能买5090的除非家里有矿,一般也都是有点年龄了伴随着收入大幅增长。
另外玩什么游戏?

TOP

posted by wap, platform: iPhone
写代码只能用sonet4.6以上的模型。。国产大模型,gemini跑分好看实际上还是不太行。

TOP

posted by wap, platform: iPhone
想玩本地模型,瞄准Qwen3.6 27B FP8能跑256K就行了,花不了几个钱,不用盯着5090或者pro 6000。

4卡V100 16G就能入门,短上下文prefill 2000输出50 t/s,满上下文prefill 700输出20
4卡 2080ti魔改版,输出比V100快点,prefill不如v100。
有更高显存需求就上V100 32G,并发数能开多点

如果只是单并发 v100 16G就够了最便宜,想显存宽裕点就2080ti,处理不能上云的本地知识库够够的,生图生视频也能满足。并且V100已经有民间FA2,vllm,comfyui都可以适用,Z-image,WAN2.2也能并行生图,生视频。除了功耗高,略折腾外其他没毛病

以上方案PLX扩展卡是刚需,卡间必须要p2p连接不能过CPU,不然慢得你怀疑人生。2080ti需要折腾驱动,打个补丁。v100可选NVLINK,短上下文prefill能涨个几百,但不是刚需,满上下文区别不大

搞本地知识库用pi agent,上下文200K左右开压缩,但是要保留最后的20%上下文不压缩,效果一流。
编程可用claude code或自己高度定制的pi agent。
以上均为实际使用感受,最后我留了4卡V100 16G+NVLINK,日常高强度使用27B FP8来写文和做PPT

补一句,AI不是许愿机,本地模型也不差,但你要会用,丢一句“我要XXXX”就算Opus 或GPT也不会一轮回答就给你能用的产出

本帖最后由 xif7456 于 2026-6-3 23:45 通过手机版编辑
本帖最近评分记录
  • urtoys 激骚 +2 感谢分享 2026-6-4 09:49

TOP

posted by wap, platform: iPhone
再补一条,最近火热的MTP和KV量化会降智和降prefill速度,如果你是办公写文,做ppt,编程用不要开。
日常对话搜索可以开,用llama.cpp的话k可以开量化,v不要开,这样精度损失最小

TOP

posted by wap, platform: Android
引用:
原帖由 @duryu  于 2026-5-5 11:41 发表
这个是真香,4万块不到就能组成128G的大力神合体,吊打48G的N卡
你说的还是跑ai吧?对游戏来说,还是n卡更实用?

TOP

 44 123
发新话题