Board logo

标题: 洋AI真是把国产货按在地上锤啊 [打印本页]

作者: 任天狗    时间: 2026-5-10 03:03     标题: 洋AI真是把国产货按在地上锤啊

posted by wap, platform: Android
在comfyui里测试采样器跟调度器的组合效果,生成了几百张图片,要做个网页实现xy矩阵图,能点击放大、手动评级、评级过滤这些功能。
从来不会编程不会写网页,最开始是交给openclaw跟hermes,虽然都能完成任务,但是一些小细节的修改用自然语言描述老费劲了,于是尝试了一下氛围编程。
刚开始用的trae配minimax,那体验让人崩溃,不知道是不是因为工具跟模型适配不好,总之是又慢效果又差,也有可能是我不会编程,给的提示词不好,总之是折磨。
刚才无聊在mac上装了个codex,让它干同样的事,两三个来回就把任务完美完成,期间看到它控制鼠标在浏览器里测试各项功能是否正常,写出来的网页也漂亮得很。
最令我吃惊的是它直接在网页里设计了个选择图片文件夹的功能,我就从来没想到把这个网页用到其他的文件夹,屌炸天了。
洋AI的体验是真的吊啊。
作者: pocketmom    时间: 2026-5-10 05:53

posted by wap, platform: Android
偏偏选了个最菜的
作者: 今夜打老虎    时间: 2026-5-10 07:21

posted by wap, platform: Android
trae是最烂的 minimax也是最烂的。。。。

正确姿势是ds加cc客户端
作者: yaoyuef    时间: 2026-5-10 09:33

posted by wap, platform: MAC OS X
模型大概是 opus4.7 > gpt5.5 > glm5.1 >= ds4pro max> qwen3.6plus >> minimax2.7
作者: LTFYH    时间: 2026-5-10 09:35

posted by wap, platform: VIVO
本身就是差距很大,目前codex是综合体验最好的,价格合适token量足智能程度也是最强那档
作者: 任天狗    时间: 2026-5-10 10:46

posted by wap, platform: iPhone
为了玩openclaw买的minimax,考虑的是包月量大管饱,
主要是看不懂那种按token计费的方式到底是怎么算的,怕一下子账单失控了。
minimax真的是体验不行
作者: tobewind    时间: 2026-5-10 10:54

posted by wap, platform: Android
Mini max 我是用来做兜底模型用的,最好的应该是GPT5.5
作者: 打击者    时间: 2026-5-10 11:53

比较方便实惠的选择是opencode +ds4flash
作者: qazqaz    时间: 2026-5-10 14:09

posted by wap, platform: Firefox
Kimi k2.6如何?
作者: dhd    时间: 2026-5-10 16:19

posted by wap, platform: iPhone
老黄之前说过这个问题
很多人以为中国AI的问题是算力、是芯片,其实不是。真正的短板,是内容。
在全球前100万个网页中,中文内容占比仅 1.3%,而英文高达 59.3%。
这意味着:再聪明的中文AI,也只能读到全球1.3%的信息世界。Al的智商靠算力堆出来,但它的见识,是喂出来的。
美国的AI模型从全球语料中学习,能理解文化、逻辑、幽默、哲学。而中国的AI,只能在“内容孤岛”里打转。

本帖最后由 dhd 于 2026-5-10 16:21 通过手机版编辑
作者: yaoyuef    时间: 2026-5-10 16:37

posted by wap, platform: MAC OS X
kimi 2.6 和qwen差不多,也不错的,一般用用够用

话说是什么样的错觉会觉得国模不喂英文……国模api推理过程也几乎全英文啊,甚至回答有时候都会不小心给你忘记翻译成中文。
就算你全用国模,第一个键也是不能抠掉的。
作者: yaoyuef    时间: 2026-5-10 16:38

posted by wap, platform: iPhone
图怎么没发上来
作者: dhd    时间: 2026-5-10 18:16

posted by wap, platform: iPhone
举个简单的例子吧,姥姥,大爷诸如此类的俚语,不同场合下有多重含义的词语,英文环体系不太可能完全理解的。通俗地讲就是没有中国味
作者: folkfox    时间: 2026-5-10 19:26

posted by wap, platform: Android
codex确实把MiniMax按地上摩擦,没毛病。
作者: 0瞎子0    时间: 2026-5-10 22:10

posted by wap, platform: Android
codex现在是我的第一生产力,手下20人用着而只需要花4万块,便宜到家,带来的是几百万的生产力

国产的人工智障没有任何希望
作者: arex    时间: 2026-5-11 00:05

codex现在反超claude code了?

反正用下来,这俩感觉都很强,Gemini写代码感觉不稳定,有时候能接近这俩,有时候发挥还不如国产...
作者: 任天狗    时间: 2026-5-11 15:52

posted by wap, platform: iPhone
为了玩openclaw买的minimax,考虑的是包月量大管饱,
主要是看不懂那种按token计费的方式到底是怎么算的,怕一下子账单失控了。
minimax真的是体验不行
作者: yufe    时间: 2026-5-11 17:12

posted by wap, platform: Chrome
minimax就是给小龙虾玩玩的,29的code plane,随便玩玩。
作者: yaoyuef    时间: 2026-5-11 20:13

posted by wap, platform: MAC OS X
引用:
原帖由 @arex  于 2026-5-11 00:05 发表
codex现在反超claude code了?

反正用下来,这俩感觉都很强,Gemini写代码感觉不稳定,有时候能接近这俩,有时候发挥还不如国产...
并没有超过cc……而且算比较不好用那种,单纯codex甚至不如opencode。就是codex订阅价格比A/便宜,而且不瞎几把封号,主打一个性价比。

一般都订阅了也是给cc/opencode用。
作者: LTFYH    时间: 2026-5-11 20:18

posted by wap, platform: VIVO
codex现在客户端能力很强,基本不需要切到cc了。
作者: yaoyuef    时间: 2026-5-11 20:27

posted by wap, platform: MAC OS X
我是觉得codex的编排一股呆味
作者: maybach    时间: 2026-5-11 21:37

posted by wap, platform: Android
claude偏架构和思维,需要用大上文去处理复杂任务,token贵,gpt偏局部实现,把实现步骤拆解出来基本就是yes工程师了,综合性价比高
作者: 任天狗    时间: 2026-5-11 22:56

posted by wap, platform: iPhone
今天又试了试deepseek,吊打minimax。
首先是没那么多过滤,提示词可以写爽了。
其次是解决问题的能力够强,一些推送方面的小毛病minimax都不知道发生了啥,怎么都修不好。deepseek发现问题直接帮你写清楚原因帮你修好,有水平啊。
突然对国产模型有信心了。
早上起来发现deepseek的消费金额比我晚上睡觉之前看的金额涨了几块钱,这些agent挂机还要消费token的啊,按流量计费真是不省心

本帖最后由 任天狗 于 2026-5-11 23:28 通过手机版编辑
作者: jelly003    时间: 2026-5-12 08:29

CloudCode > Codex 这是我个人体验 网页端程序
作者: never2002    时间: 2026-5-12 11:36

中文文字处理用啥国产AI比较合适?
作者: pocketmom    时间: 2026-5-12 12:07

posted by wap, platform: Android
minimax甚至还不如我本地部署的qwen3.6 27b
作者: burnfox    时间: 2026-5-12 17:38

posted by wap, platform: Chrome
trae国内直接用+免费,没什么可抱怨的。

也不输Android Studio内置Gemini,当然还是互相补充。

本帖最后由 burnfox 于 2026-5-12 17:39 通过手机版编辑
作者: 今夜打老虎    时间: 2026-5-13 00:27

posted by wap, platform: Android
引用:
原帖由 @任天狗  于 2026-5-11 22:56 发表
今天又试了试deepseek,吊打minimax。
首先是没那么多过滤,提示词可以写爽了。
其次是解决问题的能力够强,一些推送方面的小毛病minimax都不知道发生了啥,怎么都修不好。deepseek发现问题直接帮你写清楚原因帮你修好,有水平啊。
突然对国产模型有信心了。
早上起来发现deepseek的消费金额比我晚上睡觉之前看的金额涨了几块钱,这些agent挂机还要消费token的啊,按流量计费真是不省心

本帖最后由 任天狗 于 2026511 23:28 通过手机版编辑
可以用cc switch代理把ds转发到claude code上用,工程拆解能力更进一步,如果不是coding任务的话,我感觉不出来和codex的区别,甚至有时候更强




欢迎光临 TGFC Lifestyle (http://tgfcer.com/) Powered by Discuz! 6.0.0