TGFC Lifestyle - Powered by Discuz! Board

标题: 洋AI真是把国产货按在地上锤啊 [打印本页]

作者: 任天狗 时间: 2026-5-10 03:03 标题: 洋AI真是把国产货按在地上锤啊

posted by wap, platform: Android
在comfyui里测试采样器跟调度器的组合效果，生成了几百张图片，要做个网页实现xy矩阵图，能点击放大、手动评级、评级过滤这些功能。
从来不会编程不会写网页，最开始是交给openclaw跟hermes，虽然都能完成任务，但是一些小细节的修改用自然语言描述老费劲了，于是尝试了一下氛围编程。
刚开始用的trae配minimax，那体验让人崩溃，不知道是不是因为工具跟模型适配不好，总之是又慢效果又差，也有可能是我不会编程，给的提示词不好，总之是折磨。
刚才无聊在mac上装了个codex，让它干同样的事，两三个来回就把任务完美完成，期间看到它控制鼠标在浏览器里测试各项功能是否正常，写出来的网页也漂亮得很。
最令我吃惊的是它直接在网页里设计了个选择图片文件夹的功能，我就从来没想到把这个网页用到其他的文件夹，屌炸天了。
洋AI的体验是真的吊啊。

作者: pocketmom 时间: 2026-5-10 05:53

posted by wap, platform: Android
偏偏选了个最菜的

作者: 今夜打老虎 时间: 2026-5-10 07:21

posted by wap, platform: Android
trae是最烂的 minimax也是最烂的。。。。

正确姿势是ds加cc客户端

作者: yaoyuef 时间: 2026-5-10 09:33

posted by wap, platform: MAC OS X
模型大概是 opus4.7 > gpt5.5 > glm5.1 >= ds4pro max> qwen3.6plus >> minimax2.7

作者: LTFYH 时间: 2026-5-10 09:35

posted by wap, platform: VIVO
本身就是差距很大，目前codex是综合体验最好的，价格合适token量足智能程度也是最强那档

作者: 任天狗 时间: 2026-5-10 10:46

posted by wap, platform: iPhone
为了玩openclaw买的minimax，考虑的是包月量大管饱，
主要是看不懂那种按token计费的方式到底是怎么算的，怕一下子账单失控了。
minimax真的是体验不行

作者: tobewind 时间: 2026-5-10 10:54

posted by wap, platform: Android
Mini max 我是用来做兜底模型用的，最好的应该是GPT5.5

作者: 打击者 时间: 2026-5-10 11:53

比较方便实惠的选择是opencode +ds4flash

作者: qazqaz 时间: 2026-5-10 14:09

posted by wap, platform: Firefox
Kimi k2.6如何？

作者: dhd 时间: 2026-5-10 16:19

posted by wap, platform: iPhone
老黄之前说过这个问题
很多人以为中国AI的问题是算力、是芯片，其实不是。真正的短板，是内容。
在全球前100万个网页中，中文内容占比仅 1.3%，而英文高达 59.3%。
这意味着：再聪明的中文AI，也只能读到全球1.3%的信息世界。Al的智商靠算力堆出来，但它的见识，是喂出来的。
美国的AI模型从全球语料中学习，能理解文化、逻辑、幽默、哲学。而中国的AI，只能在“内容孤岛”里打转。

本帖最后由 dhd 于 2026-5-10 16:21 通过手机版编辑

作者: yaoyuef 时间: 2026-5-10 16:37

posted by wap, platform: MAC OS X
kimi 2.6 和qwen差不多，也不错的，一般用用够用

话说是什么样的错觉会觉得国模不喂英文……国模api推理过程也几乎全英文啊，甚至回答有时候都会不小心给你忘记翻译成中文。
就算你全用国模，第一个键也是不能抠掉的。

作者: yaoyuef 时间: 2026-5-10 16:38

posted by wap, platform: iPhone
图怎么没发上来

作者: dhd 时间: 2026-5-10 18:16

posted by wap, platform: iPhone
举个简单的例子吧，姥姥，大爷诸如此类的俚语，不同场合下有多重含义的词语，英文环体系不太可能完全理解的。通俗地讲就是没有中国味

作者: folkfox 时间: 2026-5-10 19:26

posted by wap, platform: Android
codex确实把MiniMax按地上摩擦，没毛病。

作者: 0瞎子0 时间: 2026-5-10 22:10

posted by wap, platform: Android
codex现在是我的第一生产力，手下20人用着而只需要花4万块，便宜到家，带来的是几百万的生产力

国产的人工智障没有任何希望

作者: arex 时间: 2026-5-11 00:05

codex现在反超claude code了？

反正用下来，这俩感觉都很强，Gemini写代码感觉不稳定，有时候能接近这俩，有时候发挥还不如国产...

作者: 任天狗 时间: 2026-5-11 15:52

posted by wap, platform: iPhone
为了玩openclaw买的minimax，考虑的是包月量大管饱，
主要是看不懂那种按token计费的方式到底是怎么算的，怕一下子账单失控了。
minimax真的是体验不行

作者: yufe 时间: 2026-5-11 17:12

posted by wap, platform: Chrome
minimax就是给小龙虾玩玩的，29的code plane，随便玩玩。

作者: yaoyuef 时间: 2026-5-11 20:13

posted by wap, platform: MAC OS X

引用:

原帖由 @arex 于 2026-5-11 00:05 发表
codex现在反超claude code了？

反正用下来，这俩感觉都很强，Gemini写代码感觉不稳定，有时候能接近这俩，有时候发挥还不如国产...

并没有超过cc……而且算比较不好用那种，单纯codex甚至不如opencode。就是codex订阅价格比A/便宜，而且不瞎几把封号，主打一个性价比。

一般都订阅了也是给cc/opencode用。

作者: LTFYH 时间: 2026-5-11 20:18

posted by wap, platform: VIVO
codex现在客户端能力很强，基本不需要切到cc了。

作者: yaoyuef 时间: 2026-5-11 20:27

posted by wap, platform: MAC OS X
我是觉得codex的编排一股呆味

作者: maybach 时间: 2026-5-11 21:37

posted by wap, platform: Android
claude偏架构和思维，需要用大上文去处理复杂任务，token贵，gpt偏局部实现，把实现步骤拆解出来基本就是yes工程师了，综合性价比高

作者: 任天狗 时间: 2026-5-11 22:56

posted by wap, platform: iPhone
今天又试了试deepseek，吊打minimax。
首先是没那么多过滤，提示词可以写爽了。
其次是解决问题的能力够强，一些推送方面的小毛病minimax都不知道发生了啥，怎么都修不好。deepseek发现问题直接帮你写清楚原因帮你修好，有水平啊。
突然对国产模型有信心了。
早上起来发现deepseek的消费金额比我晚上睡觉之前看的金额涨了几块钱，这些agent挂机还要消费token的啊，按流量计费真是不省心

本帖最后由任天狗于 2026-5-11 23:28 通过手机版编辑

作者: jelly003 时间: 2026-5-12 08:29

CloudCode > Codex 这是我个人体验网页端程序

作者: never2002 时间: 2026-5-12 11:36

中文文字处理用啥国产AI比较合适？

作者: pocketmom 时间: 2026-5-12 12:07

posted by wap, platform: Android
minimax甚至还不如我本地部署的qwen3.6 27b

作者: burnfox 时间: 2026-5-12 17:38

posted by wap, platform: Chrome
trae国内直接用+免费，没什么可抱怨的。

也不输Android Studio内置Gemini，当然还是互相补充。

本帖最后由 burnfox 于 2026-5-12 17:39 通过手机版编辑

作者: 今夜打老虎 时间: 2026-5-13 00:27

posted by wap, platform: Android

引用:

原帖由 @任天狗于 2026-5-11 22:56 发表
今天又试了试deepseek，吊打minimax。
首先是没那么多过滤，提示词可以写爽了。
其次是解决问题的能力够强，一些推送方面的小毛病minimax都不知道发生了啥，怎么都修不好。deepseek发现问题直接帮你写清楚原因帮你修好，有水平啊。
突然对国产模型有信心了。
早上起来发现deepseek的消费金额比我晚上睡觉之前看的金额涨了几块钱，这些agent挂机还要消费token的啊，按流量计费真是不省心

本帖最后由任天狗于 2026511 23:28 通过手机版编辑

可以用cc switch代理把ds转发到claude code上用，工程拆解能力更进一步，如果不是coding任务的话，我感觉不出来和codex的区别，甚至有时候更强

欢迎光临 TGFC Lifestyle (http://tgfcer.com/)