弱模型别硬上强活
最近把一些边角活往 MiniMax 和本地模型上迁,越用越觉得,这事不能老拿“最强模型”那套标准去衡量。
我的判断很直接,弱模型别硬上强活。MiniMax 这类模型,能力弱是弱,拿去做复杂编码、长链路推理、模糊需求拆解,确实差点意思。但如果你让它做数据清洗、文档编写、方案资料搜索,这类活它是完全能接住的。同样的逻辑,本地 12B 左右的模型也一样,翻译、格式改写、批量清洗,反而是它们真正适合待的位置。
说白了,不是模型没价值,而是别把它放错工位。
最近把一些边角活往 MiniMax 和本地模型上迁,越用越觉得,这事不能老拿“最强模型”那套标准去衡量。
我的判断很直接,弱模型别硬上强活。MiniMax 这类模型,能力弱是弱,拿去做复杂编码、长链路推理、模糊需求拆解,确实差点意思。但如果你让它做数据清洗、文档编写、方案资料搜索,这类活它是完全能接住的。同样的逻辑,本地 12B 左右的模型也一样,翻译、格式改写、批量清洗,反而是它们真正适合待的位置。
说白了,不是模型没价值,而是别把它放错工位。
最近回头翻了下博客里这两年和 AI 相关的文章,发现内容已经不是最开始那种“某个模型好不好用”的简单体验了,而是逐步形成了一条比较清晰的主线:AI 如何真正进入我的开发工作流,以及它带来了什么效率、代价和新的约束。
整个三月份,我都在不同的大模型 API 中转站之间来回试。
便宜,确实是便宜。一个月花不了多少钱,就能把 ChatGPT、Claude、Gemini 之类的国外模型都摸一遍,表面上看,像是找到了一个性价比极高的解法。但真正用下来以后,我越来越觉得,这条路从一开始就绕不开一个不可能三角:质量、稳定、划算,三者很难同时成立。
到了上周末,这件事基本也算彻底明牌了。2026-03-28 到 2026-03-29 这两天,ChatGPT 相关通道的风控体感明显收紧,Claude 这边也一样,很多原来还能凑合用的低价中转,突然就变得不稳定,甚至直接失效。对我来说,这基本宣告了低价 API 中转模式的阶段性终局。
最近在看圈子里的讨论,大家对“增长”的定义似乎发生了一次根本性的偏转。
以前我们聊互联网,聊的是“四两拨千斤”——写几行代码,租几个云服务器,靠着优秀的交互和运营就能撬动数亿用户。但到了 2026 年的今天,这种“轻资产”的幻觉正在被大模型彻底撕碎。
近期在项目中,重度使用 AI 编程,应该是最近三年,AI 在工作中融合度最高的一个项目。记录的笔记不成体系,想到什么说什么。
近期混迹在各个编程大模型的交流圈,模型降智是大家吐槽最多的事情。
前文提到 Gemini Cli 登录的时候需要配置谷歌云的项目 ID,这里就已经不对劲,如果是个人账号不会有这个限制,能出现这个限制,已经开始进入谷歌的风控系统,认为你不是个人账号。
update: 不知道是谷歌自己修复了,还是由于切换港区绑定了信用卡,账号又能正常使用了
小半个月过去了,国内的 MiniMax,GLM4.6 都付费体验了一波,差距还是存在,cc 工具挺好用的,昨晚折腾前端界面的优化,你懂得,笔者基本不懂前端,vibe coding 以后,才开始接触前端技术栈。国内的大模型没搞定,尝试刚发布的 gemini3,五分钟搞定了,切换到站点的归档页面,你就能看到“书架”。
常年做的后端C++开发,谷歌在这块的影响力太大了,默认谷歌的产品不会太差,大模型前期是落后,不到两年的时间,现在已经追赶上来。
首页的 AI 搜索,百度不知道猴年马月能搞出来,不是说百度不行,是国内的产品没去思考,搜索里面嵌入 AI,最重要的是速度,谷歌做到了。