57 个页面

ai

弱模型别硬上强活

2026年04月02日

最近把一些边角活往 MiniMax 和本地模型上迁，越用越觉得，这事不能老拿“最强模型”那套标准去衡量。

我的判断很直接，弱模型别硬上强活。MiniMax 这类模型，能力弱是弱，拿去做复杂编码、长链路推理、模糊需求拆解，确实差点意思。但如果你让它做数据清洗、文档编写、方案资料搜索，这类活它是完全能接住的。同样的逻辑，本地 12B 左右的模型也一样，翻译、格式改写、批量清洗，反而是它们真正适合待的位置。

说白了，不是模型没价值，而是别把它放错工位。

复盘近两年 AI 文章后，我觉得接下来该写这 8 个选题

2026年03月30日

最近回头翻了下博客里这两年和 AI 相关的文章，发现内容已经不是最开始那种“某个模型好不好用”的简单体验了，而是逐步形成了一条比较清晰的主线：AI 如何真正进入我的开发工作流，以及它带来了什么效率、代价和新的约束。

低价 API 中转站的终局：三月份的大模型体验与不可能三角

2026年03月30日

整个三月份，我都在不同的大模型 API 中转站之间来回试。

便宜，确实是便宜。一个月花不了多少钱，就能把 ChatGPT、Claude、Gemini 之类的国外模型都摸一遍，表面上看，像是找到了一个性价比极高的解法。但真正用下来以后，我越来越觉得，这条路从一开始就绕不开一个不可能三角：质量、稳定、划算，三者很难同时成立。

到了上周末，这件事基本也算彻底明牌了。2026-03-28 到 2026-03-29 这两天，ChatGPT 相关通道的风控体感明显收紧，Claude 这边也一样，很多原来还能凑合用的低价中转，突然就变得不稳定，甚至直接失效。对我来说，这基本宣告了低价 API 中转模式的阶段性终局。

算力霸权与估值的“倒挂”：我们正在进入一个昂贵的新时代

2026年03月18日

最近在看圈子里的讨论，大家对“增长”的定义似乎发生了一次根本性的偏转。

以前我们聊互联网，聊的是“四两拨千斤”——写几行代码，租几个云服务器，靠着优秀的交互和运营就能撬动数亿用户。但到了 2026 年的今天，这种“轻资产”的幻觉正在被大模型彻底撕碎。

重度AI编程的一段日子

2026年03月16日

近期在项目中，重度使用 AI 编程，应该是最近三年，AI 在工作中融合度最高的一个项目。记录的笔记不成体系，想到什么说什么。

AI 变“笨”了吗？揭秘参数精度与推理成本的博弈

2025年12月04日

近期混迹在各个编程大模型的交流圈，模型降智是大家吐槽最多的事情。

本地台式机部署的都是量化以后的模型，可以说是降智后的版本
vibe coding 这么热门，有没有可能当前大模型输出的内容，代码是最值钱的产物？

终归还是回到国产模型

2025年12月03日

前文提到 Gemini Cli 登录的时候需要配置谷歌云的项目 ID，这里就已经不对劲，如果是个人账号不会有这个限制，能出现这个限制，已经开始进入谷歌的风控系统，认为你不是个人账号。

麻烦事，用了小半个月，刚适应，现在要回到 cc + 国产模型的怀抱。
谷歌自研芯片成本优势那么大吗？市面上主流的模式都是 Tokens 积分，谷歌现在还是按次计费。
GLM4.6 图片识别不太行，响应速度够快，照葫芦画瓢能力不行，模仿已有接口能力较弱；M2 图片识别凑合，指令遵循不够强, 照葫芦画瓢能力强。

update: 不知道是谷歌自己修复了，还是由于切换港区绑定了信用卡，账号又能正常使用了

Gemini CLI 安装部署，谷歌追上来了

2025年11月22日

小半个月过去了，国内的 MiniMax，GLM4.6 都付费体验了一波，差距还是存在，cc 工具挺好用的，昨晚折腾前端界面的优化，你懂得，笔者基本不懂前端，vibe coding 以后，才开始接触前端技术栈。国内的大模型没搞定，尝试刚发布的 gemini3，五分钟搞定了，切换到站点的归档页面，你就能看到“书架”。

常年做的后端C++开发，谷歌在这块的影响力太大了，默认谷歌的产品不会太差，大模型前期是落后，不到两年的时间，现在已经追赶上来。

首页的 AI 搜索，百度不知道猴年马月能搞出来，不是说百度不行，是国内的产品没去思考，搜索里面嵌入 AI，最重要的是速度，谷歌做到了。

1 … 4 5 6 … 8

金融IT程序员的瞎折腾、日常生活的碎碎念
使用 Hugo 构建
主题 Stack 由 Jimmy 设计