端午假期试 Hermes,真正有用的是记住坑
端午假期把 Hermes 部署起来,路上零零散散让它写了一些东西。前一阵子另一拨工具很热的时候,我没怎么动手,评估下来感觉用处有限;这次等热闹过去,再看后出来的 Hermes,反而更适合慢慢试。
端午假期把 Hermes 部署起来,路上零零散散让它写了一些东西。前一阵子另一拨工具很热的时候,我没怎么动手,评估下来感觉用处有限;这次等热闹过去,再看后出来的 Hermes,反而更适合慢慢试。
Hermes 接上 SearXNG 以后,表面上已经把搜索问题收回到了本机:SEARXNG_URL=http://localhost:8888。但境内服务器真正容易卡住的地方不在 Hermes 到 SearXNG 这一跳,而在 SearXNG 自己还要访问 Google、DuckDuckGo、Brave、Startpage 这些搜索源。
昨天参加 MiniMax 线下开发者大会,回来以后有个词一直没绕过去:loop engineering。
我一开始以为它只是把 agent 多跑几轮。这个理解太浅了。真正让我卡住的地方是,AI 写代码的速度已经比人审核代码的速度快太多,如果人的参与还停在“每一步都看、每一步都拍板”,那生产力最后会被人的检查速度锁住。
最开始我以为只是前端还没来得及收拾。strategy_studio 的业务逻辑一直在往前走:行情同步、PostgreSQL、异步回测、报告落库和研究工作台都陆续接上了,但页面看起来越来越像“功能先上车,界面后补票”。等我想让 Codex 直接破坏性重构 UI 时,问题才真正露出来:提示词越写越狠,界面还是像在旧格子里重新挪组件。
这几天看大模型公司的资本动作,很容易把两件事混在一起。
智谱和 MiniMax 都在往 A 股路径上推,Anthropic 已经向 SEC 保密递交 draft S-1,OpenAI 也被 Axios 报道正在准备 confidential IPO prospectus。几条消息摆在一起,像是这个行业终于到了收获期。
但上市窗口先打开,不等于利润窗口已经打开。大模型公司不是没有收入了,有些收入甚至跑得很快;真正还没普遍翻过去的,是净利润、经营现金流和持续模型投入这本账。
/goal 最容易被误解成一条“让 agent 多干一会儿”的命令。
这当然是它的表象。你给 Codex 一个目标,它可以围着这个目标持续推进,不是一轮回答完就停。但真正值得注意的不是“跑得久”,而是它把“做到什么算完”从一句临时提醒,变成了任务本身的一部分。
普通 prompt 说的是下一步要做什么。goal 更像给 agent 挂了一张验收单:目标是什么,边界在哪里,哪些验证必须通过,满足什么条件才可以收工。
整理 ChatGPT 以来的英伟达数据中心 GPU,不能只做型号清单。真正的变化是两条路线同时加速:一条追最高训练性能,一条追可卖、可交付、可合规的市场覆盖。
训练路线看的是 H100、H200、B200、GB200 这类旗舰产品。它们不断把算力、显存、带宽、互联和整柜方案往上推。大模型越大,单卡性能已经不够,系统级连接、集群效率和能耗控制变得更重要。
另一条路线是特供和区域合规版本。给中国市场的产品,不只是简单“阉割版”,而是在出口管制限制下,重新平衡性能、带宽、互联和可销售性。它们的意义不是代表最高技术,而是说明英伟达要在规则缝隙里保住客户和生态。
这几个月用 Claude、Codex 写代码,我最强烈的感受不是“程序员要没了”。
更准确的说法是,很多以前会丢给新人练手的活,现在 AI 能先打一版了。脚手架、小功能、测试、文档、边角 bug,以前这些活不算高级,但很适合把一个人从“会语法”磨到“知道工程怎么回事”。
对老手来说,AI 是提效工具。对新人来说,它更像把新手村拆短了。门没有关,但从入口走到能独立负责事情,中间能慢慢摔跤的地方变少了。