模型大战下一站：价格、芯片和供应链

OpenAI 先把高端价位往上抬了

这波里最刺眼的，不是 GPT-5.5 发布本身，而是它的价格信号。

OpenAI 2026-04-23 的官方定价页写得很清楚，GPT-5.5 标准档输入是 $5 / 1M tokens，输出是 $30 / 1M tokens；而 GPT-5.4 是 $2.5 / 1M 和 $15 / 1M。这不是“接近翻倍”，这是直接翻倍。

这个动作在我看来，不只是涨价这么简单。它更像是在公开宣告一件事：GPT-5.5 想占的不是“大家都能随便试试”的位置，而是高价值、高容错成本、高复杂任务的 premium 档。OpenAI 在发布页里把重点压在 agentic coding、computer use、knowledge work 和 early scientific research 上，本质上是在说：你如果真要把模型塞进工作流最核心的那一层，就得接受更高的单价。

说实话，这一步很狠。

因为一旦头部厂商主动把高端价位拉上去，市场就不再只是“谁更强”这么简单，而会迅速变成“谁的更强，值不值这个钱”。这给了其他玩家一个很现实的进攻点：你未必要全面超越 OpenAI，只要在编码、Agent、长任务稳定性这些高频场景里把性价比打出来，就够难受了。

国产这波，已经不是简单陪跑了

如果只把这几天的动态理解成“大家都在跟着 OpenAI 发新模型”，那也有点低估这波强度。

Kimi K2.6 的官网和技术博客，重点已经不是普通聊天，而是长程 coding、Agent Swarm、持续执行。Moonshot 自己给的案例里，模型能跑 4000+ 次工具调用、连续执行 12 小时以上；API 平台首页给的公开价格是缓存 $0.16 / MTok、输入 $0.95 / MTok、输出 $4.00 / MTok。你可以不完全相信厂商自测成绩，但这个定价姿态已经很明确：它不是来拼最高溢价的，它是来抢 agentic coding 这一层的。

小米这边也一样。2026-04-22 放出的 MiMo-V2.5 和 MiMo-V2.5-Pro，主打词不是聊天味道，而是 agentic capability、multimodality、long horizon coherence。MiMo-V2.5 直接把 1M context、多模态、Agent 放在首页第一屏；V2.5-Pro 则强调公测上线、价格不变、但复杂软件工程和长任务一致性继续抬高。这个信号很重要：现在新模型要争的位置，已经默认是“能不能接进工具链、能不能跑长任务、能不能真的干活”。

DeepSeek 就更明显了。2026-04-24 的 V4 Preview 直接把 1M context、V4-Pro、V4-Flash 和 API 当天可用都摆出来了。更关键的是价格：官方文档里 deepseek-v4-pro 输入 $1.74 / 1M、输出 $3.48 / 1M；deepseek-v4-flash 更低，输入 $0.14 / 1M、输出 $0.28 / 1M。你把这个价格跟 GPT-5.5 放一起看，那个味道就完全不一样了。

这已经不是“你有前沿模型，我也有一个”。

这是：

有人把高端价位往上拉；
有人拿开放、长任务和工具调用往中高端顶；
有人直接把价格打到你没法忽视。

DeepSeek 和华为这条线，传言最容易跑偏

你提到的另一个点，也正是今晚最容易传歪的地方：DeepSeek V4 到底是不是已经适配华为芯片，还是要等到下半年。

按我这次核到的公开信息，更准确的说法应该是：现在已经支持，下半年说的是更大规模部署以后，成本还会继续往下掉。

DeepSeek 官方 2026-04-24 的新闻页写的是 V4 Preview 已经上线，API 当天可用；同一天，华为相关公开消息也明确说 Ascend 整个 supernode 产品线已经支持 DeepSeek V4。所以，如果说“下半年才能全面适配”，这个说法至少和今天能核到的公开信息不完全一致。

真正和“下半年”相关的，是另一层意思：华为这边提到，等 Ascend 950 supernodes 在 2026 年下半年大规模量产部署之后，V4-Pro 的价格还会明显下降。也就是说，下半年不是“才开始能跑”，而更像是“能跑这件事已经成立了，接下来要看的，是规模化以后价格还能不能再砍一刀”。

这个区别很大。

前者是技术能不能成立，后者是商业化能不能放量。

我反而觉得，这才是今晚最值得盯的信号。因为一旦 DeepSeek 这种级别的模型，真的开始稳定地和华为 Ascend 这条线绑定，大模型竞争就不再只是模型公司之间的事了，而是训练、推理、芯片、集群、价格表一起联动。谁能把整条链路跑通，谁的话语权就会更硬。

为什么我说赛道已经白热化

以前大家聊模型大战，常常还停留在榜单、参数、跑分和一句“又进步了”。现在不太一样了。

现在的竞争至少同时发生在三层：

第一层，模型本身要能打，尤其是 coding、Agent、长上下文这些真正能进工作流的能力。

第二层，价格得讲得过去。因为模型只要开始接真实业务，token 成本就不是抽象数字，而是月底账单。

第三层，底下跑在哪套芯片、哪套集群、哪套软件栈上，开始影响它能不能持续降价、能不能稳定供给、能不能穿过地缘和供应链约束。

这三层一起卷，才叫真的白热化。

所以我现在反而不太想再问“这几家谁是第一”。那个问题越来越没劲。

更有用的问题是：

你手上的任务，到底值不值得为 GPT-5.5 这种高价模型买单；
你的长程编码和 Agent 工作流，能不能交给 Kimi K2.6、MiMo-V2.5、DeepSeek V4 这类更便宜但明显更 aggressive 的选手；
你的业务有没有国产算力、合规、本地化部署或者供应链稳定性的硬约束。

这才是现实世界里的选型。

说到底，白热化从来不是“发布会变多了”这么简单。真正让人感觉温度上来的，是头部厂商敢涨价，追赶者敢贴身打，芯片厂商也开始直接下场接住模型路线。模型、价格、算力三件事绑在一起之后，这个行业就很难再回到前两年那种只看榜单热闹一下的阶段了。

下半年我反而更关心一件事：不是谁还能再刷出多高的分，而是谁能把能力、成本、供应链这三笔账同时算平。

能做到这一点的，才不是昙花一现。

参考资料

写作附记

原始提示词

这两天各家发布了很多新模型，ChatGPT5.5，DeepseekV4，小米2.5, kimi2.6, ChatGPT5.5 还涨价了，接近翻倍。开始谣传 DeepseekV4l已经适配了华为显卡，今晚最新的消息，下半年才能全面适配。大模型这个赛道，彻底进入了白热化的局面。

写作思路摘要

把主线定成“这轮竞争已经从模型分数扩展到价格和芯片栈”，不写成新闻流水账。
先用 2026-04-20 到 2026-04-24 的连续发布时间，把“这两天很热闹”的体感落到具体日期上。
单独拎出 GPT-5.5 涨价，解释它更像高端定价信号，而不是一句简单的“又贵了”。
把 Kimi K2.6、MiMo-V2.5、DeepSeek V4 放到 Agent、长任务和成本这条线上看，强调它们不是单纯陪跑。
刻意没有展开具体 benchmark 分数大战，也没有写成逐家横评，主线只服务“能力、成本、供应链开始绑在一起”这个判断。