这轮模型大战,已经卷到价格和芯片上了

今晚刷模型消息,确实有点傻眼。

按官网时间线看,这波密集更新其实是连着来的:2026-04-20 Moonshot 把 Kimi K2.6 挂上首页;2026-04-22 小米正式放出 MiMo-V2.5MiMo-V2.5-Pro2026-04-23 OpenAI 发布 GPT-5.5,API 定价也一起抬了上去;2026-04-24 DeepSeek 又把 V4 Preview 推出来。顺手说一句,群里常说的“小米 2.5”,严格点讲应该是 Xiaomi MiMo-V2.5 / V2.5-Pro,不是一个模糊代号。

我现在的判断很直接:这轮已经不是单纯的模型发版潮了,而是三条线一起打起来了——模型能力、API 价格、芯片栈归属。谁只讲其中一条,基本都容易看偏。也正因为三条线开始咬在一起,大模型这个赛道才会显得这么白热化。

OpenAI 先把高端价位往上抬了

这波里最刺眼的,不是 GPT-5.5 发布本身,而是它的价格信号。

OpenAI 2026-04-23 的官方定价页写得很清楚,GPT-5.5 标准档输入是 $5 / 1M tokens,输出是 $30 / 1M tokens;而 GPT-5.4$2.5 / 1M$15 / 1M。这不是“接近翻倍”,这是直接翻倍

这个动作在我看来,不只是涨价这么简单。它更像是在公开宣告一件事:GPT-5.5 想占的不是“大家都能随便试试”的位置,而是高价值、高容错成本、高复杂任务的 premium 档。OpenAI 在发布页里把重点压在 agentic coding、computer use、knowledge work 和 early scientific research 上,本质上是在说:你如果真要把模型塞进工作流最核心的那一层,就得接受更高的单价。

说实话,这一步很狠。

因为一旦头部厂商主动把高端价位拉上去,市场就不再只是“谁更强”这么简单,而会迅速变成“谁的更强,值不值这个钱”。这给了其他玩家一个很现实的进攻点:你未必要全面超越 OpenAI,只要在编码、Agent、长任务稳定性这些高频场景里把性价比打出来,就够难受了。

国产这波,已经不是简单陪跑了

如果只把这几天的动态理解成“大家都在跟着 OpenAI 发新模型”,那也有点低估这波强度。

Kimi K2.6 的官网和技术博客,重点已经不是普通聊天,而是长程 coding、Agent Swarm、持续执行。Moonshot 自己给的案例里,模型能跑 4000+ 次工具调用、连续执行 12 小时以上;API 平台首页给的公开价格是缓存 $0.16 / MTok、输入 $0.95 / MTok、输出 $4.00 / MTok。你可以不完全相信厂商自测成绩,但这个定价姿态已经很明确:它不是来拼最高溢价的,它是来抢 agentic coding 这一层的。

小米这边也一样。2026-04-22 放出的 MiMo-V2.5MiMo-V2.5-Pro,主打词不是聊天味道,而是 agentic capabilitymultimodalitylong horizon coherenceMiMo-V2.5 直接把 1M context、多模态、Agent 放在首页第一屏;V2.5-Pro 则强调公测上线、价格不变、但复杂软件工程和长任务一致性继续抬高。这个信号很重要:现在新模型要争的位置,已经默认是“能不能接进工具链、能不能跑长任务、能不能真的干活”。

DeepSeek 就更明显了。2026-04-24V4 Preview 直接把 1M contextV4-ProV4-Flash 和 API 当天可用都摆出来了。更关键的是价格:官方文档里 deepseek-v4-pro 输入 $1.74 / 1M、输出 $3.48 / 1Mdeepseek-v4-flash 更低,输入 $0.14 / 1M、输出 $0.28 / 1M。你把这个价格跟 GPT-5.5 放一起看,那个味道就完全不一样了。

这已经不是“你有前沿模型,我也有一个”。

这是:

  • 有人把高端价位往上拉;
  • 有人拿开放、长任务和工具调用往中高端顶;
  • 有人直接把价格打到你没法忽视。

DeepSeek 和华为这条线,传言最容易跑偏

你提到的另一个点,也正是今晚最容易传歪的地方:DeepSeek V4 到底是不是已经适配华为芯片,还是要等到下半年。

按我这次核到的公开信息,更准确的说法应该是:现在已经支持,下半年说的是更大规模部署以后,成本还会继续往下掉。

DeepSeek 官方 2026-04-24 的新闻页写的是 V4 Preview 已经上线,API 当天可用;同一天,华为相关公开消息也明确说 Ascend 整个 supernode 产品线已经支持 DeepSeek V4。所以,如果说“下半年才能全面适配”,这个说法至少和今天能核到的公开信息不完全一致。

真正和“下半年”相关的,是另一层意思:华为这边提到,等 Ascend 950 supernodes 在 2026 年下半年大规模量产部署之后,V4-Pro 的价格还会明显下降。也就是说,下半年不是“才开始能跑”,而更像是“能跑这件事已经成立了,接下来要看的,是规模化以后价格还能不能再砍一刀”。

这个区别很大。

前者是技术能不能成立,后者是商业化能不能放量。

我反而觉得,这才是今晚最值得盯的信号。因为一旦 DeepSeek 这种级别的模型,真的开始稳定地和华为 Ascend 这条线绑定,大模型竞争就不再只是模型公司之间的事了,而是训练、推理、芯片、集群、价格表一起联动。谁能把整条链路跑通,谁的话语权就会更硬。

为什么我说赛道已经白热化

以前大家聊模型大战,常常还停留在榜单、参数、跑分和一句“又进步了”。现在不太一样了。

现在的竞争至少同时发生在三层:

第一层,模型本身要能打,尤其是 coding、Agent、长上下文这些真正能进工作流的能力。

第二层,价格得讲得过去。因为模型只要开始接真实业务,token 成本就不是抽象数字,而是月底账单。

第三层,底下跑在哪套芯片、哪套集群、哪套软件栈上,开始影响它能不能持续降价、能不能稳定供给、能不能穿过地缘和供应链约束。

这三层一起卷,才叫真的白热化。

所以我现在反而不太想再问“这几家谁是第一”。那个问题越来越没劲。

更有用的问题是:

  • 你手上的任务,到底值不值得为 GPT-5.5 这种高价模型买单;
  • 你的长程编码和 Agent 工作流,能不能交给 Kimi K2.6MiMo-V2.5DeepSeek V4 这类更便宜但明显更 aggressive 的选手;
  • 你的业务有没有国产算力、合规、本地化部署或者供应链稳定性的硬约束。

这才是现实世界里的选型。

说到底,白热化从来不是“发布会变多了”这么简单。真正让人感觉温度上来的,是头部厂商敢涨价,追赶者敢贴身打,芯片厂商也开始直接下场接住模型路线。模型、价格、算力三件事绑在一起之后,这个行业就很难再回到前两年那种只看榜单热闹一下的阶段了。

下半年我反而更关心一件事:不是谁还能再刷出多高的分,而是谁能把能力、成本、供应链这三笔账同时算平。

能做到这一点的,才不是昙花一现。

参考资料

写作附记

原始提示词

这两天各家发布了很多新模型,ChatGPT5.5,DeepseekV4,小米2.5, kimi2.6, ChatGPT5.5 还涨价了,接近翻倍。开始谣传 DeepseekV4l已经适配了华为显卡,今晚最新的消息,下半年才能全面适配。大模型这个赛道,彻底进入了白热化的局面。

写作思路摘要

  • 把主线定成“这轮竞争已经从模型分数扩展到价格和芯片栈”,不写成新闻流水账。
  • 先用 2026-04-202026-04-24 的连续发布时间,把“这两天很热闹”的体感落到具体日期上。
  • 单独拎出 GPT-5.5 涨价,解释它更像高端定价信号,而不是一句简单的“又贵了”。
  • Kimi K2.6MiMo-V2.5DeepSeek V4 放到 Agent、长任务和成本这条线上看,强调它们不是单纯陪跑。
  • 刻意没有展开具体 benchmark 分数大战,也没有写成逐家横评,主线只服务“能力、成本、供应链开始绑在一起”这个判断。
金融IT程序员的瞎折腾、日常生活的碎碎念
使用 Hugo 构建
主题 StackJimmy 设计