ChatGPT 发布之后,英伟达数据中心显卡怎么迭代

先把时间点钉住。ChatGPT 的公开研究预览版发布于 2022 年 11 月 30 日,不是 2023 年。[1]

这个时间点之后,英伟达数据中心 GPU 的主线其实很清楚:Ampere 尾声,Hopper 接棒,Hopper 做大显存刷新,Blackwell 再把重心从“单卡 dense 算力”往“推理吞吐、功耗和整机级互连”上推。中国特供线则是另一条故事:A800、H800、H20,本质上都是在美国出口管制约束下做出来的合规版本,不能和全球旗舰线直接按同一把尺子去看。

这篇只统计两条线:

  • 全球数据中心训练/推理主线:A100 作为对照基线,H100、H200、B200、B300。
  • 中国特供线:A800、H800、H20。

我没有把 L4、L40、L40S、L2 这些也塞进正文。不是它们不重要,而是它们更多是视频推理、通用推理、图形和虚拟化那条线,和 A100/H100/H200/B200 这种大模型训练主线混在一起,价格和性能口径会乱掉。

先看主线

先给结论:如果只看 2022 年 11 月 30 日之后的发布节奏,H100 是生成式 AI 爆发初期的真正起点,H200 是一张“补内存短板”的刷新卡,B200 才是一次真正意义上的平台级换代,B300 则把 Blackwell 往推理和 reasoning 时代再推了一步。

型号 发布时间 架构 显存 显存带宽 互连 官方性能口径
A100 80GB 2020-11,作为对照基线 Ampere 80GB HBM2e 2.039 TB/s NVLink 600 GB/s BF16/FP16 Tensor Core 312 TFLOPS,INT8 624 TOPS [2]
H100 SXM 2022-03-22 Hopper 80GB HBM3 3.35 TB/s NVLink 900 GB/s BF16/FP16 1,979 TFLOPS,FP8 3,958 TFLOPS;DGX H100 单机 32 PFLOPS FP8,较 DGX A100 提升 6 倍 [3][4]
H200 SXM 2023-11-13 Hopper 刷新版 141GB HBM3e 4.8 TB/s NVLink 900 GB/s 官方给出的重点不是 core 算力翻倍,而是 Llama2 70B 推理 1.9 倍、GPT-3 175B 推理 1.6 倍;相对 H100 是更大更快的显存 [5][6]
B200 SXM 2024-03-18 Blackwell 180GB HBM3e 最高 8 TB/s 单 GPU NVLink 1.8 TB/s;8 GPU 节点总带宽最高 64 TB/s DGX B200 8 GPU 总显存 1.44TB,FP8 72 PFLOPS;Blackwell 平台主打大模型推理成本和能耗大降 [7][8][9]
B300 SXM 2025-03-18 Blackwell Ultra 288GB HBM3e 最高 8 TB/s 8 GPU 节点总带宽最高 64 TB/s;DGX B300 NVLink 汇聚带宽 14.4 TB/s DGX B300 为 144 PFLOPS FP4、72 PFLOPS FP8;官方口径是 dense FP4 较 DGX B200 提升 1.5 倍,attention 提升 2 倍 [10][11][12]

这里最容易看错的一点是:H200 不是“算力暴力翻倍卡”,它更像是 Hopper 时代补课。大模型训练和推理一旦进入超长上下文、巨型 KV cache、MoE 和更大 batch 的阶段,瓶颈早就不是单纯的 BF16 峰值数字了,而是显存容量和显存带宽。H200 把这个短板补上了。

真正的代际断层发生在 Blackwell。Blackwell 不再只卖一张卡,而是在卖一整套平台能力:新精度、互连、整机级带宽、推理成本、功耗效率、rack-scale 组织方式。这就是为什么很多资料在讲 B200 时,单卡指标反而没 H100 那么容易一眼看懂,因为英伟达的叙事重心已经从“这张卡多少 TFLOPS”转到“这套系统能把多大的模型以什么成本跑起来”。

再看中国特供线

中国特供线要单独看。因为它的目标不是击败全球旗舰卡,而是卡在出口管制红线之下,还尽量保留商业可用性。

型号 首次公开时间 对应母体 公开可确认参数 主要削减点 备注
A800 2022-11-08,Reuters 报道并获 NVIDIA 确认 A100 80GB HBM2e,约 2.039 TB/s;公开报道显示互连从 A100 的 600 GB/s 降到 400 GB/s [2][13][14] 互连能力 本地算力口径仍接近 A100,但大规模多卡扩展被压制
H800 2023-03-21,Reuters 报道 H100 公开报道普遍认为本地 HBM 能力接近 H100 级别;可确认的主变化是 chip-to-chip 传输速率约为 H100 的一半,公开报道常见写法在 300-400 GB/s 区间 [3][15][16] 互连能力 这是典型的“单卡不至于太差,但横向扩展受限”
H20 2024-02 开始预售,原计划 2023-11 上线后延期 Hopper 中国合规版 96GB HBM3,约 4.0 TB/s;Reuters 报道预售价格 1.2 万到 1.5 万美元/卡,8 卡服务器约 140 万元人民币 [17][18] 计算能力被进一步压低 H20 不是 H800 的直接性能升级版,而是更严格规则下的合规产物

这条线最值得记住的一句话是:A800 和 H800 更像“削互连”,H20 则是“连计算能力都得继续压”。

所以如果有人只看显存数字,得出“H20 比 H800 更新,所以更强”,这个判断不对劲。H20 的 96GB HBM3 和 4.0 TB/s 带宽看起来不差,但它出现的前提,是要满足更严的出口限制。它的商业目标首先是能卖,其次才是尽量能用。

前一代比上一代,到底升级了多少

先说计算方法:

\[ \text{升级率}=\frac{\text{新一代指标}-\text{上一代指标}}{\text{上一代指标}} \]

但这个公式只适合口径一致的指标。显存、显存带宽、NVLink 带宽可以直接算;平台级推理成本和整机吞吐,不能硬塞回单卡 TFLOPS 那套口径里。

全球主线

代际 变化最大的地方 可直接计算的升级幅度
A100 80GB -> H100 SXM Tensor Core 与显存带宽一起抬升 显存容量 0%;显存带宽从 2.039 到 3.35 TB/s,约 +64.3%;NVLink 从 600 到 900 GB/s,约 +50%;BF16/FP16 从 312 到 1,979 TFLOPS,约 +534.3% [2][3]
H100 SXM -> H200 SXM 重点改成“更大更快的显存” 显存从 80GB 到 141GB,约 +76.3%;显存带宽从 3.35 到 4.8 TB/s,约 +43.3%;NVLink 基本不变;BF16/FP8 峰值口径基本不变 [3][6]
H200 SXM -> B200 SXM Hopper 到 Blackwell 的平台级跃迁 显存从 141GB 到 180GB,约 +27.7%;显存带宽从 4.8 到最高 8 TB/s,约 +66.7%;但真正的大变化是 FP4、1.8 TB/s NVLink、整机与 rack-scale 推理效率 [8][9]
B200 SXM -> B300 SXM Blackwell Ultra 把大显存和 reasoning 再往前推 显存从 180GB 到 288GB,约 +60.0%;显存带宽公开口径仍为最高 8 TB/s;DGX B300 dense FP4 相对 DGX B200 提升 1.5 倍,attention 提升 2 倍 [10][11]

读下来会发现一个规律:

  • H100 是暴力拉升单卡张量算力的一代。
  • H200 是补显存的一代。
  • B200 是把“训练卡”变成“AI 工厂基础设施”的一代。
  • B300 是把 Blackwell 更明确地推向 reasoning 和大规模推理的一代。

中国特供线

代际 直观看上去像升级,实际上要分开看 我的判断
A800 -> H800 如果只看本地 HBM 带宽,A100 级到 H100 级,约可理解为 +64% 的代际推进 但核心约束仍然是互连,不是单卡本地显存
H800 -> H20 显存从 80GB 到 96GB,约 +20%;如果按常见公开参数,带宽从 3.35 到 4.0 TB/s,约 +19.4% 这不是纯粹升级。H20 是合规压力更大后的折中品,不能简单当成“H800 Plus”

这也是为什么中国特供线不太适合写成“每一代都全面提升多少”。这条线先天带着合规约束,设计目标不是技术最优,而是规则约束下的商业可交付。

售价到底涨了多少

这一段最容易被写假。因为英伟达很少公开数据中心 GPU 单卡 MSRP,公开世界里更常见的是:

  • DGX 整机价格或第三方整机挂牌价。
  • 中国特供卡的渠道报价。
  • 媒体、券商或供应链消息。

所以这里我只给“公开可追溯价格样本”,不伪造一张看起来完整、其实口径混乱的官方价格表。

对象 公开价格样本 和上一代相比怎么理解
DGX H100 2022-03-22 发布时官方起售价 19.9 万美元 [4] 这是最干净的官方锚点
DGX H100 2024-10 市场挂牌价约 35.84 万美元 [19] 这是后期渠道价,不适合直接和 2022 年首发价混成一条线
DGX B200 2024-10 Broadberry 挂牌 51.541 万美元 [19] 相对同一时期的 DGX H100 挂牌价,约 +43.8%;这也是 Wells Fargo 提到的 40%-50% 区间
H20 单卡 2024-02 Reuters 报道为 1.2 万到 1.5 万美元 [17] 这是中国特供卡渠道价,不是全球旗舰线价格
H20 八卡服务器 约 140 万元人民币 [17] 对比 Reuters 提到 H800 八卡服务器首发约 200 万元人民币,反而约便宜 30%

所以“整体售价提升了多少”,我给两个结论:

第一,全球旗舰主线确实在涨,而且涨幅不小。能公开对齐的样本里,DGX B200 相对同一时期挂牌的 DGX H100,大概贵了 40% 到 50%。[19]

第二,中国特供线不是一路涨价,反而可能出现“更晚出的卡更便宜”的情况。H20 的八卡服务器公开报价大约比 H800 八卡服务器低 30%,原因不是良心,而是性能能力被进一步压缩了。[17]

最后做个收口

如果把 ChatGPT 发布后的英伟达数据中心 GPU 变化压成一句话,我的判断是:

H100 是生成式 AI 爆发时点的起跑枪,H200 是一次内存导向的续命,B200 才是 AI 工厂时代真正的平台换代,B300 则开始明显为 reasoning 时代铺路。中国特供线则完全是另一套逻辑,它不是在追旗舰,而是在规则缝隙里尽量保住可用性。

这两条线不要混着看。混着看,很容易得出“新卡显存更大,所以代际更强”“价格更低,所以性价比更高”这种大差不差、但方向不对的结论。

参考资料

  1. OpenAI, Introducing ChatGPT, 2022-11-30: https://openai.com/index/chatgpt/
  2. NVIDIA A100 official datasheet/search snippet: https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/a100/pdf/a100-80gb-datasheet-update-nvidia-us-1521051-r2-web.pdf
  3. NVIDIA H100 product page: https://www.nvidia.com/en-us/data-center/h100/
  4. NVIDIA Newsroom, NVIDIA Announces DGX H100 Systems, 2022-03-22: https://nvidianews.nvidia.com/news/nvidia-announces-dgx-h100-systems-worlds-most-advanced-enterprise-ai-infrastructure
  5. NVIDIA Newsroom, NVIDIA Supercharges Hopper With H200, 2023-11-13: https://nvidianews.nvidia.com/news/nvidia-supercharges-hopper-the-worlds-leading-ai-computing-platform
  6. NVIDIA H200 product page: https://www.nvidia.com/en-gb/data-center/h200/
  7. NVIDIA Newsroom, NVIDIA Blackwell Platform Arrives, 2024-03-18: https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing
  8. NVIDIA Enterprise Reference Architectures, HGX AI Factory components: https://docs.nvidia.com/enterprise-reference-architectures/hgx-ai-factory/latest/components.html
  9. NVIDIA DGX B200 user guide / specs: https://docs.nvidia.com/dgx/dgxb200-user-guide/introduction-to-dgxb200.html
  10. NVIDIA Newsroom, NVIDIA Blackwell Ultra AI Factory Platform, 2025-03-18: https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-ai-factory-platform-paves-way-for-age-of-ai-reasoning
  11. NVIDIA DGX B300 product page: https://www.nvidia.com/en-us/data-center/dgx-b300/
  12. NVIDIA Data Center Platform Line Card, 2025: https://docs.nvidia.com/data-center-gpu/line-card.pdf
  13. Reuters/Investing, NVIDIA starts making new chips for China, 2022-11-08: https://www.investing.com/news/stock-market-news/nvidia-starts-making-new-chips-for-china-to-comply-with-new-us-limits-432SI-2935683
  14. Tom’s Hardware, Reuters 转述 A800 互连降到 400 GB/s: https://www.tomshardware.com/news/nvidia-creates-new-supercomputer-chip-for-chinese-market
  15. Yahoo Finance / Reuters, H800 public report, 2023-03-21: https://finance.yahoo.com/news/nvidia-tweaks-flagship-h100-chip-161500447.html
  16. Data Center Dynamics, Reuters 转述 H800 互连约 300 GB/s: https://www.datacenterdynamics.com/en/news/nvidia-creates-pared-back-h100-gpu-for-export-to-china-called-h800/
  17. Reuters/Investing, H20 preorder pricing, 2024-02-01: https://m.uk.investing.com/news/stock-market-news/exclusivenvidias-new-chinafocused-ai-chip-set-to-be-sold-at-similar-price-to-huawei-product-3319402?ampMode=1
  18. Tom’s Hardware, H20 public-spec summary: https://www.tomshardware.com/news/no-nvidia-isnt-breaking-gpu-sanctions-analyst
  19. Investing, Wells Fargo on DGX B200 pricing, 2024-10-14: https://www.investing.com/news/stock-market-news/reports-on-blackwell-pricing-a-positive-for-nvidia-wells-fargo-3662086

写作附记

原始提示词

整理自从 ChatGPT 发布以来,英伟达发布的显卡型号和对应的性能参数,前一代对比上一代升级了多少,整体售价提升了多少,我要的是数据中心用的显卡,包含给中国的特供版本。

写作思路摘要

  • 先把 ChatGPT 的真实发布日期固定为 2022 年 11 月 30 日,避免时间口径一开始就错位。
  • 把英伟达数据中心 GPU 拆成“全球旗舰主线”和“中国特供线”,不把两条线硬写成一条代际升级史。
  • 升级幅度只对能直接对齐的指标做百分比计算,主要是显存、显存带宽和互连。
  • 价格部分不伪造单卡 MSRP,而是只采纳官方起售价、整机挂牌价和 Reuters 渠道报价。
  • L4、L40S、L2 没展开,因为它们会把训练主线和通用推理/图形线混在一起。

拓展脑暴

方向 是否纳入正文 处理理由
A100 作为基线 纳入 用户问“前一代比上一代”,没有 A100 就没法算 H100 的升级幅度
L4、L40、L40S、L2 否决 属于数据中心产品,但更偏视频推理、图形和通用推理,和训练主线价格口径不一致
GB200、GB300 整机架构 部分纳入 用来解释为什么 Blackwell 开始更强调平台级性能,而不是只看单卡 TFLOPS
H20 详细官方规格页 否决 NVIDIA 官方公开资料不足,公开可追溯信息主要来自 Reuters 和二手硬件媒体,正文已明确标注
中国后续 Blackwell 合规版 否决 截至写作时公开信息更多是供应链和媒体报道,官方产品化口径不够稳定,不纳入正文结论
金融IT程序员的瞎折腾、日常生活的碎碎念
使用 Hugo 构建
主题 StackJimmy 设计