Tags

2 个页面

英伟达

ChatGPT 之后,英伟达数据中心 GPU 分成两条路线

整理 ChatGPT 以来的英伟达数据中心 GPU,不能只做型号清单。真正的变化是两条路线同时加速:一条追最高训练性能,一条追可卖、可交付、可合规的市场覆盖。

训练路线看的是 H100、H200、B200、GB200 这类旗舰产品。它们不断把算力、显存、带宽、互联和整柜方案往上推。大模型越大,单卡性能已经不够,系统级连接、集群效率和能耗控制变得更重要。

另一条路线是特供和区域合规版本。给中国市场的产品,不只是简单“阉割版”,而是在出口管制限制下,重新平衡性能、带宽、互联和可销售性。它们的意义不是代表最高技术,而是说明英伟达要在规则缝隙里保住客户和生态。

Gemma 4 开放以后(三):显存速度决定本地体验

这次刷论坛,最让我长记性的不是哪家又发了榜单,而是一句很土的话,显存不够,参数再大也白搭。

以前我总把“模型慢”理解成算力问题。后来越看越明白,很多时候根本不是 GPU 算不动,而是数据没法待在对的地方。只要内存路径一变,token 速度就不是慢一点,是直接掉下去。