SemiAnalysis GTC深度解读:三款新系统背后,英伟达正在重新定义AI基础设施的边界¶
来源: 雪球 原文: https://xueqiu.com/1107854878/380942619 基于: SemiAnalysis《Nvidia – The Inference Kingdom Expands - GTC 2026》
三款系统详解¶
1. Groq LPX 推理机架¶
- 整合 Groq LP30 芯片与英伟达 GPU
- 引入"注意力与前馈网络解耦"(AFD) 技术,优化高交互推理场景中的解码延迟
- LP30 采用三星 SF4 工艺,配备 500MB 片上 SRAM
- 机架包含 32 个计算托盘、256 个 LP30 芯片和 Spectrum-X 交换机
2. Vera ETL256 CPU 机架¶
- 单一液冷机架内集成 256 颗 CPU
- 铜缆拓扑实现机架内全互联
- 针对 AI 工作负载中 CPU 瓶颈(数据预处理、调度编排、强化学习验证)
3. STX 存储参考架构¶
- 标准化存储参考架构
- 与 CMX 上下文存储平台配套
- DDN、Dell、HPE、IBM、NetApp 等主要厂商支持
核心结论¶
三款系统共同表明英伟达正向存储层、软件层和基础设施运营层推进,强化产品护城河。