跳转至

SemiAnalysis GTC深度解读:三款新系统背后,英伟达正在重新定义AI基础设施的边界

来源: 雪球 原文: https://xueqiu.com/1107854878/380942619 基于: SemiAnalysis《Nvidia – The Inference Kingdom Expands - GTC 2026》


三款系统详解

1. Groq LPX 推理机架

  • 整合 Groq LP30 芯片与英伟达 GPU
  • 引入"注意力与前馈网络解耦"(AFD) 技术,优化高交互推理场景中的解码延迟
  • LP30 采用三星 SF4 工艺,配备 500MB 片上 SRAM
  • 机架包含 32 个计算托盘、256 个 LP30 芯片和 Spectrum-X 交换机

2. Vera ETL256 CPU 机架

  • 单一液冷机架内集成 256 颗 CPU
  • 铜缆拓扑实现机架内全互联
  • 针对 AI 工作负载中 CPU 瓶颈(数据预处理、调度编排、强化学习验证)

3. STX 存储参考架构

  • 标准化存储参考架构
  • 与 CMX 上下文存储平台配套
  • DDN、Dell、HPE、IBM、NetApp 等主要厂商支持

核心结论

三款系统共同表明英伟达正向存储层、软件层和基础设施运营层推进,强化产品护城河。