GPU/ASIC 竞争¶
"CUDA 护城河还能撑多久?谁会先掀翻 NVDA 的桌子?"
Q1: CUDA 护城河能撑多久?会被什么颠覆?¶
当前答案 🟢高信心: 5-10 年内不会被系统性颠覆。 - 黄仁勋 GTC 2026 明确反驳"去 CUDA"论,指出 ASIC/TPU 只针对矩阵乘法优化,CUDA 可编程性支撑 AI 算法跃迁(MoE / 混合架构) - 替代栈(ROCm / Triton / MAX / MLX)在头部云厂单家占比 <15%
证据: entities/NVDA 2026-04-20 黄仁勋访谈 + theses/nvda-full-stack-moat
缺口: - Anthropic / Meta 内部的 CUDA 依赖度(无公开数据) - AMD ROCm 训练场景实际渗透(Inference 可见,Training 缺公开指标) - 开源替代栈(如 Triton)在初创公司占比
关联: theses/nvda-full-stack-moat
Q2: 超大厂自研 ASIC 会吃 NVDA 多少份额?时间表?¶
当前答案 🟡中信心: - AWS Trainium3 + MSFT Maia 200 + Google TPU v7 合计部署量当前 <20% NVDA 量 - Anthropic 已深度绑定云厂自研算力 → "第二供应链" 形态形成 - 时间点:2027-2028 自研占比可能到 25-30%(推理场景主导),训练仍以 NVDA 为主
证据: concepts/ai-industry-panorama 2026-04-19 AI 芯片初创淘汰赛
缺口: - 各超大厂自研芯片季度出货量(Trainium3 / TPU v7 / Maia 200) - 训练 vs 推理分配占比 - Anthropic 把核心训练迁到 ASIC 的可能性(黑天鹅监测点)
关联: theses/nvda-full-stack-moat, entities/NVDA
Q3: AMD MI400 能追上 GB300/Rubin 吗?¶
当前答案 🔴低信心(MI400 未发布): - MI355X 在 FP8 单优化场景可匹敌 B200,但 组合优化(disagg + wideEP + FP4)下被帧杀 - AMD 软件栈(SGLang/vLLM)的可组合性问题严重,中国团队春节后修复中 - MI400 路线图未公开
证据: entities/NVDA 2026-02-16 InferenceX v2 基准
缺口: - MI400 架构披露(等 AMD 2026 发布会) - AMD 软件栈修复进度 - Meta / Oracle 对 AMD 的采购意向
关联: theses/nvda-full-stack-moat
Q4: 中国国产 GPU 真能替代 NVDA 多少?¶
当前答案 🟡中信心(结构性国内替代): - 2025 中国 AI 加速卡出货 400 万张,NVDA 份额 95%→55%,国产首破 41% - 寒武纪扭亏(65 亿 +453%)、天数智芯(10.34 亿 +91.6%)、沐曦/壁仞/摩尔线程亏损收窄 - 海外市场基本不可能突破(CUDA 生态 + 出口管制双向锁死)
证据: concepts/ai-industry-panorama 2026-04-19 国产替代段
缺口: - 华为 Ascend 910D 实际性能 vs H100/B200 的第三方基准 - 国产栈(MindSpore / Paddle)头部 AI 应用采用率 - 中国头部云厂(阿里/字节/腾讯)国产 vs NVDA 采购占比
关联: theses/china-semi-substitute (待建)
Q5: Rubin/Feynman 代的工程风险点?¶
当前答案 🟡中信心: - HBM4 良率:初期可能仅 ~20TB/s(目标 22TB/s),DRAM 供应商难达标 - 单卡功耗 2,300W:数据中心改造跟不上(100KW+/rack 门槛) - 无缆化计算托盘:首次大规模使用 Paladin HD2 连接器 - PCB M8/M9 + HVLP4:新材料量产良率未验证 - CMX/ICMS 第三网络:BlueField-4 硅锚点的成熟度
证据: entities/NVDA 2026-04-15 Vera Rubin 深度分析
缺口: - HBM4 各厂家良率曲线 - 数据中心 100KW+ rack 改造节奏 - Amphenol Paladin HD2 量产情况
关联: entities/NVDA, theses/hbm-cycle-durability
Q6: 推理 vs 训练比例何时反转?对不同芯片厂的 alpha?¶
当前答案 🟢高信心: - 过去 80/20 训练 → 现在 ~50/50 → 2027 预测 20/80(推理主导) - 黄仁勋预测 2027 数据中心收入突破 $1T - 多架构共存(GPU + CPU + LPU + NPU)
证据: entities/NVDA 2026-04-21 GTC 战略转型 + sources/latepost-terafab-gtc-202604
缺口: - 各云厂商公开的推理/训练收入拆分 - LPU (Groq)、NPU 场景渗透率
alpha: - 看多 NVDA(多架构平台最大赢家) - 看多 CPU 回归相关标的(Vera 专为 Agent 设计 → Arm/Intel 的 agentic CPU 市场) - 看多 Groq 绑定的 Marvell / Arista
关联: theses/nvda-full-stack-moat
缺口汇总¶
| 缺口 | 信息源 | 优先级 |
|---|---|---|
| 超大厂自研 ASIC 季度出货 | 各云厂 10-Q / SemiAnalysis | 🔴高 |
| AMD MI400 架构 | AMD 发布会 (2026 H2 预期) | 🔴高 |
| Anthropic 训练迁移动向 | Dylan Patel 访谈 / 内部泄露 | 🔴高 |
| HBM4 各家良率 | TrendForce 付费 / 业内访谈 | 🔴高 |
| 华为 Ascend 910D 独立基准 | 业内对比测试 | 🟡中 |