跳转至

GPU/ASIC 竞争

"CUDA 护城河还能撑多久?谁会先掀翻 NVDA 的桌子?"


Q1: CUDA 护城河能撑多久?会被什么颠覆?

当前答案 🟢高信心: 5-10 年内不会被系统性颠覆。 - 黄仁勋 GTC 2026 明确反驳"去 CUDA"论,指出 ASIC/TPU 只针对矩阵乘法优化,CUDA 可编程性支撑 AI 算法跃迁(MoE / 混合架构) - 替代栈(ROCm / Triton / MAX / MLX)在头部云厂单家占比 <15%

证据: entities/NVDA 2026-04-20 黄仁勋访谈 + theses/nvda-full-stack-moat

缺口: - Anthropic / Meta 内部的 CUDA 依赖度(无公开数据) - AMD ROCm 训练场景实际渗透(Inference 可见,Training 缺公开指标) - 开源替代栈(如 Triton)在初创公司占比

关联: theses/nvda-full-stack-moat


Q2: 超大厂自研 ASIC 会吃 NVDA 多少份额?时间表?

当前答案 🟡中信心: - AWS Trainium3 + MSFT Maia 200 + Google TPU v7 合计部署量当前 <20% NVDA 量 - Anthropic 已深度绑定云厂自研算力 → "第二供应链" 形态形成 - 时间点:2027-2028 自研占比可能到 25-30%(推理场景主导),训练仍以 NVDA 为主

证据: concepts/ai-industry-panorama 2026-04-19 AI 芯片初创淘汰赛

缺口: - 各超大厂自研芯片季度出货量(Trainium3 / TPU v7 / Maia 200) - 训练 vs 推理分配占比 - Anthropic 把核心训练迁到 ASIC 的可能性(黑天鹅监测点)

关联: theses/nvda-full-stack-moat, entities/NVDA


Q3: AMD MI400 能追上 GB300/Rubin 吗?

当前答案 🔴低信心(MI400 未发布): - MI355X 在 FP8 单优化场景可匹敌 B200,但 组合优化(disagg + wideEP + FP4)下被帧杀 - AMD 软件栈(SGLang/vLLM)的可组合性问题严重,中国团队春节后修复中 - MI400 路线图未公开

证据: entities/NVDA 2026-02-16 InferenceX v2 基准

缺口: - MI400 架构披露(等 AMD 2026 发布会) - AMD 软件栈修复进度 - Meta / Oracle 对 AMD 的采购意向

关联: theses/nvda-full-stack-moat


Q4: 中国国产 GPU 真能替代 NVDA 多少?

当前答案 🟡中信心(结构性国内替代): - 2025 中国 AI 加速卡出货 400 万张,NVDA 份额 95%→55%,国产首破 41% - 寒武纪扭亏(65 亿 +453%)、天数智芯(10.34 亿 +91.6%)、沐曦/壁仞/摩尔线程亏损收窄 - 海外市场基本不可能突破(CUDA 生态 + 出口管制双向锁死)

证据: concepts/ai-industry-panorama 2026-04-19 国产替代段

缺口: - 华为 Ascend 910D 实际性能 vs H100/B200 的第三方基准 - 国产栈(MindSpore / Paddle)头部 AI 应用采用率 - 中国头部云厂(阿里/字节/腾讯)国产 vs NVDA 采购占比

关联: theses/china-semi-substitute (待建)


Q5: Rubin/Feynman 代的工程风险点?

当前答案 🟡中信心: - HBM4 良率:初期可能仅 ~20TB/s(目标 22TB/s),DRAM 供应商难达标 - 单卡功耗 2,300W:数据中心改造跟不上(100KW+/rack 门槛) - 无缆化计算托盘:首次大规模使用 Paladin HD2 连接器 - PCB M8/M9 + HVLP4:新材料量产良率未验证 - CMX/ICMS 第三网络:BlueField-4 硅锚点的成熟度

证据: entities/NVDA 2026-04-15 Vera Rubin 深度分析

缺口: - HBM4 各厂家良率曲线 - 数据中心 100KW+ rack 改造节奏 - Amphenol Paladin HD2 量产情况

关联: entities/NVDA, theses/hbm-cycle-durability


Q6: 推理 vs 训练比例何时反转?对不同芯片厂的 alpha?

当前答案 🟢高信心: - 过去 80/20 训练 → 现在 ~50/50 → 2027 预测 20/80(推理主导) - 黄仁勋预测 2027 数据中心收入突破 $1T - 多架构共存(GPU + CPU + LPU + NPU)

证据: entities/NVDA 2026-04-21 GTC 战略转型 + sources/latepost-terafab-gtc-202604

缺口: - 各云厂商公开的推理/训练收入拆分 - LPU (Groq)、NPU 场景渗透率

alpha: - 看多 NVDA(多架构平台最大赢家) - 看多 CPU 回归相关标的(Vera 专为 Agent 设计 → Arm/Intel 的 agentic CPU 市场) - 看多 Groq 绑定的 Marvell / Arista

关联: theses/nvda-full-stack-moat


缺口汇总

缺口 信息源 优先级
超大厂自研 ASIC 季度出货 各云厂 10-Q / SemiAnalysis 🔴高
AMD MI400 架构 AMD 发布会 (2026 H2 预期) 🔴高
Anthropic 训练迁移动向 Dylan Patel 访谈 / 内部泄露 🔴高
HBM4 各家良率 TrendForce 付费 / 业内访谈 🔴高
华为 Ascend 910D 独立基准 业内对比测试 🟡中