SemiAnalysis — The Great AI Silicon Shortage (2026-03-12)¶
概览¶
SemiAnalysis 付费全文,量化 AI 产业链瓶颈从 CoWoS→电力→硅片本身的演进。提供最详尽的 TSMC N3 产能分配数据和 HBM 供需模型。
关键观点¶
1. 计算需求爆炸¶
- Anthropic 2026 年 2 月单月新增 $6B ARR(Claude Code 驱动),"如果有更多算力还能更多"
- 按需 GPU 价格持续上涨(包括 Hopper,近两代前)
- 所有 neocloud 小集群已被锁死
- 超大规模 capex 全面上调,Google 2026 capex 预期翻倍
2. N3 产能量化数据¶
| 指标 | 数据 |
|---|---|
| 2026 AI 占 N3 产出 | ~60% |
| 2027 AI 占 N3 产出 | ~86% |
| 2026 H2 有效利用率 | >100% |
| 产能补足时间 | 至少 2 年 |
| 受限因素 | 洁净室空间 → 建厂 → 装设备 |
全部 AI 加速器汇聚 N3: - NVDA Rubin (3NP), AMD MI350X/MI400 (N3), TPU v7/v8 (N3E), AWS Trainium3 (N3P), Meta MTIA (N3P) - Vera CPU (N3P), NVLink 6 Switch, Spectrum 6, Tomahawk 6 全部在 N3
3. 手机可能成为释放阀¶
- 内存涨价→手机 BOM 成本上升→消费者 ASP 上升→需求走弱
- 智能手机需求可能从低单位数增长修正为低双位数同比下降
- 5% 手机 N3 晶圆转移 ≈ 10 万额外 Rubin 或 30 万额外 TPU v7
- 25% 转移 ≈ 70 万额外 Rubin 或 150 万额外 TPU v7
4. HBM 供需极度紧张¶
- HBM 晶圆消耗是普通 DRAM 的 3-4x,HBM4/HBM4E 可能接近 4x
- HBM4 pin 速率要求 ~11 Gb/s,供应商良率挑战大
- Micron 在 HBM4 落后,entities/MU 被 NVDA 排除
- VR NVL72 Vera CPU 内存 1,536GB(Grace 的 3x)
- 消费者 DRAM bit 向服务器/HBM 再分配趋势明确
5. DDR 涨价反常效应¶
- 常规 DDR 价格飙升 → DDR 利润率接近甚至超过 HBM
- 内存供应商短期缺乏将产能转向 HBM 的利润动机(至少 2026 年)
- 2027 年 HBM 定价谈判可能改变这一动态
产业链受益¶
- entities/TSM: 定价权极强,AI 客户优先级高于消费电子
- entities/NVDA: N3 最高优先级,但受 HBM4 良率约束
- 存量 GPU 云租赁: 极度稀缺 → 价格上行
- entities/MU: 短期 DRAM 涨价受益,长期 HBM4 竞争不利
与现有 Wiki 的关联¶
- 与 concepts/ai-silicon-shortage 完全一致,提供量化数据支撑
- 与 concepts/hbm-supercycle 一致:HBM4 供应紧张 + Micron 出局
- 补充 Anthropic $6B ARR 数据 → 验证 token 需求爆炸