晚点 — Terafab 太空算力 + 英伟达 GTC
Terafab — 马斯克的全栈 AI 基础设施野心
核心规划
- 目标产能: 1 TW/年 (目前全球 AI 算力年耗电 40-50 GW 的 20 倍)
- 太空数据中心: 80-90% 算力部署到太空, 利用太阳能
- 全栈整合: Tesla + SpaceX + xAI — 从芯片设计到制造到部署应用
- 深层动机: 规避地球监管, 太空 "先到先得", 未来可能成为太空经济规则制定方
挑战 (张璐分析)
- 宇宙热辐射对芯片性能影响远超预期
- Google 都未能完全解决 TPU 抗辐射封装难题
- 发射成本高, 太空运维/维修更昂贵
- 延迟问题 (如果为地球应用)
- SpaceX 上市估值 $1 万亿 — 需要宏大叙事支撑
太空经济机会
- 太空工厂: 微重力环境合成新材料/晶体/蛋白质
- 太空 = AI native + robotics native — 维持人类生存成本远高于机器人
- 卫星交通管理 + 数据交易 (矿产探测/山火预警/气象)
- "太空加油站": 从月球土壤提取水 → 氢气+氧气作为火箭燃料
- Starcloud 等太空计算创业公司
xAI 人事动荡
- 联合创始人陆续离职
- 模型能力提升速度低于马斯克预期
- 马斯克: "有魅力的暴君" — 高压、凌晨头脑风暴、方向不对立刻换人
- 但 xAI 已与 SpaceX 整合, 资源调用能力极强, 拥有独特太空数据优势
英伟达 GTC — 从芯片公司到 AI 基础设施公司
战略转型
- 黄仁勋宣告: 英伟达不再是芯片/GPU 公司, 而是 全栈式 AI 基础设施公司
- 目标: 成为 "AI 工厂" (AI Factory)
- 2026 GTC 一次性发布 7 颗芯片 (vs 过去 1-2 颗/年)
- 销售的是完整系统 (GPU+CPU+网络+存储+CUDA+Agentic AI 部署方案)
Vera Rubin 平台
- Vera CPU: 全球首款专为 agentic AI + reinforcement learning 打造的 CPU
- 首次与 GPU 采用统一命名体系
- 已与阿里、字节、Oracle、Meta 合作
- Agent 时代持续运行 → CPU 依赖越来越深
Groq 收购 ($200 亿)
- 非独家技术授权 + 人才吸纳 (非全资收购)
- Groq 创始人: 前 Google TPU 核心成员
- LPU (Language Processing Unit): 低延迟 + 高 token 通量
- 整合到 Vera Rubin 平台, 不是单独产品线
算力重心迁移
- 过去: 80% 训练 / 20% 推理
- 现在: ~50/50
- 2027 预测: 20% 训练 / 80% 推理 (倒挂)
- 黄仁勋预测 2027 数据中心收入可能超过 1 万亿美元
CPU 重拾的原因
- 某些新型模型架构在 CPU 上效率高于 GPU
- Agent 时代: 持续调用工具、运行代码、多智能体协同 → CPU 关键
- 整体集成优势: 即使 CPU 不比 AMD 更好, 系统集成是巨大优势
Google TPU
- 投资超 10 年, 早期就意识到推理重要性
- 内部使用: 性能优越, training cost 约 ChatGPT 的 ⅓
- 第三方使用: 性能打折 (缺少 Google 全栈系统优化)
- TPU 短期难以威胁 GPU, 但市场足够大
企业级 AI — 2026 爆发年
关键趋势
- 大企业愿意在垂直领域部署 AI — 偏好小语言模型 (隐私/低延迟/低成本)
- 大企业深度焦虑: 拥有海量数据但未与 AI 整合 = 无效储备
- Fortune 1000 CTO AI 预算大幅增加 — 某 CTO 拥有 $120 亿 AI 预算
- 金融/保险/医疗 AI 整合只需 3-4 个月 (vs 过去数年)
行业机会
- 医疗 AI: 占美国 GDP 20%, 礼来+英伟达数十亿美元合作
- 机器人/Physical AI: 工业/供应链场景落地快
- to B 垂直 AI: 不到 10 人团队一年内收入从零到 2000 万美元
Alpha 汇总
- Terafab 1 TW 算力: 马斯克试图掌握全栈 AI 基础设施, SpaceX 上市叙事工具
- 英伟达从 GPU → AI 工厂: 7 芯片 + Vera Rubin + Groq = 全栈生态锁定
- 算力重心训练→推理: 20/80 倒挂 → 推理芯片 (LPU/CPU/NPU) 价值提升
- 企业 AI 预算爆发: $120 亿 CTO 预算 → 垂直 AI 小语言模型需求激增
- 太空经济 = AI + 机器人原生场景: 微重力工厂/卫星边缘计算/太空加油站
- Groq $200 亿: 推理加速补缺, 非全资架构加速整合
- Google TPU 第三方困境: 内部 ⅓ cost, 外部打折扣 → 生态壁垒双刃剑