跳转至

晚点 — Terafab 太空算力 + 英伟达 GTC

Terafab — 马斯克的全栈 AI 基础设施野心

核心规划

  • 目标产能: 1 TW/年 (目前全球 AI 算力年耗电 40-50 GW 的 20 倍)
  • 太空数据中心: 80-90% 算力部署到太空, 利用太阳能
  • 全栈整合: Tesla + SpaceX + xAI — 从芯片设计到制造到部署应用
  • 深层动机: 规避地球监管, 太空 "先到先得", 未来可能成为太空经济规则制定方

挑战 (张璐分析)

  • 宇宙热辐射对芯片性能影响远超预期
  • Google 都未能完全解决 TPU 抗辐射封装难题
  • 发射成本高, 太空运维/维修更昂贵
  • 延迟问题 (如果为地球应用)
  • SpaceX 上市估值 $1 万亿 — 需要宏大叙事支撑

太空经济机会

  • 太空工厂: 微重力环境合成新材料/晶体/蛋白质
  • 太空 = AI native + robotics native — 维持人类生存成本远高于机器人
  • 卫星交通管理 + 数据交易 (矿产探测/山火预警/气象)
  • "太空加油站": 从月球土壤提取水 → 氢气+氧气作为火箭燃料
  • Starcloud 等太空计算创业公司

xAI 人事动荡

  • 联合创始人陆续离职
  • 模型能力提升速度低于马斯克预期
  • 马斯克: "有魅力的暴君" — 高压、凌晨头脑风暴、方向不对立刻换人
  • 但 xAI 已与 SpaceX 整合, 资源调用能力极强, 拥有独特太空数据优势

英伟达 GTC — 从芯片公司到 AI 基础设施公司

战略转型

  • 黄仁勋宣告: 英伟达不再是芯片/GPU 公司, 而是 全栈式 AI 基础设施公司
  • 目标: 成为 "AI 工厂" (AI Factory)
  • 2026 GTC 一次性发布 7 颗芯片 (vs 过去 1-2 颗/年)
  • 销售的是完整系统 (GPU+CPU+网络+存储+CUDA+Agentic AI 部署方案)

Vera Rubin 平台

  • Vera CPU: 全球首款专为 agentic AI + reinforcement learning 打造的 CPU
  • 首次与 GPU 采用统一命名体系
  • 已与阿里、字节、Oracle、Meta 合作
  • Agent 时代持续运行 → CPU 依赖越来越深

Groq 收购 ($200 亿)

  • 非独家技术授权 + 人才吸纳 (非全资收购)
  • Groq 创始人: 前 Google TPU 核心成员
  • LPU (Language Processing Unit): 低延迟 + 高 token 通量
  • 整合到 Vera Rubin 平台, 不是单独产品线

算力重心迁移

  • 过去: 80% 训练 / 20% 推理
  • 现在: ~50/50
  • 2027 预测: 20% 训练 / 80% 推理 (倒挂)
  • 黄仁勋预测 2027 数据中心收入可能超过 1 万亿美元

CPU 重拾的原因

  • 某些新型模型架构在 CPU 上效率高于 GPU
  • Agent 时代: 持续调用工具、运行代码、多智能体协同 → CPU 关键
  • 整体集成优势: 即使 CPU 不比 AMD 更好, 系统集成是巨大优势

Google TPU

  • 投资超 10 年, 早期就意识到推理重要性
  • 内部使用: 性能优越, training cost 约 ChatGPT 的
  • 第三方使用: 性能打折 (缺少 Google 全栈系统优化)
  • TPU 短期难以威胁 GPU, 但市场足够大

企业级 AI — 2026 爆发年

关键趋势

  1. 大企业愿意在垂直领域部署 AI — 偏好小语言模型 (隐私/低延迟/低成本)
  2. 大企业深度焦虑: 拥有海量数据但未与 AI 整合 = 无效储备
  3. Fortune 1000 CTO AI 预算大幅增加 — 某 CTO 拥有 $120 亿 AI 预算
  4. 金融/保险/医疗 AI 整合只需 3-4 个月 (vs 过去数年)

行业机会

  • 医疗 AI: 占美国 GDP 20%, 礼来+英伟达数十亿美元合作
  • 机器人/Physical AI: 工业/供应链场景落地快
  • to B 垂直 AI: 不到 10 人团队一年内收入从零到 2000 万美元

Alpha 汇总

  1. Terafab 1 TW 算力: 马斯克试图掌握全栈 AI 基础设施, SpaceX 上市叙事工具
  2. 英伟达从 GPU → AI 工厂: 7 芯片 + Vera Rubin + Groq = 全栈生态锁定
  3. 算力重心训练→推理: 20/80 倒挂 → 推理芯片 (LPU/CPU/NPU) 价值提升
  4. 企业 AI 预算爆发: $120 亿 CTO 预算 → 垂直 AI 小语言模型需求激增
  5. 太空经济 = AI + 机器人原生场景: 微重力工厂/卫星边缘计算/太空加油站
  6. Groq $200 亿: 推理加速补缺, 非全资架构加速整合
  7. Google TPU 第三方困境: 内部 ⅓ cost, 外部打折扣 → 生态壁垒双刃剑