DeepSeek (深度求索)¶
⚠️ 2026-04-25: DeepSeek V4 重磅开源!百万上下文标配,首次验证华为 Ascend NPU 兼容性
概况¶
- 创始人: 梁文锋(幻方量化联合创始人)
- 定位: 中国开源大模型领跑者,以 MoE 架构和极致成本效率著称
- 代表模型: DeepSeek V4-Pro/V4-Flash, V3, R1(推理模型)
最新动态¶
2026-04-25: DeepSeek V4 开源发布 — 百万上下文 + 跨平台验证¶
模型规格 - V4-Pro: 1.6T 总参数 / 49B 激活参数,性能比肩顶级闭源模型 - V4-Flash: 284B 参数,主攻性价比 - 上下文: 1M (一百万) token 标配 — 全球领先的长上下文能力
关键技术创新 1. 混合注意力机制 CSA + HCA: 压缩稀疏注意力 + 高度压缩注意力交错堆叠,将序列长度压缩至 1/m 同时保持表达能力 2. Engram 记忆模块: 梁文锋署名论文核心概念,将"查表"与"计算"分离,O(1) 复杂度调用固定知识模式 3. mHC 流形约束超连接: 解决极深网络训练不稳定性,计算利用率从 60% 提升至 85%+ 4. Muon 优化器: 万亿参数 MoE 首次大规模采用,混合 Newton-Schulz 迭代策略 5. FP4 量化: 无损压缩与推理加速,量化流程无缝复用现有 FP8 训练框架
跨平台战略突破 - 华为 Ascend 验证: 细粒度专家并行(EP)方案同时在 NVIDIA GPU 和华为 Ascend NPU 上完成验证 - 推理路径解耦: 开始尝试将模型运行时从单一硬件依赖中解耦 - 当前状态: 开源层面仍主要基于 CUDA,但已为多算力环境预留空间 - 价格预期: 官方表示下半年昇腾 950 超节点批量上市后,Pro 价格会大幅下调
性能表现 (V4-Pro-Max) - 知识: SimpleQA-Verified 57.9%,远超前代开源模型 (~30%) - 编程: Codeforces Elo 3206 分,排名人类第 23,首次追平 GPT-5.4 - Agent: SWE-Verified 80.6% (接近 Claude Opus 4.6 的 80.8%),Terminal Bench 2.0 67.9% (持平 GPT-5.4) - 中文: 功能性写作 62.7% 胜率优于 Gemini 3.1 Pro
API 更新
- 旧接口 deepseek-chat 和 deepseek-reasoner 将于 2026-07-24 停止使用
- 新模型支持 OpenAI ChatCompletions 接口与 Anthropic 接口
- 支持 reasoning_effort 参数调节思考强度 (high/max)
2026-04-18: 首次融资公开 — 估值 680 亿,融资 20 亿¶
- 估值: 680 亿人民币 — 在当前 AI 公司估值中相对保守
- 融资额: 20 亿人民币
- 梁文锋首次公开回应融资
- 信号: 低估值策略可能反映对长期研发投入的谨慎规划,也可能为后续融资留空间
2026-04-17: 技术更新 — Mega MoE + FP4 Indexer¶
- DeepSeek 悄悄上线技术更新
- Mega MoE: 扩展 MoE 架构规模
- FP4 Indexer: 4-bit 浮点精度索引器,降低推理成本
竞争格局¶
- vs Qwen (阿里): 开源生态竞争,Qwen3.5 MoE 3970 亿参数
- vs Claude (Anthropic): V4-Pro-Max 交付质量接近 Opus 4.6 非思考模式
- vs 豆包 (字节): 端侧和消费级场景竞争
- vs 国际闭源模型: 首次在 Codeforces 等硬核编程任务上追平 GPT-5.4
投资含义¶
- 跨平台战略: 华为 Ascend 验证成功 → 国产 AI 芯片 (华为/天数/寒武纪) 生态利好
- 成本效率: FP4 + Muon + 专家并行持续推低成本 → API 定价权增强
- 开源影响力: V4 百万上下文标配可能重新定义行业标准
- 估值重估: 680 亿估值 vs V4 技术突破 → 潜在估值修复空间
相关概念¶
- concepts/ai-model-release-cycle — 大模型发布周期
- concepts/ai-compute-economics — 算力经济学
- entities/NVDA — NVIDIA (CUDA 生态)
- entities/HUAWEI — 华为 (Ascend NPU)
更新日志¶
- 2026-04-25: V4 发布,百万上下文,Ascend 验证
- 2026-04-18: 融资信息首次公开
- 2026-04-17: Mega MoE + FP4 Indexer 技术更新