DeepSeek 技术报告与外部解读

← 中文导读 · ← 仓库首页(EN) · 版本梗概 · 演进总览 · Raschka V3→V3.2 解读

本目录存放 官方技术报告摘要第三方深度解读

文档类型说明
V1→V3 前代演进本地总览V1 → V2 → V3 前代演进
DeepSeek-LLM V1精读DeepSeek-LLM V1 完整中文译文(2401.02954;Figure 2–5 / Table 3–4)
版本演进总览本地总览全系列 V1→V4 算法线 + infra 线
算法线导读算法线导读MLA → DSA → CSA/HCA + mHC 专题 hub
基础设施线导读基础设施线导读MLA KV → 异构 Cache → Index Share → ESS → V4 HiSparse
MoE 线导读MoE 线导读稠密 FFN → DeepSeekMoE → aux-loss-free → Hash MoE
Raschka 要点速读梗概Raschka 一文要点速读
Raschka 全文解析全文解析分章整理 + 关键表格嵌入
如何评价 DeepSeek 发布 DSpark?哪些亮点值得关注?外部解读酱紫君(GalAster):DSpark、半自回归、验证截断、MTP、draft 训练
投机解码与 DSpark投机解码全集MTP、外挂 draft 自测、DSpark、MTP-1(唯一入口
投机解码自测加速比重定向已并入上表专文 §3
文档系列结构审查结构审查双向引用、章节导航、概念/SVG 复用审计

CI 门禁bash scripts/doc_series_gate.shcheck_svgs + build_book + FP8 导航 spot-check)

外部原文A Technical Tour of the DeepSeek Models from V3 to V3.2(Sebastian Raschka,2025-12-03,更新 2026-01-01)