DeepSeek 技术报告与外部解读
← 中文导读 · ← 仓库首页(EN) · 版本梗概 · 演进总览 · Raschka V3→V3.2 解读
本目录存放 官方技术报告摘要 与 第三方深度解读。
| 文档 | 类型 | 说明 |
|---|---|---|
| V1→V3 前代演进 | 本地总览 | V1 → V2 → V3 前代演进 |
| DeepSeek-LLM V1 | 精读 | DeepSeek-LLM V1 完整中文译文(2401.02954;Figure 2–5 / Table 3–4) |
| 版本演进总览 | 本地总览 | 全系列 V1→V4 算法线 + infra 线 |
| 算法线导读 | 算法线导读 | MLA → DSA → CSA/HCA + mHC 专题 hub |
| 基础设施线导读 | 基础设施线导读 | MLA KV → 异构 Cache → Index Share → ESS → V4 HiSparse |
| MoE 线导读 | MoE 线导读 | 稠密 FFN → DeepSeekMoE → aux-loss-free → Hash MoE |
| Raschka 要点速读 | 梗概 | Raschka 一文要点速读 |
| Raschka 全文解析 | 全文解析 | 分章整理 + 关键表格嵌入 |
| 如何评价 DeepSeek 发布 DSpark?哪些亮点值得关注? | 外部解读 | 酱紫君(GalAster):DSpark、半自回归、验证截断、MTP、draft 训练 |
| 投机解码与 DSpark | 投机解码全集 | MTP、外挂 draft 自测、DSpark、MTP-1(唯一入口) |
| 投机解码自测加速比 | 重定向 | 已并入上表专文 §3 |
| 文档系列结构审查 | 结构审查 | 双向引用、章节导航、概念/SVG 复用审计 |
CI 门禁:bash scripts/doc_series_gate.sh(check_svgs + build_book + FP8 导航 spot-check)
外部原文:A Technical Tour of the DeepSeek Models from V3 to V3.2(Sebastian Raschka,2025-12-03,更新 2026-01-01)