DDIA 读书笔记：数据密集型应用系统设计

发表于 2025-12-28 分类于读书笔记

Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

这是一份关于《数据密集型应用系统设计》(DDIA) 的完整读书笔记，本书被誉为”数据系统领域的圣经”。

书籍信息

项目	内容
书名	Designing Data-Intensive Applications (DDIA)
中文名	数据密集型应用系统设计
作者	Martin Kleppmann（剑桥大学分布式系统研究员）
出版时间	2017年3月

本书围绕三个核心概念展开：

查看详细笔记

章节	核心内容
第1章	可靠性、可扩展性、可维护性的定义与实践
第2章	关系模型、文档模型、图模型的对比与选择
第3章	存储引擎原理：B-Tree、LSM-Tree、OLTP vs OLAP
第4章	数据编码格式与模式演化：JSON、Protobuf、Avro

查看详细笔记

查看详细笔记

第1章 → 第2章 → 第3章 → 第4章（建立基础）
    ↓
第5章 → 第6章（理解分布式基础）
    ↓
第10章 → 第11章（了解数据处理）

第7章 → 第8章 → 第9章（深入分布式）
    ↓
第12章（展望未来）
    ↓
回顾第1-4章填补知识空白

关系模型 ──── 结构化数据、复杂查询、事务支持
     ↓
文档模型 ──── 灵活模式、树状结构、局部性好
     ↓
图模型 ───── 复杂关系、社交网络、知识图谱

$定理：网络分区时，一致性与可用性不可兼得$

范式	数据特性	延迟	典型框架
批处理	有界、静态	分钟~小时	Spark, Hadoop
流处理	无界、持续	毫秒~秒	Flink, Kafka Streams

本读书笔记整理于 2025年，基于 DDIA 第一版内容编写