跳转到内容

分布式系统阅读站

专题一句话:多台机器假装是一台——从 Lamport 时钟到 Raft 共识,再到 Spanner 全球 SQL 与 CRDT 协同编辑。
候选池:仓库 research/papers-distributed-systems.md

统计

维度数量
已写论文75
候选(深化)60(大多已落站)

← 返回专题阅读站 · 论文全景 · 分布式


专题导读

分布式系统的阅读顺序不是按年份,而是按依赖链

  1. 先接受「没有全局时钟」
  2. 再理解「共识为什么难」
  3. 然后看工业界怎么在可用性与一致性间取舍
  4. 最后补上可观测性、最终一致与协同编辑

阅读路线图

阶段 0 · 时间与不可能(入门,4 篇)

顺序论文难度读完你会
1lamport-1978初级逻辑时钟;「先发生」关系
2byzantine-generals-1982中级拜占庭容错问题表述
3flp-1985高级异步共识不可能性
4sequential-consistency-1979中级一致性模型谱系起点

阶段 1 · 共识经典(中级,6 篇)

顺序论文难度读完你会
5paxos中级分布式共识标准答案
6raft初级可读的共识实现
7vr-revisited-2012中级Viewstamped Replication 现代版
8fast-paxos-2006高级Paxos 快路径
9epaxos-2013高级无 leader 并行 commit
10hotstuff-2019高级现代 BFT 共识(区块链邻域)

阶段 2 · 工业复制与协调(中级,6 篇)

顺序论文难度读完你会
11chubby中级Google 分布式锁 / 选主
12spanner高级全球 TrueTime + SQL
13dynamo中级最终一致 KV;可用性优先
14megastore-2011高级实体组 + Paxos
15chain-replication-2004中级链式复制;高吞吐线性化
16pbft-1999高级实用拜占庭容错

阶段 3 · 大数据存储与计算(中级,5 篇)

顺序论文难度读完你会
17gfs中级Google 分布式文件系统
18mapreduce初级批处理编程模型
19consistent-hashing-1997初级DHT 与缓存分布
20crdt-json中级JSON CRDT 工程化
21crdt-shapiro-2011高级CRDT 理论与分类

阶段 4 · CAP、事务与协同(中级→高级,6 篇)

顺序论文难度读完你会
22brewer-cap-2000初级CAP 直觉
23cap-12-years-later-2012中级CAP 再审视
24vogels-eventual-2009初级最终一致工程实践
25saga-1987中级长事务补偿
26gray-1978-notes高级2PC 起源
27linearizability-1990高级线性一致性形式化

阶段 5 · 可观测性与运维(中级,4 篇)

顺序论文难度读完你会
28dapper-2010中级分布式链路追踪
29chandy-lamport-1985高级分布式快照
30xtrace-2007高级黑盒故障诊断
31lampson-hints初级系统设计原则(跨专题)

已写论文精选(按子类)

共识与复制

paxos · raft · vr-1988 · vr-revisited-2012 · fast-paxos-2006 · mencius-2008 · epaxos-2013 · flexible-paxos-2016 · chain-replication-2004 · craq-2009 · tendermint-2016 · hotstuff-2019

存储与协调

chubby · spanner · dynamo · gfs · megastore-2011 · borg · borg-omega-kube-2016

CRDT 与协同

crdt-shapiro-2011 · crdt-sss-2011 · crdt-json · crdt-json-2017 · ot-1989 · jupiter-1995 · logoot-2010

时钟与一致性

lamport-1978 · hlc-2014 · fidge-1988 · mattern-1989 · gilbert-lynch-2002

可观测性与追踪

dapper-2010 · xtrace-2007 · pivot-tracing-2015

完整 75 篇见 论文全景 · 分布式系统


待写候选(深化专题)

候选表 60 篇多数已有对应站点笔记。以下为 research 表标注、尚未单独成篇或需深化的条目。

slug论文状态
skeen-3pc-19813PC 与阻塞分析待核对
presumed-abort-19862PC 优化待核对
craq-2009Chain Replication 读优化✅ 在站

维护时以 research/papers-distributed-systems.md 与 atlas diff 为准。


关联项目

项目角色
kafka日志型消息 / 流处理
etcdK8s 元数据;Raft 工业实现
helmK8s 应用打包与发布
prometheusPull 模型监控 + PromQL
containerd节点容器运行时
tensorflow分布式训练(数据并行邻域)
pytorch现代训练栈
ray分布式 Python / ML 任务

数据库交叉:spanner数据库专题cockroachdb-2020 · tidb-2020 对照读。


里程碑

里程碑目标状态
M1 共识可读阶段 0–1 十篇在站
M2 工业三连chubby / spanner / dynamo
M3 全库覆盖75 篇一级主题「分布式系统」
M4 深化候选research 表 60 篇与站点 slug 对齐审计🔄
M5 形式化交叉disel-2018(形式化方法)

阅读路径图

lamport-1978(时钟)
flp / byzantine(不可能)
paxos → raft → vr-revisited(共识三代)
chubby / spanner / dynamo(工业三角)
gfs / mapreduce(大数据栈)
crdt / eventual(放松一致)
dapper(可观测性闭环)