培养计划
本页是路径说明。具体笔记见左侧分组;当前规模 1500+ 篇(论文 785 + 项目 726)。
1. 路径模型的演化
最初这里写的是”6 个月 / 4 个 phase / 20 篇代表项目”的线性路线图。
随着笔记数过千、主题跨度从 PL 到分布式到 AI Agent 全部展开,线性路线已经不够用。当前模型是:
- 主题树:每个一级主题下沉到经典论文 / 关键项目,论文与项目交叉引用
- 横向对比:同一问题在不同系统里的解法摆在一起读(例如共识算法 Paxos vs Raft,类型推断 HM vs Bidirectional)
- 反向链接驱动:枢纽节点(被反向引最多的)就是该主题的”必经之地”
- 不追求闭环:路径是常态打开的,写新笔记时回头补旧主题树是常事
线性路线退役不等于目标变了。目标画像见 §2,主题树见 §3。
2. 目标画像:AI 时代的产品工程师
不是”前端工程师”也不是”AI 工程师”,是:
| 维度 | 期望状态 |
|---|---|
| 全栈基础 | 前后端独立做完整功能;新框架一周上手 |
| AI 工具链 | Claude API / Agent 框架是日常工具 |
| 产品判断力 | 看穿一行需求背后的真实痛点;会拒绝伪需求 |
| 系统视野 | 共识 / 存储 / 编译 / 类型 / 调度 都有可解释的模型 |
| 工程品味 | 代码可维护、架构有 trade-off 意识、愿意删代码 |
| 自学能力 | 看陌生代码库不发怵;能从大型 OSS 中拎可迁移模式 |
不追的:
- 不为了用框架而用框架
- 不背面试题
- 不卷工时(输出质量 > 时长)
3. 主题树(按反向链接密度排序)
每个一级主题列:枢纽节点 + 数量级。枢纽节点是当前笔记网络中被反向引最多的节点,新读相关材料先在它附近找位置。
3.1 编程语言与类型理论(76 篇笔记)
枢纽:hindley-milner(126 反向引,全站最高) · lambda-calculus(64) · hoare-logic(63)
为什么这条线最密:HM 是 TS / Rust / Swift / Haskell 类型系统的共同祖先;λ 演算是 PL 理论起点;Hoare 逻辑跨 PL 与形式化方法两条线。
横向对比线索:HM vs Bidirectional Typing;Effect Systems vs Monads;Substructural Types(Rust 借用)vs GC。
3.2 分布式系统(76 篇笔记 + 近 30 天 47 个 commit)
枢纽:paxos-1998(67) · raft(63) · lamport-1978(56) · spanner-2012(48)
横向对比线索:Paxos vs Raft(可工程化差距);Lamport Clock vs Vector Clock vs HLC;2PC vs Paxos Commit;Spanner TrueTime vs CockroachDB HLC。
3.3 数据库(47 篇)
枢纽:postgresql(66,drizzle / prisma / postgres-js 都反向引)· bigtable-2006(46)· aries-1992
横向对比线索:B-Tree vs LSM;Aries 恢复 vs WAL-only;列存 Bigtable / Parquet vs 行存 Postgres;MVCC 实现差异。
3.4 操作系统(46 篇)
侧重虚拟化、调度、文件系统几条主线。横向对比:进程模型 vs 协程 vs Actor;Page Cache vs Buffer Pool;Cgroup vs Jail。
3.5 机器学习与 AI Agent(44 + 24 篇)
枢纽:attention(103,所有 LLM / NLP 笔记的根) · bert(42) · pytorch(67,框架枢纽)
横向对比线索:RNN / Attention / Mamba 序列建模代际;Pre-training Objectives(MLM / CLM / Span);Agent 架构(ReAct / Plan-Execute / Self-Evolving)。近 30 天 self-evolving agents 新增 10+ 篇,是当前活跃前沿。
3.6 基础设施(38 篇 + 近 30 天 444 commit,最热)
枢纽:kubernetes(66,跨容器 / 调度 / 网络多主题)· LLVM / IR 在编译器线(llvm 50 反向引)
横向对比:Kubernetes vs Nomad;Docker vs containerd vs CRI-O;CNI / CSI / CRI 三大插件接口设计哲学。
3.7 形式化方法(27 篇)
枢纽:hoare-logic(63)。线索:Hoare / Separation Logic / TLA+ / Coq;与 PL 类型系统线在 Curry-Howard 处汇合。
3.8 图形学(36 篇)
枢纽:3d-gaussian-splatting(41)。线索:光栅化 vs 光线追踪 vs Splatting;NeRF / Gaussian / SDF 三代神经渲染。
3.9 前端工程(项目侧)
枢纽:react(68,前端门面,Lexical / Next / Radix 全部反向引)
横向对比:React vs Solid vs Svelte 响应式模型;CSR / SSR / RSC;headless(Radix / TanStack)vs 一体化(MUI)。
3.10 其他活跃主题
- 编程语言(项目侧 76 篇):TS / Rust / Go / Zig / Swift 实现侧
- 编译器(11 篇 + 近 30 天 72 commit):LLVM / Cranelift / V8 等
- 区块链(44 篇):BTC / ETH / 共识 / ZK
- 网络协议(37 篇):TCP / QUIC / HTTP/3 / gRPC
- 信息检索(25 篇):倒排索引 / 向量检索 / RAG
4. 学习节奏(不再以”phase”组织)
工作流:
- 遇到具体问题或好奇点 → 在主题树里找最近的枢纽节点
- 读时同时反向回填上游(祖宗论文 / 基础概念)和横向对比(同问题别的解法)
- 写笔记时强制建立反向链接(pre-commit hook 拦截孤儿页)
- 每周回看新建节点是否被引;长期没被引的要么是冷门要么是没消化好
不再追求”按 phase 顺序读完”。任何时候都可以同时在多条线推进。
5. 当前优势与短板
强项(截至当前 1500+ 篇规模):
- 编程语言与类型理论:完整覆盖 HM / λ / Hoare 链
- 分布式共识:Paxos / Raft / Lamport 主线齐全
- AI Agent 基础设施:MCP / Claude Code / parallel agents / self-evolving 在跟前沿
- 编译器与基础设施:近 30 天最热(444 + 72 commit)
短板:
- 数据库恢复与并发控制(Aries 之外的现代实现纵深不够)
- 网络协议握手与拥塞控制细节
- 形式化方法工具链实操(TLA+ / Coq 写过几个但没沉淀)
- 真实产品工程闭环(知道概念但缺端到端跑通的项目)
6. 工件边界
| 想做 | 去哪 |
|---|---|
| 看下一个研究目标 | 推荐队列 |
| 看主题统计 | 概览 |
| 看活跃链接 | hot |
| 看缺口与矛盾 | issues |
具体笔记从左侧分组进,或在主题树里点枢纽节点。