From robot brains to robot bodies

编辑前言

第一期我们从 7 个主题的 13 篇精读开始——把"机器人怎么开始有脑子"这件事讲了一个开头。

第二期我们扩到 11 主题、156 篇笔记：

VLM 基座从 LLaVA 一篇扩到 21 篇（CLIP、BLIP、Flamingo、Qwen-VL、InternVL、DeepSeek-VL、Pixtral...）
VLA 主线从 1 篇扩到 16 篇（RT-1、RT-2、Octo、π0、π0.5、TinyVLA、SpatialVLA、DexVLA...）
新增 4 个主题：
- 扩散策略 / 流匹配（Diffusion Policy、3D Diffusion Policy、π0、π0-FAST、EquiBot...）
- 模仿学习与遥操作（ACT/ALOHA、Mobile ALOHA、UMI、HumanPlus、SmolVLA...）
- 数据集与评测（Open X-Embodiment、DROID、RoboCasa、LIBERO、SimplerEnv...）
- 仿真与 Sim2Real（Isaac Gym、Isaac Lab、Habitat、SAPIEN、ManiSkill、MuJoCo Playground...）

156 篇按 11 主题编排。每个主题里又按「祖师爷 → 现代经典 → 前沿延伸」排序——告诉你这篇是怎么从前面长出来的。

注：标 auto-summary-light 的笔记是基于摘要 + 公开资料整理的中等深度版本（约 250-350 行）；标 auto-summary 的是基于完整 PDF 整理的完整版本（约 350-500 行）。两种都标了诚实标签，不掩盖深度差异。

这一期的规模跃迁靠两件事：

架构重构 — build.mjs 从硬编码 13 篇改成扫 notes/*.md frontmatter 自动发现。每加一篇笔记不再需要改 build 一行。
MinerU + pdftotext — 替代 lr 后端额度限制，本机解析 PDF。

下一期可能聚焦：「2025 年最值得读的 20 篇 VLA」、「从 RT-1 到 Helix 的演化路径」、或「具身智能的硬件视角」。

整个站现在就是一份可持续生长的讨论手册——你写一篇，build 一次，搜索一秒。

◼ End of Issue Nº II.