回 Jason 主站·Embodied AI Reading Station
没主意?快捷入口
Colophon · 这站是怎么诞生的

About this reading station

Typewriter at a wooden desk — colophon illustration
156论文笔记
551,187总字数
1git commits
2011–2025年份跨度

这站是为想读懂顶会论文、但还在入门阶段的人做的。具身智能(Embodied AI)讲的是「怎么让机器人有身体地融入世界」——它要看见、要听见、要听懂指令、要决定下一步怎么做。听起来像科幻,但 2024-2025 已经在论文里跑通了一大半。

项目源于一个本科生科研任务:实验室给了 13 篇代表论文,覆盖 7 个主题。我把它们重写成能读懂的版本——保留所有数字和方法,但用基础的类比解释每个新词。

七个主题是这样:

  • I. VLM Foundation — 视觉与语言对齐的基座模型
  • II. High-Level Planning — 让 LLM 输出"做得到"的指令
  • III. End-to-End VLA — 直接从图像 + 指令生成动作
  • IV. Multimodal Ecology — 语音、触觉、3D 等更多输入
  • V. Video World Model Policy — 用视频生成模型当机器人策略
  • VI. RF Perception & Mapping — 用毫米波雷达"看穿"墙和遮挡
  • VII. Auditory & Acoustic — 让设备在嘈杂环境中听清

Open data

站点数据全部以 JSON 公开,CC BY 4.0 协议。如果你想做二次分析、可视化或 LLM 训练数据:

Workflow

  1. lr pdf bundle paper.pdf — 把 PDF 转成带图 markdown
  2. notes/<slug>.md — 用统一模板写精读笔记
  3. node site/scripts/build.mjs — 期刊风 HTML 渲染
  4. GitHub Actions → GitHub Pages — 部署

Visual reference

视觉风格借鉴 open-design 的两个 design system:atelier-zero(暖纸 + 珊瑚红 + 罗马数字章节 + 三族字体混排)+ warm-editorial(GT Sectra serif + 长读节奏)。色板和字体规则严格按 DESIGN.md 提供的 token 实现。

Stack

  • Pure HTML + CSS, no framework — 156 张静态页面
  • Markdown → HTML via marked + gray-matter
  • Build script: site/scripts/build.mjs 单文件 ~2400 行 Node
  • 搜索: Pagefind 全文索引
  • 数学: KaTeX CDN
  • 可视化: D3.js v7(force-directed graph)
  • PWA: 自定义 service worker 离线缓存
  • 部署: GitHub Pages + Actions(每 push 自动 build → healthcheck → deploy)

Colophon

设计参照:open-designatelier-zero design system。

  • 字体:Inter Tight(正文 sans)/ Playfair Display(display italic)/ JetBrains Mono(mono)— 全部 Google Fonts
  • 颜色:暖纸 ivory #efe7d2 / 珊瑚红 #ed6f5c / 芥末黄 #e9b94a / 橄榄 #6e7448 / 墨色 #15140f
  • 图标记法:罗马数字章节(I-XI)/ Plate Nº 编号 / 章节末尾 ◼

AI 工具

这站建成借助了几个 AI 工具:

  • Claude Code:主要的代码生成 + 笔记重写工具
  • Codex CLI:298+ 张内嵌图片生成(场景图 + 方法图,全部 16:9 webp)
  • MinerU + pdftotext:PDF → markdown 解析
  • lr (LightRead):arXiv 检索 + PDF bundle 工具

所有 AI 输出都经过手动校对。错误归人不归 AI。

dist 体积分布

73.7 MB

Images (webp/jpg)
71.5 MB
HTML pages
1.9 MB
JS / CSS
0.2 MB
Data (JSON/CSV/XML)
0.2 MB
Other
0.0 MB

License

  • 笔记内容: CC BY 4.0 — 引用请保留作者名
  • 站点代码: MIT
  • 原论文 PDF + 论文 figure 图: 版权归原作者,本站只作学习摘要
  • codex 生成图片: CC BY 4.0(同笔记)

Contact / 反馈

有几种方式联系:

  • 笔记错误 / 想加论文 / 想改风格GitHub issue
  • 修正建议(你是原作者):同上 issue 或 PR;引用论文 slug 即可
  • 讨论 / 想法GitHub Discussions

这是个人项目,不保证回复速度。但每个 issue 都会读。

Cite this site

整站作为参考资料引用:

@online{embodied_ai_reading_station_2026,
  title       = {Embodied AI Reading Station},
  author      = {Zhou, Jason},
  year        = {2026},
  howpublished = {\url{https://estelledc.github.io/embodied-ai-reading-station/}},
  note        = {156 readable Chinese notes on embodied AI papers}
}

单篇引用请用论文页底部的 BibTeX 块。