回 Jason 主站·Embodied AI Reading Station
没主意?快捷入口
Learn · Beginner Track

FAQ — 新人常问 12 题

你刚来站这页能解决一半疑问。


关于这站

这站到底是什么?

156 篇具身智能顶会论文,每篇用零基础也能读懂的中文重写。每篇约 4000 字,中等读者 30 分钟读完一篇。

不是论文翻译。是把论文的核心思想拆成"日常类比 + 具体步骤 + 关键数字",用本科生能消化的语言重新组织。

谁做的?为什么?

一个本科生(Jason)在做实验室科研任务时建的。原任务是读 13 篇代表论文,扩展到 156 篇是因为发现单看 13 篇看不到全景。

完全个人项目,开源 GitHub,CC BY 4.0。

笔记里的内容靠谱吗?

每篇笔记都标注:

  • 来源:原 PDF 路径
  • 状态:deep-read(精读)/ auto-summary(自动摘要再校)
  • 难度:⭐ 数量

精读笔记是手动写的,自动摘要是 AI 辅助 + 人工核验。如果发现错误请提 issue。

为什么不直接看英文原文?

可以。但读 156 篇英文论文要 100+ 小时。这站把入门门槛降到 1/3。读完这站再回去看英文原文,会快很多——你已经知道每篇在干啥了。

关于具身 AI

什么是"具身智能"?跟 ChatGPT 区别?

具身智能(Embodied AI) = 让 AI 进入有身体的智能体——机器人 / 虚拟代理。

ChatGPT 是大脑悬浮在云端,输入是文字、输出是文字。具身 AI 必须:

  • 用摄像头看见世界
  • 听懂自然语言指令
  • 决定下一步动作
  • 用机械臂或腿执行

简单说:ChatGPT 不能去厨房热一杯牛奶;具身 AI 在尝试。

VLM、VLA、LLM 关系是什么?

LLM (语言模型)          → 能聊天
   ↓ + 视觉
VLM (视觉语言模型)       → 能看图聊天
   ↓ + 动作
VLA (视觉-语言-动作)     → 能看图、听话、出动作

每一层都建在下一层之上。这站 Week 1 把 LLM→VLM 讲清楚,Week 2 把 VLM→VLA 讲清楚。详见 /learn/path/

我没数学基础,能读吗?

可以。但有几个小符号你得查:

  • $\sum$ 求和("加起来")
  • $\arg\max$ "让函数最大的那个值"
  • $\nabla_\theta$ 梯度("最陡峭的方向")
  • $\mathbb{E}[\cdot]$ 期望("平均下来是多少")

完整查询表:/learn/math-primer/

读笔记时遇到不认识的符号,去查一下,回来继续读。三天以后这些符号你就熟了。

Python 要会到什么程度?

会基础就够:变量 / 列表 / 函数 / 类。

不需要会 PyTorch 或 TensorFlow——除非你要复现论文。看懂笔记不需要写代码。

这站讲的论文我能复现吗?

90% 不能。原因:

  • 数据集动辄几百 GB
  • 训练要 8 张 A100 跑几天
  • 真机器人买不起

但你能:

  • 跑论文官方给的 demo(如果开源)
  • 在 Habitat / Isaac Gym 仿真器里训小 demo
  • 微调已有的 VLA(OpenVLA / SmolVLA)

怎么读

156 篇是不是太多?

是。所以站点提供了多个入口:

  • /learn/path/ — 30 天 30 篇路径
  • /lists/ — 5 套主题精选包(50-90 分钟一包)
  • /topics/ — 11 个主题各看 primer 入门 3 篇

不要一次读 156 篇。挑一条路径走。

应该按什么顺序读?

learning path 的顺序。不要从首页随机点。前置依赖是真的——如果不先读 CLIP 直接读 RT-2,你会卡住。

一篇要花多久?

中等读者 4000 字 / 30 分钟。难篇可能 50-60 分钟(带公式推导那种)。每篇页面右上角有 "X min read" 是基于 250 字/分钟估算的。

为什么有些论文笔记很短?

那些是 auto-summary(自动摘要再校),约 1500-2500 字。给读者一个快速 overview,深度不如手动 deep-read。可以靠 ⭐ 数量和 "状态" 字段判断。

读完一篇怎么标记?

点论文页右上角"标记已读"按钮。或者读到底部 ◼ 自动触发标记 + olive toast 提示。

首页 stats 里 "你已读 N / 156" 会自动更新;连续天数 streak 🔥 也会启动。

卡住了怎么办?

按这个顺序:

  1. 看那一节的人话翻译(公式后面通常有)
  2. /glossary//learn/math-primer/
  3. 跳过这一节继续读,回头再补
  4. 还卡的话,去同主题更早一篇笔记看看(/topics// 上有 era 排序)

反馈

GitHub issue:estelledc/embodied-ai-reading-station

笔记错误、想加论文、想改风格都欢迎提。


◼ End of FAQ.


Other beginner pages