Learn · Beginner Track

FAQ — 新人常问 12 题

你刚来站这页能解决一半疑问。

关于这站

这站到底是什么？

156 篇具身智能顶会论文，每篇用零基础也能读懂的中文重写。每篇约 4000 字，中等读者 30 分钟读完一篇。

不是论文翻译。是把论文的核心思想拆成"日常类比 + 具体步骤 + 关键数字"，用本科生能消化的语言重新组织。

谁做的？为什么？

一个本科生（Jason）在做实验室科研任务时建的。原任务是读 13 篇代表论文，扩展到 156 篇是因为发现单看 13 篇看不到全景。

完全个人项目，开源 GitHub，CC BY 4.0。

笔记里的内容靠谱吗？

每篇笔记都标注：

来源：原 PDF 路径
状态：deep-read（精读）/ auto-summary（自动摘要再校）
难度：⭐ 数量

精读笔记是手动写的，自动摘要是 AI 辅助 + 人工核验。如果发现错误请提 issue。

为什么不直接看英文原文？

可以。但读 156 篇英文论文要 100+ 小时。这站把入门门槛降到 1/3。读完这站再回去看英文原文，会快很多——你已经知道每篇在干啥了。

关于具身 AI

什么是"具身智能"？跟 ChatGPT 区别？

具身智能（Embodied AI） = 让 AI 进入有身体的智能体——机器人 / 虚拟代理。

ChatGPT 是大脑悬浮在云端，输入是文字、输出是文字。具身 AI 必须：

用摄像头看见世界
听懂自然语言指令
决定下一步动作
用机械臂或腿执行

简单说：ChatGPT 不能去厨房热一杯牛奶；具身 AI 在尝试。

VLM、VLA、LLM 关系是什么？

LLM (语言模型)          → 能聊天
   ↓ + 视觉
VLM (视觉语言模型)       → 能看图聊天
   ↓ + 动作
VLA (视觉-语言-动作)     → 能看图、听话、出动作

每一层都建在下一层之上。这站 Week 1 把 LLM→VLM 讲清楚，Week 2 把 VLM→VLA 讲清楚。详见 /learn/path/。

我没数学基础，能读吗？

可以。但有几个小符号你得查：

$\sum$ 求和（"加起来"）
$\arg\max$ "让函数最大的那个值"
$\nabla_\theta$ 梯度（"最陡峭的方向"）
$\mathbb{E}[\cdot]$ 期望（"平均下来是多少"）

完整查询表：/learn/math-primer/。

读笔记时遇到不认识的符号，去查一下，回来继续读。三天以后这些符号你就熟了。

Python 要会到什么程度？

会基础就够：变量 / 列表 / 函数 / 类。

不需要会 PyTorch 或 TensorFlow——除非你要复现论文。看懂笔记不需要写代码。

这站讲的论文我能复现吗？

90% 不能。原因：

数据集动辄几百 GB
训练要 8 张 A100 跑几天
真机器人买不起

但你能：

跑论文官方给的 demo（如果开源）
在 Habitat / Isaac Gym 仿真器里训小 demo
微调已有的 VLA（OpenVLA / SmolVLA）

怎么读

156 篇是不是太多？

是。所以站点提供了多个入口：

/learn/path/ — 30 天 30 篇路径
/lists/ — 5 套主题精选包（50-90 分钟一包）
/topics/ — 11 个主题各看 primer 入门 3 篇

不要一次读 156 篇。挑一条路径走。

应该按什么顺序读？

按 learning path 的顺序。不要从首页随机点。前置依赖是真的——如果不先读 CLIP 直接读 RT-2，你会卡住。

一篇要花多久？

中等读者 4000 字 / 30 分钟。难篇可能 50-60 分钟（带公式推导那种）。每篇页面右上角有 "X min read" 是基于 250 字/分钟估算的。

为什么有些论文笔记很短？

那些是 auto-summary（自动摘要再校），约 1500-2500 字。给读者一个快速 overview，深度不如手动 deep-read。可以靠 ⭐ 数量和 "状态" 字段判断。

读完一篇怎么标记？

点论文页右上角"标记已读"按钮。或者读到底部 ◼ 自动触发标记 + olive toast 提示。

首页 stats 里 "你已读 N / 156" 会自动更新；连续天数 streak 🔥 也会启动。

卡住了怎么办？

按这个顺序：

看那一节的人话翻译（公式后面通常有）
查 /glossary/ 或 /learn/math-primer/
跳过这一节继续读，回头再补
还卡的话，去同主题更早一篇笔记看看（/topics// 上有 era 排序）

反馈

GitHub issue：estelledc/embodied-ai-reading-station

笔记错误、想加论文、想改风格都欢迎提。

◼ End of FAQ.

Other beginner pages