FAQ — 新人常问 12 题
你刚来站这页能解决一半疑问。
关于这站
这站到底是什么?
156 篇具身智能顶会论文,每篇用零基础也能读懂的中文重写。每篇约 4000 字,中等读者 30 分钟读完一篇。
不是论文翻译。是把论文的核心思想拆成"日常类比 + 具体步骤 + 关键数字",用本科生能消化的语言重新组织。
谁做的?为什么?
一个本科生(Jason)在做实验室科研任务时建的。原任务是读 13 篇代表论文,扩展到 156 篇是因为发现单看 13 篇看不到全景。
完全个人项目,开源 GitHub,CC BY 4.0。
笔记里的内容靠谱吗?
每篇笔记都标注:
- 来源:原 PDF 路径
- 状态:deep-read(精读)/ auto-summary(自动摘要再校)
- 难度:⭐ 数量
精读笔记是手动写的,自动摘要是 AI 辅助 + 人工核验。如果发现错误请提 issue。
为什么不直接看英文原文?
可以。但读 156 篇英文论文要 100+ 小时。这站把入门门槛降到 1/3。读完这站再回去看英文原文,会快很多——你已经知道每篇在干啥了。
关于具身 AI
什么是"具身智能"?跟 ChatGPT 区别?
具身智能(Embodied AI) = 让 AI 进入有身体的智能体——机器人 / 虚拟代理。
ChatGPT 是大脑悬浮在云端,输入是文字、输出是文字。具身 AI 必须:
- 用摄像头看见世界
- 听懂自然语言指令
- 决定下一步动作
- 用机械臂或腿执行
简单说:ChatGPT 不能去厨房热一杯牛奶;具身 AI 在尝试。
VLM、VLA、LLM 关系是什么?
LLM (语言模型) → 能聊天
↓ + 视觉
VLM (视觉语言模型) → 能看图聊天
↓ + 动作
VLA (视觉-语言-动作) → 能看图、听话、出动作
每一层都建在下一层之上。这站 Week 1 把 LLM→VLM 讲清楚,Week 2 把 VLM→VLA 讲清楚。详见 /learn/path/。
我没数学基础,能读吗?
可以。但有几个小符号你得查:
- $\sum$ 求和("加起来")
- $\arg\max$ "让函数最大的那个值"
- $\nabla_\theta$ 梯度("最陡峭的方向")
- $\mathbb{E}[\cdot]$ 期望("平均下来是多少")
完整查询表:/learn/math-primer/。
读笔记时遇到不认识的符号,去查一下,回来继续读。三天以后这些符号你就熟了。
Python 要会到什么程度?
会基础就够:变量 / 列表 / 函数 / 类。
不需要会 PyTorch 或 TensorFlow——除非你要复现论文。看懂笔记不需要写代码。
这站讲的论文我能复现吗?
90% 不能。原因:
- 数据集动辄几百 GB
- 训练要 8 张 A100 跑几天
- 真机器人买不起
但你能:
- 跑论文官方给的 demo(如果开源)
- 在 Habitat / Isaac Gym 仿真器里训小 demo
- 微调已有的 VLA(OpenVLA / SmolVLA)
怎么读
156 篇是不是太多?
是。所以站点提供了多个入口:
- /learn/path/ — 30 天 30 篇路径
- /lists/ — 5 套主题精选包(50-90 分钟一包)
- /topics/ — 11 个主题各看 primer 入门 3 篇
不要一次读 156 篇。挑一条路径走。
应该按什么顺序读?
按 learning path 的顺序。不要从首页随机点。前置依赖是真的——如果不先读 CLIP 直接读 RT-2,你会卡住。
一篇要花多久?
中等读者 4000 字 / 30 分钟。难篇可能 50-60 分钟(带公式推导那种)。每篇页面右上角有 "X min read" 是基于 250 字/分钟估算的。
为什么有些论文笔记很短?
那些是 auto-summary(自动摘要再校),约 1500-2500 字。给读者一个快速 overview,深度不如手动 deep-read。可以靠 ⭐ 数量和 "状态" 字段判断。
读完一篇怎么标记?
点论文页右上角"标记已读"按钮。或者读到底部 ◼ 自动触发标记 + olive toast 提示。
首页 stats 里 "你已读 N / 156" 会自动更新;连续天数 streak 🔥 也会启动。
卡住了怎么办?
按这个顺序:
- 看那一节的人话翻译(公式后面通常有)
- 查 /glossary/ 或 /learn/math-primer/
- 跳过这一节继续读,回头再补
- 还卡的话,去同主题更早一篇笔记看看(/topics/
/ 上有 era 排序)
反馈
GitHub issue:estelledc/embodied-ai-reading-station
笔记错误、想加论文、想改风格都欢迎提。
◼ End of FAQ.