回 Jason 主站·Embodied AI Reading Station
没主意?快捷入口
Learn · Beginner Track

社区 / 持续追踪

论文是慢车,社区是快车 — 入门读者每天 5 分钟、每周 30 分钟、每月 1 小时怎么跟

社区 / 持续追踪

论文像教材,几个月才出一版;社区像同学群,每天都在聊新八卦。 这一页告诉你:作为一个读者,时间宝贵,每天该看什么、不该看什么。

先说一句最重要的:不要一上来就订阅 30 个公众号。 你会被淹没,然后什么都没看。 正确做法 = 每天 5 分钟 + 每周 30 分钟 + 每月 1-2 小时,三档之外全部砍掉。


1. 先讲清楚几个新词

下面后面会反复用到,先用初高中熟悉的东西打个比方:

顶会(Top Conference):这个领域里最厉害的"年度学术擂台"。每年只录一小部分论文,类似高考全省前 1%。 PI(Principal Investigator,导师 / 教授):实验室的"班主任 + 总教练",决定研究方向、带学生发论文。 arxiv(音"archive"):一个免费论文仓库,相当于"作业还没交老师就先贴到学校公告栏"——没经过同行评审,但快。 预印本(preprint):放上 arxiv 还没正式发表的论文。 开源代码:作者把自己写的程序公开放到网上(一般在 GitHub),任何人都能下载、运行、改。 复现(reproduce):拿到别人的代码和数据,自己跑一遍,看能不能得到论文里那个结果。像"按菜谱炒一遍这道菜,看味道一样不一样"。 VLA(Vision-Language-Action):一类机器人模型的简称——输入"看到的画面 + 听到的指令",输出"手脚怎么动"。可以理解为"会看会听会动手的 AI"。 具身智能(Embodied AI):让 AI 拥有"身体",不只是在屏幕里聊天,而是能在真实世界里做事。比如机器人收拾桌子、自动驾驶。

读到这里你应该懂了:顶会、arxiv、开源、VLA、具身智能 这几个词后面再出现就不解释了。


2. 你每天看什么(≤ 5 分钟)

唯一目标:保持"这个领域今天大概出了什么大新闻"的手感。

只做一件事:

  • 打开手机,刷一下 机器之心 公众号 或 量子位 公众号
  • 只看标题,不点进去
  • 看到"机器人 / 具身 / 人形 / VLA / 大模型"的标题,心里记一下名字就行

为什么不深读?因为你刚上路,深读要留给周末。

公众号:微信里的内容订阅号。在微信"搜一搜"输入名字就能关注。

每天 3-5 分钟,跑完就走。别开知乎,会刷上瘾

读到这里你应该懂了:日更不是为了学,是为了不掉队。


3. 你每周看什么(30 分钟,挑周末一次性看完)

每周从下面 4 件事里挑 2 件 做(不是全做):

A. 看一篇 PaperWeekly 公众号的论文导读

  • 它专门做"把一篇论文翻译成人话"
  • 选标题里有"机器人 / 具身 / VLA / 多模态"的那篇
  • 看不懂没关系,你的目标是混个脸熟,不是当场学会

B. 看一个 B 站讲解视频

推荐这些 UP 主(搜名字即可):

UP 主类型 找谁 一句话
综合 AI 解读 跟李沐学 AI李宏毅 沐神是大佬亲自讲论文;李宏毅老师讲课最适合零基础
机器人 / 具身专题 在 B 站搜 "具身智能" "机器人大模型" 多是研究生录的组会汇报,10-30 分钟一段
入门数学 / 编程 3Blue1Brown 中文搬运StatQuest 中文 讲向量、矩阵、概率特别直观

B 站:bilibili.com,国内年轻人主要的视频学习平台。 搬运:把油管/外网视频加中文字幕重新发一遍。

C. 看一期播客(边走路边听)

  • 中文:「硅谷 101」「张小珺商业访谈」——常请国内具身创业者
  • 英文(练听力顺便学):The Robot Brains,主持人是 UC Berkeley 的 Pieter Abbeel 教授

D. 翻一下 HuggingFace Daily Papers

  • 网址:https://huggingface.co/papers
  • 它每天选 ~10 篇社区投票最高的论文,自带英文摘要
  • 你只看摘要的第一句话("What is this paper about?"),混眼熟

HuggingFace(抱抱脸):一个全球最大的 AI 模型 / 论文 / 代码社区,相当于"AI 界的 GitHub"。

读到这里你应该懂了:每周不是逼自己学完一篇论文,是让大脑对几个名字变熟。


4. 你每月看什么(1-2 小时,月底找一个下午)

每月做 1 件 事就够:

选项 A:扫一遍当月顶会的"标题列表"

  • 11 月:CoRL(机器人学习顶会)的接收论文列表
  • 6 月:CVPR(计算机视觉顶会)
  • 12 月:NeurIPS(机器学习顶会)

打开会议官网,只看论文标题。100 个标题里挑 3 个你眼熟的关键词的,记到笔记本。

接收论文列表(accepted papers):每年顶会公布的"今年录取了哪些论文"清单。

选项 B:看一个研究综述(survey paper)

  • 综述 = "这一年这个方向的总结报告",比单篇论文好读
  • 找综述:在 GitHub 搜 "Awesome LLM Robotics" 或 "Awesome Embodied AI"
  • 这种仓库会列出最近的好综述,挑一篇中文版(机器之心 / PaperWeekly 经常翻译)

GitHub:全球最大的代码仓库网站,可以理解成"程序员的网盘 + 朋友圈"。 Awesome 仓库:社区维护的"某主题最佳资源清单",约定俗成叫 "Awesome-XXX"。

选项 C:看一场公开讲座录像

  • B 站搜 "VALSE" — 国内最大计算机视觉学术沙龙,每年有具身专场
  • YouTube(需科学上网)搜 "Stanford AI Seminar" 或 "MIT CSAIL Robotics"

每场 60-90 分钟,1.5 倍速 + 跳过提问环节,1 小时搞定。

读到这里你应该懂了:每月只做一件事,宁少勿多。


5. 完全不必关注的(高中阶段先放下)

下面这些,你看到了也别花时间,等你上大学修过线性代数 / 概率论再说:

不必关注的 为什么
推特 / X 上的实时讨论 信噪比极低,90% 是吵架和广告,需要很强的"过滤能力"才能看出门道
arxiv 每日新论文列表 每天 100+ 篇,你看不完也读不懂,徒增焦虑
Discord / Slack 国际社群 全英文 + 时差 + 行业黑话,零基础进去会自闭
各种付费 newsletter 高中阶段免费的中文资源已经管够
模型源代码 现在还看不懂 Python,先打地基
各家发布会"哪个机器人最强" 营销 > 学术,看个热闹就行
论文里复杂的数学公式页 等你大学学会矩阵 / 偏导再回头看

判断原则:如果一篇内容里 80% 的词你都不认识,那它现在不是给你看的。 关掉,回到上面的"每周 30 分钟"清单。

读到这里你应该懂了:会取舍,比会学习更重要。


6. 国内学生友好的资源地图

中文公众号(每天最多看 2 个,超过就是浪费)

名称 频率 一句话
机器之心 每日 综合 AI 媒体,机器人栏目稳定更新
量子位 每日 同上,互补
PaperWeekly 每周几篇 论文导读偏深度,有具身专题
将门创投 TechBeat 每周 直播 + 论文解读
OpenRobotLab 不定期 上海 AI Lab 的具身分支官号,国内具身更新最频繁的之一

知乎专栏 / 答主(搜下面名字)

  • 跟李沐学 AI:B 站和知乎双平台,论文带读
  • 王鹤、高阳、卢策吾:国内具身一线教授,他们的学生在知乎答题
  • 机器之心 知乎机构号

B 站 UP 主(入门最友好的渠道)

  • 跟李沐学 AI李宏毅:基础课
  • 3Blue1Brown 中文搬运:数学直觉
  • 搜 "具身智能"、"机器人 大模型"、"VLA" 三个关键词,看播放量高的近期视频

微信群(暂时别加)

加群之前先问自己:"我能听懂他们在说什么吗?" 入门阶段先不要加技术群,潜水公众号留言区就够了。

读到这里你应该懂了:中文资源 > 英文资源;视频 > 文字;高质量少量 > 低质量大量。


7. 如果你 18 岁前想给具身智能领域留下一点声音

先泼冷水:发顶会论文几乎不可能(导师 / 算力 / 数学全缺),别想。 但是——下面这几件事,一个读者认真做完,质量足以让一个名校博士生看完点头:

难度 1 星:做一个可视化网页

  • 选一个具身智能里的小概念(比如"什么是模仿学习?")
  • 用图、动画、互动滑块讲清楚
  • 学一点 HTML / CSS / JS(B 站搜 "前端入门" 一周入门)
  • 部署到 GitHub Pages(免费),把链接发到知乎/B 站

类似参考:3Blue1Brown 的网页解释,或 Distill.pub 上的可视化论文。

难度 2 星:翻译一篇英文综述

  • 选一篇 30-50 页的具身智能综述(每月清单里能找到)
  • 用 ChatGPT / DeepSeek 当字典,自己一段段过
  • 每翻译完一节,写一段"我读这一段的理解"
  • 发到知乎专栏 / 自己的小红书 / GitHub

综述:把某个方向最近 5-10 年的进展整理成一篇"教科书章节"的论文,一般 30-100 页。

这件事特别有用

  1. 你的英文阅读会暴涨
  2. 中文社区缺这种东西,会被收藏转发
  3. 你写完会比 95% 的本科生更懂这个方向

难度 3 星:复现一篇论文的开源代码

  • 找一篇代码已经开源的具身论文(github 上有 ⭐ 数)
  • 在自己电脑或免费云算力(Google Colab / 阿里云学生礼包)上跑通
  • 写一份"我踩了 10 个坑"的复现笔记,发知乎或 GitHub
  • 加分项:把作者英文 README 翻译成中文 PR 给原仓库

PR(Pull Request):在 GitHub 上向别人的项目提交修改的标准动作,相当于"学生交作业给老师"。 开源仓库:作者把代码免费放出来的项目地址。

如果你的复现笔记或翻译被作者本人 merge(合并)进官方仓库,这就是你 18 岁前留下的真实贡献。 你能写进任何申请文书 / 面试 / 简历里,且大学教授看了会眼前一亮。

难度 4 星(极少数人能做到):发一篇博客被领域大佬转发

  • 选一个具身领域的"被忽视的小问题"(比如"为什么 VLA 模型大多用 7B 参数?")
  • 自己查 5-10 篇论文,写一篇 2000 字的中文博客,逻辑严密、有图、有引用
  • 发知乎 + B 站专栏 + 推特(中英双语)
  • 私信 / @ 几位国内导师(高阳 / 王鹤 / 卢策吾 课题组的学生),礼貌求转发

成功率很低,但成本也低,撞上一次就够你写进任何履历。

读到这里你应该懂了:入门读者不能拼学历,但可以拼"看得清+写得清+做得完"——这是大学之后越来越稀缺的能力。


8. 总结:你的 6 个月节奏表

阶段 做什么 不做什么
第 1 个月 关注 2 个中文公众号;高考冲刺优先 别学 Python,别看英文论文
第 2 个月 加上每周 1 个 B 站讲解视频 别建推特账号
第 3 个月 加上每周 1 期播客 别参加任何技术社群
第 4 个月 月底扫一次 HuggingFace Daily Papers 标题 别强迫自己读论文
第 5 个月 选一个"难度 1 星"的小项目动手做 别同时做两个
第 6 个月 把项目发出来,记录自己 6 个月的变化 别和同龄 AI 大牛比,比的是 6 个月前的自己

订阅是手段,不是目的。 信号密度 > 信源数量。少而精,比多而乱有用 100 倍。

读到这里你应该懂了:入门阶段,"保持手感 + 一个小项目"已经超越 99% 的同龄人了。


英文进阶 · 博客 / Newsletter / 播客

如果你的英文能读 paper abstract 没问题,下面这些是领域里持续输出"高信号噪比"的人。建议先订 1-2 个,习惯了再加。

一、博客 / Substack(适合"想沉下来读一篇")

1. Lil'Log — Lilian Weng 个人博客

  • 链接https://lilianweng.github.io/
  • 语言:英文
  • 频率:1-2 月一篇(频率低,但每篇都是综述级)
  • 难度:⭐⭐⭐⭐(数学密度高)
  • 一句话定位:前 OpenAI 安全研究负责人写的"教科书级"长文综述,每篇都是该子领域最佳入门读物。
  • 推荐时机:当某个概念(diffusion / agent / hallucination / RL)你想"一篇看穿"时。
  • 必读起点

2. Andrej Karpathy 的博客

  • 链接https://karpathy.github.io/
  • 语言:英文
  • 频率:极不稳定(半年-1 年一篇,但篇篇爆款)
  • 难度:⭐⭐⭐(写作非常平易,配图好)
  • 一句话定位:前特斯拉 AI 总监 / OpenAI 创始成员,他写的"软件 2.0"、"GPT 是怎么训练的"是入门界圣经。
  • 推荐时机:想理解 LLM 训练全栈、神经网络直觉建立时。
  • 配套:他 YouTube 上的 "Neural Networks: Zero to Hero" 系列是最好的从零到 GPT 的视频课程。

3. BAIR Blog — 伯克利 AI 研究博客

  • 链接https://bair.berkeley.edu/blog/
  • 语言:英文
  • 频率:每周 1-2 篇
  • 难度:⭐⭐⭐⭐(学术原文级)
  • 一句话定位:UC Berkeley AI Research 实验室官方博客,机器人 / RL / 具身智能领域的前沿一手内容(Sergey Levine / Pieter Abbeel / Chelsea Finn 都在这里发)。
  • 推荐时机:想看具身智能领域学术界本周在做什么时。这是具身方向最重要的博客

4. Sebastian Raschka 的博客 / Ahead of AI

5. The Gradient

  • 链接https://thegradient.pub/
  • 语言:英文
  • 频率:每月几篇(不固定)
  • 难度:⭐⭐⭐
  • 一句话定位:Stanford AI Lab 学生发起的非营利刊物,研究者用通俗语言写的长文 + 访谈。
  • 推荐时机:想读"研究者怎么思考"而非"论文摘要"时;配套有 The Gradient Podcast(Daniel Bashir 主持)。

6. Distill.pub(已停更,但仍是宝藏)

  • 链接https://distill.pub/
  • 语言:英文
  • 状态:2021-07 起永久 hiatus,但全部存档可读
  • 难度:⭐⭐(交互式可视化降低门槛)
  • 一句话定位:交互式机器学习论文,把"注意力机制""特征可视化"这种抽象概念做成可拖动的动画。视觉化教学的天花板。
  • 推荐时机:当你在某个概念(attention / 特征可视化 / 神经网络几何)卡壳时。

7. Yann LeCun / World Model 阵营专文

具身智能要追"世界模型"路线,必读的 3 篇:

  • A Path Towards Autonomous Machine Intelligence(LeCun 2022 立场论文,2025 年仍在更新) 链接:https://openreview.net/forum?id=BZ5a1r-kVsf 难度:⭐⭐⭐⭐ 定位:LeCun 提出 JEPA + 世界模型的"AGI 路线图",反对纯自回归 LLM 路线。
  • V-JEPA 2 发布博客(Meta AI 2025-06) 链接:https://ai.meta.com/blog/v-jepa-2-world-model-benchmarks/ 难度:⭐⭐⭐ 定位:1.2B 参数视频世界模型,能 zero-shot 做机器人规划——具身智能与世界模型路线交汇的标志事件。
  • The Gradient: World Models and the Path Beyond LLMs(2025-01) 链接:https://thegradient.pub/ 难度:⭐⭐⭐ 定位:综述 LeCun 在 NeurIPS 2024 / Davos 2025 的世界模型论述。

Hinton 近年公开博文较少,主要通过访谈传播观点。可在 Lex Fridman / 各大学讲座找。


二、Newsletter(适合"通勤刷一刷")

1. The Batch — Andrew Ng / DeepLearning.AI

2. Ahead of AI — Sebastian Raschka

  • 链接https://magazine.sebastianraschka.com/
  • 频率:每月一期长文 + 不定期短文
  • 难度:⭐⭐⭐⭐
  • 一句话定位:每月精选一个技术主题(如"Mixture of Experts 现状"),把当月相关 papers 拉成知识图。
  • 推荐时机:每月 1 期慢慢消化;当某主题想看"工程视角综述"时。

3. Import AI — Jack Clark(Anthropic 联合创始人)

  • 链接https://importai.substack.com/https://jack-clark.net/
  • 频率:每周一
  • 难度:⭐⭐⭐
  • 一句话定位:Anthropic 政策负责人写的"本周 AI 5-7 条"+ 一篇科幻短篇收尾。视角偏 AI 安全 / 政策 / 大局。
  • 推荐时机:想跳出技术细节看"AI 在改变什么"时。

4. Last Week in AI

  • 链接https://lastweekin.ai/
  • 频率:每周(newsletter + 同名播客)
  • 难度:⭐⭐
  • 一句话定位:Stanford 学生主理,本周 AI 新闻条目化整理 + 简评,覆盖广。
  • 推荐时机:想要"全景扫一眼"且不挑食时。

5. The Sequence — Jesus Rodriguez

  • 链接https://thesequence.substack.com/
  • 频率:周 3-4 期
  • 难度:⭐⭐⭐
  • 一句话定位:偏向 LLM 工程 / 新模型 / 新论文的快讯式 newsletter,频次高、信息密度大。
  • 推荐时机:当 The Batch 已经满足不了你的更新速度时。

6. 具身智能向 — Robotics-specific

  • Chris Paxton 的 Substack(前 Meta / Hello Robot 研究员)

    • 链接:https://chrispaxton.substack.com/
    • 频率:不定期(1-2 月一篇)
    • 难度:⭐⭐⭐
    • 定位:从机器人研究员一线视角看 VLA / 操作 / 模拟。具身智能最值得订阅的个人 newsletter 之一。
    • 推荐时机:想看"机器人研究者怎么吐槽 / 期待"时。
  • Generalist Robots Substack

    • 链接:搜索 Substack "Generalist Robots"(注意有同名站点;要锁定 substack 平台的那个)
    • 难度:⭐⭐⭐
    • 定位:聚焦通用机器人公司动态(Physical Intelligence、Figure、1X、Tesla Optimus)。
    • 推荐时机:想追产业届 humanoid 进展时。
  • The Robot Report

    • 链接:https://www.therobotreport.com/
    • 频率:日更
    • 难度:⭐⭐
    • 定位:机器人产业新闻媒体(融资、产品、并购为主,技术深度一般)。

提醒:robotics-specific newsletter 整体仍较稀缺,当前最有效路径是"BAIR + Chris Paxton + Twitter @physical_int / @1x_tech / @Figure_robot"组合。


三、播客(适合"通勤 / 走路 / 跑步")

1. Lex Fridman Podcast

  • 链接https://lexfridman.com/podcast/
  • 频率:周更(不固定)
  • 时长:常见 2-4 小时(极长)
  • 难度:⭐⭐⭐(口语英语,很多类比)
  • 一句话定位:MIT 研究员主持,访谈跨度从 AI 到哲学到政治,AI 圈常驻嘉宾深度访谈是金矿。
  • 具身智能必听
    • #447 Sergey Levine(2024)— RL + 机器人开山级访谈
    • Pieter Abbeel 多次出场(早期 #41,近期 #303 等)
    • Chelsea Finn(meta-learning + 机器人)
    • Yann LeCun 多次(最新一次完整阐述 JEPA)
  • 推荐时机:周末长跑 / 长途通勤;用 1.5x 速听。

2. The Robot Brains — Pieter Abbeel

  • 链接https://www.therobotbrains.ai/
  • 频率:周更(季节性更新)
  • 时长:1 小时左右
  • 难度:⭐⭐⭐⭐(技术密度高)
  • 一句话定位:Berkeley 机器人学习实验室主任、Covariant 联合创始人主持,具身智能领域最专业的播客。嘉宾包括 LeCun / Fei-Fei Li / Sergey Levine / Jeff Dean / Anca Dragan。
  • 推荐时机:当你想听"研究员之间的内行对话"时。这是具身方向第一推荐播客

3. TWIML AI Podcast — Sam Charrington

  • 链接https://twimlai.com/podcast/
  • 频率:周 2 期
  • 时长:45-60 分钟
  • 难度:⭐⭐⭐
  • 一句话定位:长青老牌 AI 播客(2016 年就开播),话题广覆盖 ML、NLP、CV、MLOps、AI 伦理。
  • 推荐时机:想找某个具体技术话题(比如 RAG / Diffusion / RLHF)的专题访谈时。

4. Latent Space — swyx & Alessio

  • 链接https://www.latent.space/
  • 频率:周更
  • 时长:1 小时
  • 难度:⭐⭐⭐
  • 一句话定位:聚焦"AI Engineer"概念(swyx 推广的工程师视角),更偏应用层 / 工具链 / startup。
  • 推荐时机:想了解"AI 创业者 / 工具链作者"在想什么时。

5. The Cognitive Revolution — Nathan Labenz

  • 链接https://www.cognitiverevolution.ai/
  • 频率:周 2-3 期
  • 时长:1-3 小时(长访谈)
  • 难度:⭐⭐⭐⭐
  • 一句话定位:GPT-4 发布前 red-team 测试者主持,技术理解深、问题尖锐,覆盖前沿模型能力 / 安全 / 政策。
  • 推荐时机:想听"对模型实际能力的细颗粒讨论"时。

6. Last Week in AI Podcast

  • 链接https://lastweekin.ai/
  • 频率:周更
  • 时长:1.5-2 小时
  • 难度:⭐⭐
  • 一句话定位:上面那个 newsletter 的播客版,本周新闻播报 + 编辑评论。
  • 推荐时机:每周一刷一遍当背景音;适合不想认真听的场合。

7. The Gradient Podcast

  • 链接https://thegradientpub.substack.com/s/podcast
  • 频率:周更
  • 时长:1 小时
  • 难度:⭐⭐⭐
  • 一句话定位:The Gradient 配套播客,访谈风格学院派,常邀请论文一作。
  • 推荐时机:读完 The Gradient 某篇文章后,找作者本人的访谈听。

四、订阅起步建议(给入门读者)

第 1 周(最小订阅集)

  1. The Batch(每周三看一遍)— 入门必备
  2. BAIR Blog(每周扫一眼标题,挑机器人 / RL 相关精读)— 具身核心
  3. Lex Fridman 选 1 期 Sergey Levine — 建立"具身智能在做什么"的图

第 1 个月(觉得 OK 再加): 4. Lilian Weng — 找一篇感兴趣的精读 5. Karpathy YouTube "Zero to Hero" — 系统补 LLM 训练 6. The Robot Brains — 选 2-3 期机器人主题听

第 2-3 个月(深入再加): 7. Ahead of AI 月度长文 8. Chris Paxton Substack 9. Import AI 拓宽视野

警告:不要一次订阅 10 个,容易"全订全不读"。先订 3 个能持续读完的。


五、链接验证状态

以上链接均通过 web search 验证主域名可访问(2026-05 检索),具体子页面可能有变动。如遇失效,建议:

  • 博客:搜索"作者名 + blog"
  • Newsletter:搜索"newsletter 名 + Substack"
  • 播客:在 Apple Podcasts / Spotify 搜索名称

关键人物 · 公开访谈 / 演讲

论文是结果,访谈是过程 — 听这些人说他们怎么走到今天,比读他们的 paper 更能学到"研究品味"。 国内学者放最后一段(中文)。

一、海外学者(英文为主)

1. Sergey Levine(UC Berkeley + Physical Intelligence 联创)

定位:当代机器人学习的「半壁江山」。CS285 深度强化学习课程作者,π0 模型主推者。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 Dwarkesh Patel Podcast: Sergey Levine on the Robot Revolution Apple Podcasts https://podcasts.apple.com/nz/podcast/331-sergey-levine-the-robot-revolution-nobody-is/id1438378439?i=1000760975265 ~2h ⭐⭐ "通用机器人的秘密不是把单台机器调到完美,而是在海量异构数据上训练一个共享大脑" 入门后想理解为什么"数据规模"是关键
2 Sergey Levine on Robot Learning & Offline RL The Gradient (Substack) https://thegradientpub.substack.com/p/sergey-levine-on-robot-learning-and 文字访谈 ~30min ⭐⭐⭐ 详解 Offline RL(离线强化学习):用历史数据训练,不需要实时与环境交互 学完 RL 基础后看
3 Deep Robotic Learning(TWiML Industrial AI 系列) TWiML Podcast https://twimlai.com/podcast/twimlai/deep-robotic-learning ~50min ⭐⭐ 早期访谈:为什么"端到端从像素到动作"是机器人学习的范式转变 想理解发展脉络时听
4 CS285 深度强化学习(B 站搬运 2023 全 99 讲双语) 哔哩哔哩 https://www.bilibili.com/video/BV14NcWzcELS/ 99×~1h ⭐⭐⭐⭐ 双语 Levine 亲讲 RL 全套:策略梯度→Actor-Critic→Offline RL→机器人应用 想系统学 RL 的最佳中文友好资源

2. Chelsea Finn(Stanford)

定位:MAML(模型无关元学习)的提出者,让机器人"学会怎么学"。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 What robots have taught me about ML(ICML 2024 Invited Talk) ICML 官网 https://icml.cc/virtual/2024/invited-talk/35253 ~50min ⭐⭐⭐ 反向命题:从机器人那里学到的,反过来推动了 ML 通用方法 想看顶级研究者的"哲学层面"思考时
2 Stanford CS330 Deep Multi-Task & Meta Learning(Lecture 1) YouTube https://www.youtube.com/watch?v=dYmJd_fJLW0 ~1h ⭐⭐⭐ 多任务学习与元学习的完整框架,机器人案例贯穿全程 想从课程级理解 meta-learning 时
3 Chelsea Finn on Meta Learning & Model-Based RL The Gradient https://thegradientpub.substack.com/p/chelsea-finn-on-meta-learning-and 文字 ~25min ⭐⭐ "把先验知识压进网络初始化,比从零学快几个数量级" 想快速摸清她的研究主线时
4 Meta-Learning for Robots(Intel on AI Podcast) Apple Podcasts https://podcasts.apple.com/fr/podcast/meta-learning-for-robots/id1445844944?i=1000566494525 ~40min ⭐⭐ 通俗版:什么是 MAML、为什么机器人需要它 第一次接触 meta-learning 时

3. Pieter Abbeel(Berkeley + Covariant 联创 + Robot Brains 主播)

定位:横跨学术界与工业界的"机器人 + RL 教父"。Covariant 做了第一个机器人基础模型 RFM-1。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 Pieter Abbeel: Deep Reinforcement Learning(Lex Fridman Podcast #10) YouTube https://www.youtube.com/watch?v=l-mYLq6eZPY ~2h ⭐⭐ 从 OpenAI 早年聊到 RL 在机器人上的爆发期,回顾视角清晰 想看一次"RL 简史"时
2 Reinforcement Learning for Industrial AI with Pieter Abbeel TWiML https://twimlai.com/podcast/twimlai/reinforcement-learning-for-industrial-ai ~1h ⭐⭐⭐ Covariant 在仓库里怎么用 RL 做拣选——"99% 不够,要 99.99%" 关心商业落地时
3 Robot Brains Podcast: From OpenAI to Foundation Models for Robotics Covariant 官网 https://covariant.ai/insights/the-robot-brains-from-openai-to-developing-the-first-foundation-models-for-robotics/ ~45min ⭐⭐⭐ RFM-1 设计哲学:把语言、视觉、动作都 tokenize 进同一个 transformer 想理解"机器人基础模型"概念时
4 Pieter Abbeel: Paving the Path to Generalizable Robotics Scale AI Exchange https://exchange.scale.com/public/videos/pieter-abbeel-generalizable-robotics-covariant-ai ~30min ⭐⭐ 简洁演讲版:泛化是机器人下一个 10 年最大瓶颈 想 30 分钟看完精华时

4. Karol Hausman(Physical Intelligence 联创 / CEO,前 Google Brain)

定位:π0 / π0.5 / π1 的灵魂人物之一。从 Google RT-1/RT-2 时代延伸到 PI 创业。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 Karol Hausman, Co-Founder & CEO of Physical Intelligence(The Generalist 长文访谈) The Generalist https://www.generalist.com/p/karol-hausman-physical-intelligence 长文 ~30min 阅读 ⭐⭐ "我们要造的是一个 brain that lives in any robot body"——硬件无关、任务无关 想全面理解 PI 公司战略时
2 #38 Karol Hausman & Kevin Black: Building A Brain For Any Robot Going Direct(Substack) https://goingdirect.substack.com/p/38-karol-hausman-and-kevin-black-4b6 ~1.5h ⭐⭐⭐ 联创内部对谈:π0 训练数据怎么收集、为什么用 flow matching 看完 π0 论文后再听很清晰
3 Training General Robots for Any Task(YouTube) YouTube https://www.youtube.com/watch?v=OJCT-HGxPjk ~50min ⭐⭐⭐ "robotics 的瓶颈不是硬件,是数据规模和算法泛化" 想纠正"机器人=机械臂硬件"误解时
4 Karol 个人主页 个人博客 https://karolhausman.github.io/ ⭐⭐⭐ 论文+演讲索引,最新研究在这里第一时间更新 关注他持续输出时

5. Russ Tedrake(MIT,TRI 副总裁)

定位:经典控制+学习派的桥梁。Diffusion Policy 推动者。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 Underactuated Robotics(MIT 教材 + 公开课主页) MIT CSAIL https://underactuated.csail.mit.edu/index.html 全书+视频 ⭐⭐⭐⭐ 唯一一本把"机器人为什么会摔倒"讲清楚的免费教材,含可运行 Notebook 想打底层动力学基础时(中长期)
2 MIT 6.832 Underactuated Robotics(OCW 2022 春季) MIT OCW https://ocw.mit.edu/courses/6-832-underactuated-robotics-spring-2022/ ~24 lectures × 1.5h ⭐⭐⭐⭐ 配套视频版,2022 版含 Diffusion Policy 与 LfD 章节 教材看不下去时换视频
3 underactuated(Tedrake 自己的 YouTube 频道) YouTube https://www.youtube.com/channel/UChfUOAhz7ynELF-s_1LPpWg 多个 lecture ⭐⭐⭐⭐ Lecture 24(2024 春)专讲 Imitation Learning + Foundation Models 跟踪他最新讲法时

6. Deepak Pathak(CMU + Skild AI 联创)

定位:自监督 / 好奇心驱动学习的代表,2024 年成立 Skild AI 估值飞涨。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 A Path to General Intelligence with Deepak Pathak YouTube https://www.youtube.com/watch?v=xZ7LR6NdOvo ~1h ⭐⭐⭐ 自监督+好奇心的统一视角:内在奖励让机器人"自己找乐子学新技能" 想理解"为什么不用人工奖励"时
2 Robots that learn to generalize beyond training(Pathak 演讲) YouTube https://www.youtube.com/watch?v=ZOMxYjm7h2M ~45min ⭐⭐⭐ 泛化的核心是"训练分布要覆盖部署分布"——sim2real 的本质 想理解 sim2real 时
3 Curiosity-driven Exploration by Self-supervised Prediction(论文笔记主页) Pathak 个人页 https://pathak22.github.io/noreward-rl/ 论文+视频 ⭐⭐⭐⭐ 经典之作:奖励=预测误差,越想不到的越值得学 想读他成名作时
4 Pathak Talks and Papers(合集) YouTube Playlist https://www.youtube.com/playlist?list=PLG7T4DHrMiRXIdoiNXDW8yt3nvDeO5xRX 10+ 视频 ⭐⭐⭐ 一个集合:从 noreward-rl 到 Skild AI 演讲全收 想沉浸式追一个学者时

7. Dieter Fox(NVIDIA Robotics 主管 + UW 教授)

定位:操控+感知+仿真的工业级整合者。GR00T 项目核心人物之一。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 Dieter Fox AI Symposium 2024 Keynote YouTube https://www.youtube.com/watch?v=vgqHR9gK9bQ ~50min ⭐⭐⭐ NVIDIA 视角:仿真+大模型+机器人三件套如何被同时点燃 关心 NVIDIA 路线时
2 Where is RobotGPT? YouTube https://www.youtube.com/watch?v=5e6QAMUQCsg ~40min ⭐⭐⭐ "我们正进入机器人版 ChatGPT 时刻,但数据问题没那么容易" 想看一线工业派的冷静判断时
3 RSS 2024 Keynote: Generating Large Datasets for Robot Manipulation RSS 官网 https://roboticsconference.org/2024/program/keynote/ ~50min ⭐⭐⭐⭐ 数据是核心:仿真 + 人类示范 + RL 三路并行喂模型 关心数据策略时

8. Fei-Fei Li 李飞飞(Stanford + World Labs 联创)

定位:「AI 教母」、ImageNet 之母,2024 年起力推「空间智能」(Spatial Intelligence)作为通向 AGI 的下一跳。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 李飞飞长文中译《从语言到世界:空间智能是 AI 的下一个前沿》 澎湃新闻 https://m.thepaper.cn/newsDetail_forward_31939684 中文 ~20min 阅读 ⭐⭐ 中(译) "LLM 看懂的是 token 概率,看不懂三维结构——这是 AGI 必须跨过的坎" 想用最少时间理解她最新立场时
2 李飞飞发文:空间智能将成 AI 攀登的下一座高峰(科技日报中文转载) 中国科技网 http://www.stdaily.com/web/gjxw/2025-11/13/content_431564.html 中文 ~10min 同篇文章的简短中文摘要版 想 5 分钟抓核心时
3 Tim Ferriss × Fei-Fei Li: The Godmother of AI Tim Ferriss 官网 https://www.facebook.com/TimFerriss/posts/new-podcast-episode-is-up-dr-fei-fei-li-the-godmother-of-ai-asking-audacious-que/1409073980582613/ ~1.5h ⭐⭐ 个人成长+学术决策视角,解释为什么从 ImageNet 走到 World Labs 想看人物全貌时

9. Yann LeCun(Meta Chief AI Scientist)

定位:World Model / JEPA 路线最坚定的旗手,对纯 LLM 路线持续唱反调。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 This Is AGI(S1E10): Yann LeCun, JEPA and the World Model YouTube https://www.youtube.com/watch?v=9PBjt3SY-6A ~1h ⭐⭐⭐ "人类做事前会先想象结果,AI 不会——这必须改变。JEPA 是缺失的那块" 第一次接触 World Model 概念时
2 EP20: Yann LeCun(The Information Bottleneck) The Information Bottleneck https://www.the-information-bottleneck.com/ep20-yann-lecun/ ~1.5h ⭐⭐⭐ 详解为什么"scaling LLM"是死路、JEPA 怎么训练 想反思 LLM 万能论时
3 Yann LeCun: LLMs Will NEVER Reach Human Level AI YouTube https://www.youtube.com/watch?v=wDeXfFQcJxk ~30min ⭐⭐ 短版:4 个理由说明 LLM 不能成 AGI 想要最短时间get他立场时

10. Andrej Karpathy(前 Tesla AI 总监 + Eureka Labs 创始人)

定位:神经网络教育第一人。Tesla 时代主导 FSD/Optimus 视觉栈。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, AGI(Lex Fridman #333) YouTube https://www.youtube.com/watch?v=cdiD-9MMpb0 ~3.5h ⭐⭐ "FSD 已经是个 walking robot 在路上,Optimus 是把同一套软件搬到双足上" 想看「自动驾驶 ↔ 人形机器人」共通技术时
2 Andrej Karpathy 个人主页 karpathy.ai https://karpathy.ai/ ⭐⭐⭐ 索引:Zero to Hero 系列 + nanoGPT + 最新教学视频 想找他全部教学资源的入口时
3 Andrej Karpathy on Tesla Bot YouTube(Lex Clips 摘录) https://www.youtube.com/watch?v=aWY2-KGCI_c ~10min ⭐⭐ "Bot 是 Car 的近亲:去掉轮子加双腿,软件几乎一样" 想 10 分钟理解他的"软件 2.0"机器人观时

二、国内学者(中文为主)

11. 王鹤(北大 + 银河通用 创始人/CTO)

定位:国内具身智能产业化最快的 PI 之一。合成数据派旗手。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 王鹤主讲"北京大学博雅人工智能讲堂"第十五期"大模型赋能的人形机器人" 北大教务长办公室 https://provost.pku.edu.cn/xwdt/2fb1a0b19cbb454c824c15712eeae0c4.htm 文字纪要 ~10min ⭐⭐ 大模型 + 合成数据 + 人形是国内"快进 5 年"的最优路径 想了解他主路线时
2 银河通用王鹤:重塑生产力 中国以具身智能引领产业发展 央广网科技 http://tech.cnr.cn/techgd/20251227/t20251227_527474729.shtml 文字 ~10min 中国具身智能从"技术展示"走向真实产线落地 想看产业视角时
3 乌镇声音|北大王鹤:善用合成数据 推动人形机器人应用落地 光明网 https://politics.gmw.cn/2025-11/07/content_38397392.htm 文字 ~5min "真实数据稀缺无法解,合成数据是必由之路"——技术核心理念一句话版 想 5 分钟抓他立场时
4 银河通用王鹤博士做客上科大:共探具身智能产业化未来 上科大 SIST https://sist.shanghaitech.edu.cn/_t335/2026/0413/c2858a1120694/page.htm 文字纪要 ~15min ⭐⭐ 完整讲座纪要:技术路径 + 商业模式 + 产学研合作 想看他完整体系时

12. 周博磊(UCLA,前港中文)

定位:可解释性 + RL + 具身控制。B 站强化学习中文公开课作者。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 周博磊《强化学习纲要》B 站全套 哔哩哔哩(CSDN 索引页) https://blog.csdn.net/qq_43616565/article/details/120403221 全 ~25 讲 ⭐⭐⭐ 国内最完整、最免费、最母语友好的 RL 入门课,从 MDP 到 PPO 全覆盖 中文学 RL 首选
2 中文大学周博磊变身 up 主,中文课程已上线(机器之心专访) CSDN 博客 https://blog.csdn.net/weixin_40920183/article/details/106718365 文字 ~10min 课程开课背景 + 选材依据 + 配套作业 想知道课程怎么学时

13. 朱军(清华 + 生数科技 创始人)

定位:贝叶斯派代表,转向通用世界模型与多模态生成。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 通用世界模型:连接数字世界与物理世界的桥梁(朱军 2026 中关村论坛主旨) 中国科技网 http://www.stdaily.com/web/gdxw/2026-04/02/content_496708.html 文字 ~10min ⭐⭐ 视频生成模型可以演化为"通用世界模型",给具身智能提供物理常识 想理解 video → world model 路径时
2 专访清华朱军:大模型"投毒"怎么防? 新京报 https://m.bjnews.com.cn/detail/1774234951129179.html 文字 ~15min 安全 / 治理视角:技术派如何看 AI 治理 关心 AI 治理时

14. 林达华(上海 AI Lab)

定位:上海 AI 实验室的方向把舵者之一,主推开源大模型 InternLM。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 林达华:大模型时代的 AI 产业分工将会被重塑(中国证券网) 中国证券网 https://news.cnstock.com/news,bwkx-202404-5209172.htm 文字 ~5min 数据优势 + 算力 + 开源生态 = 中国大模型路径,三足 想理解上海 AI Lab 战略时

15. 鲁继文(清华自动化系副主任)

定位:表示学习 / 视觉感知,近年扩展到自动驾驶和具身视觉。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 鲁继文教授「视觉感知与自动驾驶」专题报告 西安工程大学 https://jsjxy.xpu.edu.cn/info/1265/6031.htm 文字纪要 ~10min ⭐⭐ 视觉感知是具身的"眼睛"——从识别到 3D 重建的进化路径 想从视觉角度理解具身时
2 清华大学副教授鲁继文应邀作线上学术报告(同济智信讲坛 193 期) 同济视觉与智能学习实验室 https://vill.tongji.edu.cn/info/1056/1446.htm 文字纪要 ~10min ⭐⭐ 无监督表示学习 → 复杂对象的特征表示 → 下游具身任务 想看他研究脉络时

16. 刘恩佐(OmniH2O 等人形机器人项目核心,CMU/上海交大)

注:作为研究者本人公开访谈较少,主要通过技术解读获取。

# 标题 平台 链接 时长 难度 语言 一句话亮点 推荐时机
1 OmniH2O:CMU 与上海交大联手打造的全能人形机器人系统(中文技术解读) CSDN 博客 https://blog.csdn.net/xiaobing259/article/details/146918932 文字 ~20min ⭐⭐⭐ RL+模仿+遥操作三结合:用人示范的视频直接学全身控制 想看一篇国产顶级 work 的中文解读时
2 OmniH2O:通用灵巧的人-机器人全身遥操作和学习(论文中文逐段精读) CSDN 博客 https://blog.csdn.net/yorkhunter/article/details/143743060 文字 ~30min ⭐⭐⭐⭐ 论文级精读,含网络结构 + 训练流程 + 局限分析 想跟一篇 paper 时
3 CMU×上交大搞出「全能机器人」!开放场景任务成功率超 90% 53AI https://www.53ai.com/news/zhinengyingjian/2025040503781.html 文字 ~10min ⭐⭐ 高 level 解读,含视频 demo 链接 想 10 分钟看完一个 work 时

三、阅读路径建议(写给入门读者)

第 1 周(视野打开)

  • Yann LeCun JEPA 演讲 → Fei-Fei Li 空间智能中文长文 → Karpathy × Lex Fridman → 王鹤博雅讲堂纪要
  • 目标:知道领域里有哪几条主路线(World Model / Spatial Intelligence / 端到端 VLA / 合成数据)

第 2-4 周(建立技术基础)

  • 周博磊《强化学习纲要》前 10 讲 + Levine CS285 前 5 讲(双语字幕)
  • 目标:会用一句话解释 MDP / Policy Gradient / Q-Learning

第 5-8 周(深入具身)

  • Levine Dwarkesh Podcast → Hausman Generalist 长文 → Tedrake 公开课 Lecture 24(Imitation + Foundation Models)→ OmniH2O 中文精读
  • 目标:能看懂 π0 / RT-2 / OmniH2O 这些代表 work 的核心思路

第 9 周后(持续追踪)

  • 关注 Hausman / Finn / Pathak 个人主页 + Pieter Abbeel 的 Robot Brains Podcast 新一期
  • 关注国内:上海 AI Lab / 银河通用 / 智元 / 北大博雅讲堂的公开活动

附录:未找到 / 待确认条目

  • ⚠️ 知乎高赞回答:Sergey Levine / Chelsea Finn 在知乎的中文专栏未直接搜到(推测国内并无官方账号);建议改用机器之心 / 量子位的访谈编译稿替代。
  • ⚠️ 陈玉荣:在搜索结果中未直接命中具身智能相关访谈,可能需要更精确身份信息(哪所机构)才能定位。建议先跳过或换关键词。
  • ⚠️ Latent Space podcast 中的具身相关 episode:本次未单独搜索,可后续补充。

Other beginner pages