社区 / 持续追踪
论文是慢车,社区是快车 — 入门读者每天 5 分钟、每周 30 分钟、每月 1 小时怎么跟
论文像教材,几个月才出一版;社区像同学群,每天都在聊新八卦。 这一页告诉你:作为一个读者,时间宝贵,每天该看什么、不该看什么。
先说一句最重要的:不要一上来就订阅 30 个公众号。 你会被淹没,然后什么都没看。 正确做法 = 每天 5 分钟 + 每周 30 分钟 + 每月 1-2 小时,三档之外全部砍掉。
1. 先讲清楚几个新词
下面后面会反复用到,先用初高中熟悉的东西打个比方:
顶会(Top Conference):这个领域里最厉害的"年度学术擂台"。每年只录一小部分论文,类似高考全省前 1%。 PI(Principal Investigator,导师 / 教授):实验室的"班主任 + 总教练",决定研究方向、带学生发论文。 arxiv(音"archive"):一个免费论文仓库,相当于"作业还没交老师就先贴到学校公告栏"——没经过同行评审,但快。 预印本(preprint):放上 arxiv 还没正式发表的论文。 开源代码:作者把自己写的程序公开放到网上(一般在 GitHub),任何人都能下载、运行、改。 复现(reproduce):拿到别人的代码和数据,自己跑一遍,看能不能得到论文里那个结果。像"按菜谱炒一遍这道菜,看味道一样不一样"。 VLA(Vision-Language-Action):一类机器人模型的简称——输入"看到的画面 + 听到的指令",输出"手脚怎么动"。可以理解为"会看会听会动手的 AI"。 具身智能(Embodied AI):让 AI 拥有"身体",不只是在屏幕里聊天,而是能在真实世界里做事。比如机器人收拾桌子、自动驾驶。
读到这里你应该懂了:顶会、arxiv、开源、VLA、具身智能 这几个词后面再出现就不解释了。
2. 你每天看什么(≤ 5 分钟)
唯一目标:保持"这个领域今天大概出了什么大新闻"的手感。
只做一件事:
- 打开手机,刷一下 机器之心 公众号 或 量子位 公众号
- 只看标题,不点进去
- 看到"机器人 / 具身 / 人形 / VLA / 大模型"的标题,心里记一下名字就行
为什么不深读?因为你刚上路,深读要留给周末。
公众号:微信里的内容订阅号。在微信"搜一搜"输入名字就能关注。
每天 3-5 分钟,跑完就走。别开知乎,会刷上瘾。
读到这里你应该懂了:日更不是为了学,是为了不掉队。
3. 你每周看什么(30 分钟,挑周末一次性看完)
每周从下面 4 件事里挑 2 件 做(不是全做):
A. 看一篇 PaperWeekly 公众号的论文导读
- 它专门做"把一篇论文翻译成人话"
- 选标题里有"机器人 / 具身 / VLA / 多模态"的那篇
- 看不懂没关系,你的目标是混个脸熟,不是当场学会
B. 看一个 B 站讲解视频
推荐这些 UP 主(搜名字即可):
| UP 主类型 | 找谁 | 一句话 |
|---|---|---|
| 综合 AI 解读 | 跟李沐学 AI、李宏毅 | 沐神是大佬亲自讲论文;李宏毅老师讲课最适合零基础 |
| 机器人 / 具身专题 | 在 B 站搜 "具身智能" "机器人大模型" | 多是研究生录的组会汇报,10-30 分钟一段 |
| 入门数学 / 编程 | 3Blue1Brown 中文搬运、StatQuest 中文 | 讲向量、矩阵、概率特别直观 |
B 站:bilibili.com,国内年轻人主要的视频学习平台。 搬运:把油管/外网视频加中文字幕重新发一遍。
C. 看一期播客(边走路边听)
- 中文:「硅谷 101」、「张小珺商业访谈」——常请国内具身创业者
- 英文(练听力顺便学):The Robot Brains,主持人是 UC Berkeley 的 Pieter Abbeel 教授
D. 翻一下 HuggingFace Daily Papers
- 网址:https://huggingface.co/papers
- 它每天选 ~10 篇社区投票最高的论文,自带英文摘要
- 你只看摘要的第一句话("What is this paper about?"),混眼熟
HuggingFace(抱抱脸):一个全球最大的 AI 模型 / 论文 / 代码社区,相当于"AI 界的 GitHub"。
读到这里你应该懂了:每周不是逼自己学完一篇论文,是让大脑对几个名字变熟。
4. 你每月看什么(1-2 小时,月底找一个下午)
每月做 1 件 事就够:
选项 A:扫一遍当月顶会的"标题列表"
- 11 月:CoRL(机器人学习顶会)的接收论文列表
- 6 月:CVPR(计算机视觉顶会)
- 12 月:NeurIPS(机器学习顶会)
打开会议官网,只看论文标题。100 个标题里挑 3 个你眼熟的关键词的,记到笔记本。
接收论文列表(accepted papers):每年顶会公布的"今年录取了哪些论文"清单。
选项 B:看一个研究综述(survey paper)
- 综述 = "这一年这个方向的总结报告",比单篇论文好读
- 找综述:在 GitHub 搜 "Awesome LLM Robotics" 或 "Awesome Embodied AI"
- 这种仓库会列出最近的好综述,挑一篇中文版(机器之心 / PaperWeekly 经常翻译)
GitHub:全球最大的代码仓库网站,可以理解成"程序员的网盘 + 朋友圈"。 Awesome 仓库:社区维护的"某主题最佳资源清单",约定俗成叫 "Awesome-XXX"。
选项 C:看一场公开讲座录像
- B 站搜 "VALSE" — 国内最大计算机视觉学术沙龙,每年有具身专场
- YouTube(需科学上网)搜 "Stanford AI Seminar" 或 "MIT CSAIL Robotics"
每场 60-90 分钟,1.5 倍速 + 跳过提问环节,1 小时搞定。
读到这里你应该懂了:每月只做一件事,宁少勿多。
5. 完全不必关注的(高中阶段先放下)
下面这些,你看到了也别花时间,等你上大学修过线性代数 / 概率论再说:
| 不必关注的 | 为什么 |
|---|---|
| 推特 / X 上的实时讨论 | 信噪比极低,90% 是吵架和广告,需要很强的"过滤能力"才能看出门道 |
| arxiv 每日新论文列表 | 每天 100+ 篇,你看不完也读不懂,徒增焦虑 |
| Discord / Slack 国际社群 | 全英文 + 时差 + 行业黑话,零基础进去会自闭 |
| 各种付费 newsletter | 高中阶段免费的中文资源已经管够 |
| 模型源代码 | 现在还看不懂 Python,先打地基 |
| 各家发布会"哪个机器人最强" | 营销 > 学术,看个热闹就行 |
| 论文里复杂的数学公式页 | 等你大学学会矩阵 / 偏导再回头看 |
判断原则:如果一篇内容里 80% 的词你都不认识,那它现在不是给你看的。 关掉,回到上面的"每周 30 分钟"清单。
读到这里你应该懂了:会取舍,比会学习更重要。
6. 国内学生友好的资源地图
中文公众号(每天最多看 2 个,超过就是浪费)
| 名称 | 频率 | 一句话 |
|---|---|---|
| 机器之心 | 每日 | 综合 AI 媒体,机器人栏目稳定更新 |
| 量子位 | 每日 | 同上,互补 |
| PaperWeekly | 每周几篇 | 论文导读偏深度,有具身专题 |
| 将门创投 TechBeat | 每周 | 直播 + 论文解读 |
| OpenRobotLab | 不定期 | 上海 AI Lab 的具身分支官号,国内具身更新最频繁的之一 |
知乎专栏 / 答主(搜下面名字)
- 跟李沐学 AI:B 站和知乎双平台,论文带读
- 王鹤、高阳、卢策吾:国内具身一线教授,他们的学生在知乎答题
- 机器之心 知乎机构号
B 站 UP 主(入门最友好的渠道)
- 跟李沐学 AI、李宏毅:基础课
- 3Blue1Brown 中文搬运:数学直觉
- 搜 "具身智能"、"机器人 大模型"、"VLA" 三个关键词,看播放量高的近期视频
微信群(暂时别加)
加群之前先问自己:"我能听懂他们在说什么吗?" 入门阶段先不要加技术群,潜水公众号留言区就够了。
读到这里你应该懂了:中文资源 > 英文资源;视频 > 文字;高质量少量 > 低质量大量。
7. 如果你 18 岁前想给具身智能领域留下一点声音
先泼冷水:发顶会论文几乎不可能(导师 / 算力 / 数学全缺),别想。 但是——下面这几件事,一个读者认真做完,质量足以让一个名校博士生看完点头:
难度 1 星:做一个可视化网页
- 选一个具身智能里的小概念(比如"什么是模仿学习?")
- 用图、动画、互动滑块讲清楚
- 学一点 HTML / CSS / JS(B 站搜 "前端入门" 一周入门)
- 部署到 GitHub Pages(免费),把链接发到知乎/B 站
类似参考:3Blue1Brown 的网页解释,或 Distill.pub 上的可视化论文。
难度 2 星:翻译一篇英文综述
- 选一篇 30-50 页的具身智能综述(每月清单里能找到)
- 用 ChatGPT / DeepSeek 当字典,自己一段段过
- 每翻译完一节,写一段"我读这一段的理解"
- 发到知乎专栏 / 自己的小红书 / GitHub
综述:把某个方向最近 5-10 年的进展整理成一篇"教科书章节"的论文,一般 30-100 页。
这件事特别有用:
- 你的英文阅读会暴涨
- 中文社区缺这种东西,会被收藏转发
- 你写完会比 95% 的本科生更懂这个方向
难度 3 星:复现一篇论文的开源代码
- 找一篇代码已经开源的具身论文(github 上有 ⭐ 数)
- 在自己电脑或免费云算力(Google Colab / 阿里云学生礼包)上跑通
- 写一份"我踩了 10 个坑"的复现笔记,发知乎或 GitHub
- 加分项:把作者英文 README 翻译成中文 PR 给原仓库
PR(Pull Request):在 GitHub 上向别人的项目提交修改的标准动作,相当于"学生交作业给老师"。 开源仓库:作者把代码免费放出来的项目地址。
如果你的复现笔记或翻译被作者本人 merge(合并)进官方仓库,这就是你 18 岁前留下的真实贡献。 你能写进任何申请文书 / 面试 / 简历里,且大学教授看了会眼前一亮。
难度 4 星(极少数人能做到):发一篇博客被领域大佬转发
- 选一个具身领域的"被忽视的小问题"(比如"为什么 VLA 模型大多用 7B 参数?")
- 自己查 5-10 篇论文,写一篇 2000 字的中文博客,逻辑严密、有图、有引用
- 发知乎 + B 站专栏 + 推特(中英双语)
- 私信 / @ 几位国内导师(高阳 / 王鹤 / 卢策吾 课题组的学生),礼貌求转发
成功率很低,但成本也低,撞上一次就够你写进任何履历。
读到这里你应该懂了:入门读者不能拼学历,但可以拼"看得清+写得清+做得完"——这是大学之后越来越稀缺的能力。
8. 总结:你的 6 个月节奏表
| 阶段 | 做什么 | 不做什么 |
|---|---|---|
| 第 1 个月 | 关注 2 个中文公众号;高考冲刺优先 | 别学 Python,别看英文论文 |
| 第 2 个月 | 加上每周 1 个 B 站讲解视频 | 别建推特账号 |
| 第 3 个月 | 加上每周 1 期播客 | 别参加任何技术社群 |
| 第 4 个月 | 月底扫一次 HuggingFace Daily Papers 标题 | 别强迫自己读论文 |
| 第 5 个月 | 选一个"难度 1 星"的小项目动手做 | 别同时做两个 |
| 第 6 个月 | 把项目发出来,记录自己 6 个月的变化 | 别和同龄 AI 大牛比,比的是 6 个月前的自己 |
订阅是手段,不是目的。 信号密度 > 信源数量。少而精,比多而乱有用 100 倍。
读到这里你应该懂了:入门阶段,"保持手感 + 一个小项目"已经超越 99% 的同龄人了。
英文进阶 · 博客 / Newsletter / 播客
如果你的英文能读 paper abstract 没问题,下面这些是领域里持续输出"高信号噪比"的人。建议先订 1-2 个,习惯了再加。
一、博客 / Substack(适合"想沉下来读一篇")
1. Lil'Log — Lilian Weng 个人博客
- 链接:https://lilianweng.github.io/
- 语言:英文
- 频率:1-2 月一篇(频率低,但每篇都是综述级)
- 难度:⭐⭐⭐⭐(数学密度高)
- 一句话定位:前 OpenAI 安全研究负责人写的"教科书级"长文综述,每篇都是该子领域最佳入门读物。
- 推荐时机:当某个概念(diffusion / agent / hallucination / RL)你想"一篇看穿"时。
- 必读起点:
- LLM Powered Autonomous Agents — agent 范式启蒙长文
- What are Diffusion Models? — 扩散模型最佳入门
2. Andrej Karpathy 的博客
- 链接:https://karpathy.github.io/
- 语言:英文
- 频率:极不稳定(半年-1 年一篇,但篇篇爆款)
- 难度:⭐⭐⭐(写作非常平易,配图好)
- 一句话定位:前特斯拉 AI 总监 / OpenAI 创始成员,他写的"软件 2.0"、"GPT 是怎么训练的"是入门界圣经。
- 推荐时机:想理解 LLM 训练全栈、神经网络直觉建立时。
- 配套:他 YouTube 上的 "Neural Networks: Zero to Hero" 系列是最好的从零到 GPT 的视频课程。
3. BAIR Blog — 伯克利 AI 研究博客
- 链接:https://bair.berkeley.edu/blog/
- 语言:英文
- 频率:每周 1-2 篇
- 难度:⭐⭐⭐⭐(学术原文级)
- 一句话定位:UC Berkeley AI Research 实验室官方博客,机器人 / RL / 具身智能领域的前沿一手内容(Sergey Levine / Pieter Abbeel / Chelsea Finn 都在这里发)。
- 推荐时机:想看具身智能领域学术界本周在做什么时。这是具身方向最重要的博客。
4. Sebastian Raschka 的博客 / Ahead of AI
- 链接:https://magazine.sebastianraschka.com/(Substack)/ https://sebastianraschka.com/blog/
- 语言:英文
- 频率:每月 1-2 篇深度文
- 难度:⭐⭐⭐(实践向,代码多)
- 一句话定位:《Build a LLM from Scratch》作者,从训练工程师视角写的 LLM 解读,注重"能落地的细节"。
- 推荐时机:想对比不同模型架构 / 训练技巧选型时。
5. The Gradient
- 链接:https://thegradient.pub/
- 语言:英文
- 频率:每月几篇(不固定)
- 难度:⭐⭐⭐
- 一句话定位:Stanford AI Lab 学生发起的非营利刊物,研究者用通俗语言写的长文 + 访谈。
- 推荐时机:想读"研究者怎么思考"而非"论文摘要"时;配套有 The Gradient Podcast(Daniel Bashir 主持)。
6. Distill.pub(已停更,但仍是宝藏)
- 链接:https://distill.pub/
- 语言:英文
- 状态:2021-07 起永久 hiatus,但全部存档可读
- 难度:⭐⭐(交互式可视化降低门槛)
- 一句话定位:交互式机器学习论文,把"注意力机制""特征可视化"这种抽象概念做成可拖动的动画。视觉化教学的天花板。
- 推荐时机:当你在某个概念(attention / 特征可视化 / 神经网络几何)卡壳时。
7. Yann LeCun / World Model 阵营专文
具身智能要追"世界模型"路线,必读的 3 篇:
- A Path Towards Autonomous Machine Intelligence(LeCun 2022 立场论文,2025 年仍在更新) 链接:https://openreview.net/forum?id=BZ5a1r-kVsf 难度:⭐⭐⭐⭐ 定位:LeCun 提出 JEPA + 世界模型的"AGI 路线图",反对纯自回归 LLM 路线。
- V-JEPA 2 发布博客(Meta AI 2025-06) 链接:https://ai.meta.com/blog/v-jepa-2-world-model-benchmarks/ 难度:⭐⭐⭐ 定位:1.2B 参数视频世界模型,能 zero-shot 做机器人规划——具身智能与世界模型路线交汇的标志事件。
- The Gradient: World Models and the Path Beyond LLMs(2025-01) 链接:https://thegradient.pub/ 难度:⭐⭐⭐ 定位:综述 LeCun 在 NeurIPS 2024 / Davos 2025 的世界模型论述。
Hinton 近年公开博文较少,主要通过访谈传播观点。可在 Lex Fridman / 各大学讲座找。
二、Newsletter(适合"通勤刷一刷")
1. The Batch — Andrew Ng / DeepLearning.AI
- 链接:https://www.deeplearning.ai/the-batch/
- 频率:每周三
- 难度:⭐⭐(中英都易懂;有中文版!)
- 中文版:https://www.deeplearning.ai/the-batch/tag/letters/(部分文章;微信公众号"吴恩达"也转译)
- 一句话定位:Andrew Ng 团队精选每周 4-5 条 AI 新闻 + 一篇他亲自写的开篇信,用例-影响-思考三段式,新手友好度第一。
- 推荐时机:作为入门读者第一个订阅的 newsletter。
2. Ahead of AI — Sebastian Raschka
- 链接:https://magazine.sebastianraschka.com/
- 频率:每月一期长文 + 不定期短文
- 难度:⭐⭐⭐⭐
- 一句话定位:每月精选一个技术主题(如"Mixture of Experts 现状"),把当月相关 papers 拉成知识图。
- 推荐时机:每月 1 期慢慢消化;当某主题想看"工程视角综述"时。
3. Import AI — Jack Clark(Anthropic 联合创始人)
- 链接:https://importai.substack.com/ 或 https://jack-clark.net/
- 频率:每周一
- 难度:⭐⭐⭐
- 一句话定位:Anthropic 政策负责人写的"本周 AI 5-7 条"+ 一篇科幻短篇收尾。视角偏 AI 安全 / 政策 / 大局。
- 推荐时机:想跳出技术细节看"AI 在改变什么"时。
4. Last Week in AI
- 链接:https://lastweekin.ai/
- 频率:每周(newsletter + 同名播客)
- 难度:⭐⭐
- 一句话定位:Stanford 学生主理,本周 AI 新闻条目化整理 + 简评,覆盖广。
- 推荐时机:想要"全景扫一眼"且不挑食时。
5. The Sequence — Jesus Rodriguez
- 链接:https://thesequence.substack.com/
- 频率:周 3-4 期
- 难度:⭐⭐⭐
- 一句话定位:偏向 LLM 工程 / 新模型 / 新论文的快讯式 newsletter,频次高、信息密度大。
- 推荐时机:当 The Batch 已经满足不了你的更新速度时。
6. 具身智能向 — Robotics-specific
Chris Paxton 的 Substack(前 Meta / Hello Robot 研究员)
- 链接:https://chrispaxton.substack.com/
- 频率:不定期(1-2 月一篇)
- 难度:⭐⭐⭐
- 定位:从机器人研究员一线视角看 VLA / 操作 / 模拟。具身智能最值得订阅的个人 newsletter 之一。
- 推荐时机:想看"机器人研究者怎么吐槽 / 期待"时。
Generalist Robots Substack
- 链接:搜索 Substack "Generalist Robots"(注意有同名站点;要锁定 substack 平台的那个)
- 难度:⭐⭐⭐
- 定位:聚焦通用机器人公司动态(Physical Intelligence、Figure、1X、Tesla Optimus)。
- 推荐时机:想追产业届 humanoid 进展时。
The Robot Report
- 链接:https://www.therobotreport.com/
- 频率:日更
- 难度:⭐⭐
- 定位:机器人产业新闻媒体(融资、产品、并购为主,技术深度一般)。
提醒:robotics-specific newsletter 整体仍较稀缺,当前最有效路径是"BAIR + Chris Paxton + Twitter @physical_int / @1x_tech / @Figure_robot"组合。
三、播客(适合"通勤 / 走路 / 跑步")
1. Lex Fridman Podcast
- 链接:https://lexfridman.com/podcast/
- 频率:周更(不固定)
- 时长:常见 2-4 小时(极长)
- 难度:⭐⭐⭐(口语英语,很多类比)
- 一句话定位:MIT 研究员主持,访谈跨度从 AI 到哲学到政治,AI 圈常驻嘉宾深度访谈是金矿。
- 具身智能必听:
- #447 Sergey Levine(2024)— RL + 机器人开山级访谈
- Pieter Abbeel 多次出场(早期 #41,近期 #303 等)
- Chelsea Finn(meta-learning + 机器人)
- Yann LeCun 多次(最新一次完整阐述 JEPA)
- 推荐时机:周末长跑 / 长途通勤;用 1.5x 速听。
2. The Robot Brains — Pieter Abbeel
- 链接:https://www.therobotbrains.ai/
- 频率:周更(季节性更新)
- 时长:1 小时左右
- 难度:⭐⭐⭐⭐(技术密度高)
- 一句话定位:Berkeley 机器人学习实验室主任、Covariant 联合创始人主持,具身智能领域最专业的播客。嘉宾包括 LeCun / Fei-Fei Li / Sergey Levine / Jeff Dean / Anca Dragan。
- 推荐时机:当你想听"研究员之间的内行对话"时。这是具身方向第一推荐播客。
3. TWIML AI Podcast — Sam Charrington
- 链接:https://twimlai.com/podcast/
- 频率:周 2 期
- 时长:45-60 分钟
- 难度:⭐⭐⭐
- 一句话定位:长青老牌 AI 播客(2016 年就开播),话题广覆盖 ML、NLP、CV、MLOps、AI 伦理。
- 推荐时机:想找某个具体技术话题(比如 RAG / Diffusion / RLHF)的专题访谈时。
4. Latent Space — swyx & Alessio
- 链接:https://www.latent.space/
- 频率:周更
- 时长:1 小时
- 难度:⭐⭐⭐
- 一句话定位:聚焦"AI Engineer"概念(swyx 推广的工程师视角),更偏应用层 / 工具链 / startup。
- 推荐时机:想了解"AI 创业者 / 工具链作者"在想什么时。
5. The Cognitive Revolution — Nathan Labenz
- 链接:https://www.cognitiverevolution.ai/
- 频率:周 2-3 期
- 时长:1-3 小时(长访谈)
- 难度:⭐⭐⭐⭐
- 一句话定位:GPT-4 发布前 red-team 测试者主持,技术理解深、问题尖锐,覆盖前沿模型能力 / 安全 / 政策。
- 推荐时机:想听"对模型实际能力的细颗粒讨论"时。
6. Last Week in AI Podcast
- 链接:https://lastweekin.ai/
- 频率:周更
- 时长:1.5-2 小时
- 难度:⭐⭐
- 一句话定位:上面那个 newsletter 的播客版,本周新闻播报 + 编辑评论。
- 推荐时机:每周一刷一遍当背景音;适合不想认真听的场合。
7. The Gradient Podcast
- 链接:https://thegradientpub.substack.com/s/podcast
- 频率:周更
- 时长:1 小时
- 难度:⭐⭐⭐
- 一句话定位:The Gradient 配套播客,访谈风格学院派,常邀请论文一作。
- 推荐时机:读完 The Gradient 某篇文章后,找作者本人的访谈听。
四、订阅起步建议(给入门读者)
第 1 周(最小订阅集):
- The Batch(每周三看一遍)— 入门必备
- BAIR Blog(每周扫一眼标题,挑机器人 / RL 相关精读)— 具身核心
- Lex Fridman 选 1 期 Sergey Levine — 建立"具身智能在做什么"的图
第 1 个月(觉得 OK 再加): 4. Lilian Weng — 找一篇感兴趣的精读 5. Karpathy YouTube "Zero to Hero" — 系统补 LLM 训练 6. The Robot Brains — 选 2-3 期机器人主题听
第 2-3 个月(深入再加): 7. Ahead of AI 月度长文 8. Chris Paxton Substack 9. Import AI 拓宽视野
警告:不要一次订阅 10 个,容易"全订全不读"。先订 3 个能持续读完的。
五、链接验证状态
以上链接均通过 web search 验证主域名可访问(2026-05 检索),具体子页面可能有变动。如遇失效,建议:
- 博客:搜索"作者名 + blog"
- Newsletter:搜索"newsletter 名 + Substack"
- 播客:在 Apple Podcasts / Spotify 搜索名称
关键人物 · 公开访谈 / 演讲
论文是结果,访谈是过程 — 听这些人说他们怎么走到今天,比读他们的 paper 更能学到"研究品味"。 国内学者放最后一段(中文)。
一、海外学者(英文为主)
1. Sergey Levine(UC Berkeley + Physical Intelligence 联创)
定位:当代机器人学习的「半壁江山」。CS285 深度强化学习课程作者,π0 模型主推者。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | Dwarkesh Patel Podcast: Sergey Levine on the Robot Revolution | Apple Podcasts | https://podcasts.apple.com/nz/podcast/331-sergey-levine-the-robot-revolution-nobody-is/id1438378439?i=1000760975265 | ~2h | ⭐⭐ | 英 | "通用机器人的秘密不是把单台机器调到完美,而是在海量异构数据上训练一个共享大脑" | 入门后想理解为什么"数据规模"是关键 |
| 2 | Sergey Levine on Robot Learning & Offline RL | The Gradient (Substack) | https://thegradientpub.substack.com/p/sergey-levine-on-robot-learning-and | 文字访谈 ~30min | ⭐⭐⭐ | 英 | 详解 Offline RL(离线强化学习):用历史数据训练,不需要实时与环境交互 | 学完 RL 基础后看 |
| 3 | Deep Robotic Learning(TWiML Industrial AI 系列) | TWiML Podcast | https://twimlai.com/podcast/twimlai/deep-robotic-learning | ~50min | ⭐⭐ | 英 | 早期访谈:为什么"端到端从像素到动作"是机器人学习的范式转变 | 想理解发展脉络时听 |
| 4 | CS285 深度强化学习(B 站搬运 2023 全 99 讲双语) | 哔哩哔哩 | https://www.bilibili.com/video/BV14NcWzcELS/ | 99×~1h | ⭐⭐⭐⭐ | 双语 | Levine 亲讲 RL 全套:策略梯度→Actor-Critic→Offline RL→机器人应用 | 想系统学 RL 的最佳中文友好资源 |
2. Chelsea Finn(Stanford)
定位:MAML(模型无关元学习)的提出者,让机器人"学会怎么学"。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | What robots have taught me about ML(ICML 2024 Invited Talk) | ICML 官网 | https://icml.cc/virtual/2024/invited-talk/35253 | ~50min | ⭐⭐⭐ | 英 | 反向命题:从机器人那里学到的,反过来推动了 ML 通用方法 | 想看顶级研究者的"哲学层面"思考时 |
| 2 | Stanford CS330 Deep Multi-Task & Meta Learning(Lecture 1) | YouTube | https://www.youtube.com/watch?v=dYmJd_fJLW0 | ~1h | ⭐⭐⭐ | 英 | 多任务学习与元学习的完整框架,机器人案例贯穿全程 | 想从课程级理解 meta-learning 时 |
| 3 | Chelsea Finn on Meta Learning & Model-Based RL | The Gradient | https://thegradientpub.substack.com/p/chelsea-finn-on-meta-learning-and | 文字 ~25min | ⭐⭐ | 英 | "把先验知识压进网络初始化,比从零学快几个数量级" | 想快速摸清她的研究主线时 |
| 4 | Meta-Learning for Robots(Intel on AI Podcast) | Apple Podcasts | https://podcasts.apple.com/fr/podcast/meta-learning-for-robots/id1445844944?i=1000566494525 | ~40min | ⭐⭐ | 英 | 通俗版:什么是 MAML、为什么机器人需要它 | 第一次接触 meta-learning 时 |
3. Pieter Abbeel(Berkeley + Covariant 联创 + Robot Brains 主播)
定位:横跨学术界与工业界的"机器人 + RL 教父"。Covariant 做了第一个机器人基础模型 RFM-1。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | Pieter Abbeel: Deep Reinforcement Learning(Lex Fridman Podcast #10) | YouTube | https://www.youtube.com/watch?v=l-mYLq6eZPY | ~2h | ⭐⭐ | 英 | 从 OpenAI 早年聊到 RL 在机器人上的爆发期,回顾视角清晰 | 想看一次"RL 简史"时 |
| 2 | Reinforcement Learning for Industrial AI with Pieter Abbeel | TWiML | https://twimlai.com/podcast/twimlai/reinforcement-learning-for-industrial-ai | ~1h | ⭐⭐⭐ | 英 | Covariant 在仓库里怎么用 RL 做拣选——"99% 不够,要 99.99%" | 关心商业落地时 |
| 3 | Robot Brains Podcast: From OpenAI to Foundation Models for Robotics | Covariant 官网 | https://covariant.ai/insights/the-robot-brains-from-openai-to-developing-the-first-foundation-models-for-robotics/ | ~45min | ⭐⭐⭐ | 英 | RFM-1 设计哲学:把语言、视觉、动作都 tokenize 进同一个 transformer | 想理解"机器人基础模型"概念时 |
| 4 | Pieter Abbeel: Paving the Path to Generalizable Robotics | Scale AI Exchange | https://exchange.scale.com/public/videos/pieter-abbeel-generalizable-robotics-covariant-ai | ~30min | ⭐⭐ | 英 | 简洁演讲版:泛化是机器人下一个 10 年最大瓶颈 | 想 30 分钟看完精华时 |
4. Karol Hausman(Physical Intelligence 联创 / CEO,前 Google Brain)
定位:π0 / π0.5 / π1 的灵魂人物之一。从 Google RT-1/RT-2 时代延伸到 PI 创业。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | Karol Hausman, Co-Founder & CEO of Physical Intelligence(The Generalist 长文访谈) | The Generalist | https://www.generalist.com/p/karol-hausman-physical-intelligence | 长文 ~30min 阅读 | ⭐⭐ | 英 | "我们要造的是一个 brain that lives in any robot body"——硬件无关、任务无关 | 想全面理解 PI 公司战略时 |
| 2 | #38 Karol Hausman & Kevin Black: Building A Brain For Any Robot | Going Direct(Substack) | https://goingdirect.substack.com/p/38-karol-hausman-and-kevin-black-4b6 | ~1.5h | ⭐⭐⭐ | 英 | 联创内部对谈:π0 训练数据怎么收集、为什么用 flow matching | 看完 π0 论文后再听很清晰 |
| 3 | Training General Robots for Any Task(YouTube) | YouTube | https://www.youtube.com/watch?v=OJCT-HGxPjk | ~50min | ⭐⭐⭐ | 英 | "robotics 的瓶颈不是硬件,是数据规模和算法泛化" | 想纠正"机器人=机械臂硬件"误解时 |
| 4 | Karol 个人主页 | 个人博客 | https://karolhausman.github.io/ | — | ⭐⭐⭐ | 英 | 论文+演讲索引,最新研究在这里第一时间更新 | 关注他持续输出时 |
5. Russ Tedrake(MIT,TRI 副总裁)
定位:经典控制+学习派的桥梁。Diffusion Policy 推动者。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | Underactuated Robotics(MIT 教材 + 公开课主页) | MIT CSAIL | https://underactuated.csail.mit.edu/index.html | 全书+视频 | ⭐⭐⭐⭐ | 英 | 唯一一本把"机器人为什么会摔倒"讲清楚的免费教材,含可运行 Notebook | 想打底层动力学基础时(中长期) |
| 2 | MIT 6.832 Underactuated Robotics(OCW 2022 春季) | MIT OCW | https://ocw.mit.edu/courses/6-832-underactuated-robotics-spring-2022/ | ~24 lectures × 1.5h | ⭐⭐⭐⭐ | 英 | 配套视频版,2022 版含 Diffusion Policy 与 LfD 章节 | 教材看不下去时换视频 |
| 3 | underactuated(Tedrake 自己的 YouTube 频道) | YouTube | https://www.youtube.com/channel/UChfUOAhz7ynELF-s_1LPpWg | 多个 lecture | ⭐⭐⭐⭐ | 英 | Lecture 24(2024 春)专讲 Imitation Learning + Foundation Models | 跟踪他最新讲法时 |
6. Deepak Pathak(CMU + Skild AI 联创)
定位:自监督 / 好奇心驱动学习的代表,2024 年成立 Skild AI 估值飞涨。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | A Path to General Intelligence with Deepak Pathak | YouTube | https://www.youtube.com/watch?v=xZ7LR6NdOvo | ~1h | ⭐⭐⭐ | 英 | 自监督+好奇心的统一视角:内在奖励让机器人"自己找乐子学新技能" | 想理解"为什么不用人工奖励"时 |
| 2 | Robots that learn to generalize beyond training(Pathak 演讲) | YouTube | https://www.youtube.com/watch?v=ZOMxYjm7h2M | ~45min | ⭐⭐⭐ | 英 | 泛化的核心是"训练分布要覆盖部署分布"——sim2real 的本质 | 想理解 sim2real 时 |
| 3 | Curiosity-driven Exploration by Self-supervised Prediction(论文笔记主页) | Pathak 个人页 | https://pathak22.github.io/noreward-rl/ | 论文+视频 | ⭐⭐⭐⭐ | 英 | 经典之作:奖励=预测误差,越想不到的越值得学 | 想读他成名作时 |
| 4 | Pathak Talks and Papers(合集) | YouTube Playlist | https://www.youtube.com/playlist?list=PLG7T4DHrMiRXIdoiNXDW8yt3nvDeO5xRX | 10+ 视频 | ⭐⭐⭐ | 英 | 一个集合:从 noreward-rl 到 Skild AI 演讲全收 | 想沉浸式追一个学者时 |
7. Dieter Fox(NVIDIA Robotics 主管 + UW 教授)
定位:操控+感知+仿真的工业级整合者。GR00T 项目核心人物之一。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | Dieter Fox AI Symposium 2024 Keynote | YouTube | https://www.youtube.com/watch?v=vgqHR9gK9bQ | ~50min | ⭐⭐⭐ | 英 | NVIDIA 视角:仿真+大模型+机器人三件套如何被同时点燃 | 关心 NVIDIA 路线时 |
| 2 | Where is RobotGPT? | YouTube | https://www.youtube.com/watch?v=5e6QAMUQCsg | ~40min | ⭐⭐⭐ | 英 | "我们正进入机器人版 ChatGPT 时刻,但数据问题没那么容易" | 想看一线工业派的冷静判断时 |
| 3 | RSS 2024 Keynote: Generating Large Datasets for Robot Manipulation | RSS 官网 | https://roboticsconference.org/2024/program/keynote/ | ~50min | ⭐⭐⭐⭐ | 英 | 数据是核心:仿真 + 人类示范 + RL 三路并行喂模型 | 关心数据策略时 |
8. Fei-Fei Li 李飞飞(Stanford + World Labs 联创)
定位:「AI 教母」、ImageNet 之母,2024 年起力推「空间智能」(Spatial Intelligence)作为通向 AGI 的下一跳。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | 李飞飞长文中译《从语言到世界:空间智能是 AI 的下一个前沿》 | 澎湃新闻 | https://m.thepaper.cn/newsDetail_forward_31939684 | 中文 ~20min 阅读 | ⭐⭐ | 中(译) | "LLM 看懂的是 token 概率,看不懂三维结构——这是 AGI 必须跨过的坎" | 想用最少时间理解她最新立场时 |
| 2 | 李飞飞发文:空间智能将成 AI 攀登的下一座高峰(科技日报中文转载) | 中国科技网 | http://www.stdaily.com/web/gjxw/2025-11/13/content_431564.html | 中文 ~10min | ⭐ | 中 | 同篇文章的简短中文摘要版 | 想 5 分钟抓核心时 |
| 3 | Tim Ferriss × Fei-Fei Li: The Godmother of AI | Tim Ferriss 官网 | https://www.facebook.com/TimFerriss/posts/new-podcast-episode-is-up-dr-fei-fei-li-the-godmother-of-ai-asking-audacious-que/1409073980582613/ | ~1.5h | ⭐⭐ | 英 | 个人成长+学术决策视角,解释为什么从 ImageNet 走到 World Labs | 想看人物全貌时 |
9. Yann LeCun(Meta Chief AI Scientist)
定位:World Model / JEPA 路线最坚定的旗手,对纯 LLM 路线持续唱反调。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | This Is AGI(S1E10): Yann LeCun, JEPA and the World Model | YouTube | https://www.youtube.com/watch?v=9PBjt3SY-6A | ~1h | ⭐⭐⭐ | 英 | "人类做事前会先想象结果,AI 不会——这必须改变。JEPA 是缺失的那块" | 第一次接触 World Model 概念时 |
| 2 | EP20: Yann LeCun(The Information Bottleneck) | The Information Bottleneck | https://www.the-information-bottleneck.com/ep20-yann-lecun/ | ~1.5h | ⭐⭐⭐ | 英 | 详解为什么"scaling LLM"是死路、JEPA 怎么训练 | 想反思 LLM 万能论时 |
| 3 | Yann LeCun: LLMs Will NEVER Reach Human Level AI | YouTube | https://www.youtube.com/watch?v=wDeXfFQcJxk | ~30min | ⭐⭐ | 英 | 短版:4 个理由说明 LLM 不能成 AGI | 想要最短时间get他立场时 |
10. Andrej Karpathy(前 Tesla AI 总监 + Eureka Labs 创始人)
定位:神经网络教育第一人。Tesla 时代主导 FSD/Optimus 视觉栈。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | Andrej Karpathy: Tesla AI, Self-Driving, Optimus, Aliens, AGI(Lex Fridman #333) | YouTube | https://www.youtube.com/watch?v=cdiD-9MMpb0 | ~3.5h | ⭐⭐ | 英 | "FSD 已经是个 walking robot 在路上,Optimus 是把同一套软件搬到双足上" | 想看「自动驾驶 ↔ 人形机器人」共通技术时 |
| 2 | Andrej Karpathy 个人主页 | karpathy.ai | https://karpathy.ai/ | — | ⭐⭐⭐ | 英 | 索引:Zero to Hero 系列 + nanoGPT + 最新教学视频 | 想找他全部教学资源的入口时 |
| 3 | Andrej Karpathy on Tesla Bot | YouTube(Lex Clips 摘录) | https://www.youtube.com/watch?v=aWY2-KGCI_c | ~10min | ⭐⭐ | 英 | "Bot 是 Car 的近亲:去掉轮子加双腿,软件几乎一样" | 想 10 分钟理解他的"软件 2.0"机器人观时 |
二、国内学者(中文为主)
11. 王鹤(北大 + 银河通用 创始人/CTO)
定位:国内具身智能产业化最快的 PI 之一。合成数据派旗手。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | 王鹤主讲"北京大学博雅人工智能讲堂"第十五期"大模型赋能的人形机器人" | 北大教务长办公室 | https://provost.pku.edu.cn/xwdt/2fb1a0b19cbb454c824c15712eeae0c4.htm | 文字纪要 ~10min | ⭐⭐ | 中 | 大模型 + 合成数据 + 人形是国内"快进 5 年"的最优路径 | 想了解他主路线时 |
| 2 | 银河通用王鹤:重塑生产力 中国以具身智能引领产业发展 | 央广网科技 | http://tech.cnr.cn/techgd/20251227/t20251227_527474729.shtml | 文字 ~10min | ⭐ | 中 | 中国具身智能从"技术展示"走向真实产线落地 | 想看产业视角时 |
| 3 | 乌镇声音|北大王鹤:善用合成数据 推动人形机器人应用落地 | 光明网 | https://politics.gmw.cn/2025-11/07/content_38397392.htm | 文字 ~5min | ⭐ | 中 | "真实数据稀缺无法解,合成数据是必由之路"——技术核心理念一句话版 | 想 5 分钟抓他立场时 |
| 4 | 银河通用王鹤博士做客上科大:共探具身智能产业化未来 | 上科大 SIST | https://sist.shanghaitech.edu.cn/_t335/2026/0413/c2858a1120694/page.htm | 文字纪要 ~15min | ⭐⭐ | 中 | 完整讲座纪要:技术路径 + 商业模式 + 产学研合作 | 想看他完整体系时 |
12. 周博磊(UCLA,前港中文)
定位:可解释性 + RL + 具身控制。B 站强化学习中文公开课作者。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | 周博磊《强化学习纲要》B 站全套 | 哔哩哔哩(CSDN 索引页) | https://blog.csdn.net/qq_43616565/article/details/120403221 | 全 ~25 讲 | ⭐⭐⭐ | 中 | 国内最完整、最免费、最母语友好的 RL 入门课,从 MDP 到 PPO 全覆盖 | 中文学 RL 首选 |
| 2 | 中文大学周博磊变身 up 主,中文课程已上线(机器之心专访) | CSDN 博客 | https://blog.csdn.net/weixin_40920183/article/details/106718365 | 文字 ~10min | ⭐ | 中 | 课程开课背景 + 选材依据 + 配套作业 | 想知道课程怎么学时 |
13. 朱军(清华 + 生数科技 创始人)
定位:贝叶斯派代表,转向通用世界模型与多模态生成。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | 通用世界模型:连接数字世界与物理世界的桥梁(朱军 2026 中关村论坛主旨) | 中国科技网 | http://www.stdaily.com/web/gdxw/2026-04/02/content_496708.html | 文字 ~10min | ⭐⭐ | 中 | 视频生成模型可以演化为"通用世界模型",给具身智能提供物理常识 | 想理解 video → world model 路径时 |
| 2 | 专访清华朱军:大模型"投毒"怎么防? | 新京报 | https://m.bjnews.com.cn/detail/1774234951129179.html | 文字 ~15min | ⭐ | 中 | 安全 / 治理视角:技术派如何看 AI 治理 | 关心 AI 治理时 |
14. 林达华(上海 AI Lab)
定位:上海 AI 实验室的方向把舵者之一,主推开源大模型 InternLM。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | 林达华:大模型时代的 AI 产业分工将会被重塑(中国证券网) | 中国证券网 | https://news.cnstock.com/news,bwkx-202404-5209172.htm | 文字 ~5min | ⭐ | 中 | 数据优势 + 算力 + 开源生态 = 中国大模型路径,三足 | 想理解上海 AI Lab 战略时 |
15. 鲁继文(清华自动化系副主任)
定位:表示学习 / 视觉感知,近年扩展到自动驾驶和具身视觉。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | 鲁继文教授「视觉感知与自动驾驶」专题报告 | 西安工程大学 | https://jsjxy.xpu.edu.cn/info/1265/6031.htm | 文字纪要 ~10min | ⭐⭐ | 中 | 视觉感知是具身的"眼睛"——从识别到 3D 重建的进化路径 | 想从视觉角度理解具身时 |
| 2 | 清华大学副教授鲁继文应邀作线上学术报告(同济智信讲坛 193 期) | 同济视觉与智能学习实验室 | https://vill.tongji.edu.cn/info/1056/1446.htm | 文字纪要 ~10min | ⭐⭐ | 中 | 无监督表示学习 → 复杂对象的特征表示 → 下游具身任务 | 想看他研究脉络时 |
16. 刘恩佐(OmniH2O 等人形机器人项目核心,CMU/上海交大)
注:作为研究者本人公开访谈较少,主要通过技术解读获取。
| # | 标题 | 平台 | 链接 | 时长 | 难度 | 语言 | 一句话亮点 | 推荐时机 |
|---|---|---|---|---|---|---|---|---|
| 1 | OmniH2O:CMU 与上海交大联手打造的全能人形机器人系统(中文技术解读) | CSDN 博客 | https://blog.csdn.net/xiaobing259/article/details/146918932 | 文字 ~20min | ⭐⭐⭐ | 中 | RL+模仿+遥操作三结合:用人示范的视频直接学全身控制 | 想看一篇国产顶级 work 的中文解读时 |
| 2 | OmniH2O:通用灵巧的人-机器人全身遥操作和学习(论文中文逐段精读) | CSDN 博客 | https://blog.csdn.net/yorkhunter/article/details/143743060 | 文字 ~30min | ⭐⭐⭐⭐ | 中 | 论文级精读,含网络结构 + 训练流程 + 局限分析 | 想跟一篇 paper 时 |
| 3 | CMU×上交大搞出「全能机器人」!开放场景任务成功率超 90% | 53AI | https://www.53ai.com/news/zhinengyingjian/2025040503781.html | 文字 ~10min | ⭐⭐ | 中 | 高 level 解读,含视频 demo 链接 | 想 10 分钟看完一个 work 时 |
三、阅读路径建议(写给入门读者)
第 1 周(视野打开):
- Yann LeCun JEPA 演讲 → Fei-Fei Li 空间智能中文长文 → Karpathy × Lex Fridman → 王鹤博雅讲堂纪要
- 目标:知道领域里有哪几条主路线(World Model / Spatial Intelligence / 端到端 VLA / 合成数据)
第 2-4 周(建立技术基础):
- 周博磊《强化学习纲要》前 10 讲 + Levine CS285 前 5 讲(双语字幕)
- 目标:会用一句话解释 MDP / Policy Gradient / Q-Learning
第 5-8 周(深入具身):
- Levine Dwarkesh Podcast → Hausman Generalist 长文 → Tedrake 公开课 Lecture 24(Imitation + Foundation Models)→ OmniH2O 中文精读
- 目标:能看懂 π0 / RT-2 / OmniH2O 这些代表 work 的核心思路
第 9 周后(持续追踪):
- 关注 Hausman / Finn / Pathak 个人主页 + Pieter Abbeel 的 Robot Brains Podcast 新一期
- 关注国内:上海 AI Lab / 银河通用 / 智元 / 北大博雅讲堂的公开活动
附录:未找到 / 待确认条目
- ⚠️ 知乎高赞回答:Sergey Levine / Chelsea Finn 在知乎的中文专栏未直接搜到(推测国内并无官方账号);建议改用机器之心 / 量子位的访谈编译稿替代。
- ⚠️ 陈玉荣:在搜索结果中未直接命中具身智能相关访谈,可能需要更精确身份信息(哪所机构)才能定位。建议先跳过或换关键词。
- ⚠️ Latent Space podcast 中的具身相关 episode:本次未单独搜索,可后续补充。