Simulation & Sim2Real · Plate Nº 107

Isaac Lab

6 min read · 1944 字 · ⭐⭐⭐ · 短摘要

#manipulation #locomotion #RL #sim2real #dataset

本笔记基于摘要 + 公开资料，未读全文。

一句话讲什么（TL;DR）

机器人在电脑里"练功"的虚拟训练场。以前练得飞快但看不清画面，画面漂亮又练得慢；Isaac Lab 把这两件事捏到了一起。

这是个什么场景

想象你要教一个新手厨师颠勺。直接让他上真灶台太贵——油溅了、锅砸了都是钱。聪明的做法是先在"模拟厨房"里练个几千遍，再上真灶。机器人也一样：直接拿真机训练，摔坏一个人形机器人就是几十万。所以大家都在电脑里盖一个"虚拟健身房"，让机器人在里面摔个百万次，再把学会的动作复制回真机。

但虚拟健身房有个老问题：

只想练动作的房间（Isaac Gym 前辈）：像没开灯的健身房——动作算得飞快，每秒练几千次，但你看不见画面，机器人也"看不见"东西。
画面漂亮的房间（Isaac Sim）：像影视片场——灯光、阴影、相机都很真，但训练慢，更像拍样片而不是练功。
Isaac Lab（本文）：把"地下健身房"和"影视片场"打通——同一个屋子里，既能高速颠勺一百万次，也能在需要的时候开灯看清画面。

机器人训练里最头疼的事叫 sim-to-real gap（仿真到真机的落差）：在电脑里练得很溜，搬到真机就翻车。原因常常是仿真里看到的画面太假、传感器太糙。Isaac Lab 要做的，就是把这条"从仿真走到真机"的桥铺平一点。

之前的人怎么做的 — 3-5 bullet

Isaac Gym（2021）：GPU 上跑物理 + RL 训练，速度快了几十倍，但渲染粗糙，传感器只有简化版。
MuJoCo / PyBullet：CPU 仿真器，物理精度好，但并行能力差，渲染更弱。
Webots / Gazebo（ROS 系）：偏工程化，资产丰富但训练吞吐量不够。
Omniverse Isaac Sim：渲染和场景非常漂亮，但偏向"演示和数字孪生"，RL 训练 pipeline 不顺手。
结果：研究者要么"快但难看"，要么"漂亮但慢"，没法一站式拿到 perception + control 的端到端训练。

这篇论文的关键想法

像合并两间工坊：一间专做"练动作"（Isaac Gym），一间专做"做画面"（Isaac Sim）。Isaac Lab 把两间合到同一个屋檐下，再用三个小巧思解决"既要快又要真"的老矛盾：

多频率仿真（multi-rate simulation）：像家里的电器各有节奏——空调每秒检测一次温度，闹钟每分钟跳一格。物理引擎跑得最快（1kHz），相机慢一点（30Hz），IMU 中速（200Hz），各跑各的，不强行对齐。
渲染画质可切换：训练阶段用"草图模式"（快速光栅化）狂练；快上真机时切到"电影模式"（光线追踪）让画面更接近真实，减小视觉落差。
统一接口：人形、机械臂、四足狗、无人机都接同一个插座（API）。写一份配置文件就能换机器人，不用每种重写一套。

它怎么做的（方法）

第一段：分三层楼盖房子。像一栋楼分地基—中间—顶楼。地基是 Omniverse / PhysX 5（NVIDIA 的 GPU 物理引擎，负责"力学"计算）；中间是 Isaac Lab 自己写的"环境抽象层"，把强化学习需要的四件套（reset 重置、step 走一步、observation 观察、reward 奖励）做成统一接口；顶楼才是具体任务，比如走路、抓东西、导航。地基换了，顶楼的任务代码也不用改。

第二段：传感器各按各的钟点上班。像办公楼里有人 9 点打卡、有人 10 点打卡，调度员不强行让所有人同时到。每个物理 tick（最小时间步）里，调度器只唤醒那些"该刷新"的传感器。这样 1024 个机器人同时训练时，相机不会拖累整条流水线。具体吞吐数字需读原文。

等等，先慢一拍 — 什么是"渲染 backend"？就是"画画的引擎"。同一个场景你可以让铅笔素描（快但糙）来画，也可以让油画大师（慢但真）来画。

第三段：三种画师任你选。栅格化（最快，训练用，类似铅笔素描）；路径追踪 / 光追（最真，做 sim-to-real 时用，类似油画）；Hydra render delegate（按 OpenUSD 标准对接外部工具，类似把画稿交给别人继续修）。训练阶段用快的，验收阶段切到慢的。

第四段：开源菜谱社区。所有任务都是开源 Python 配置加 URDF/USD（机器人和场景的"建筑图纸"）资产，谁都能贡献新机器人、新场景。这和 Isaac Gym 时代很不一样——以前菜谱主要由 NVIDIA 自己写。

实验在做什么

具体实验配置和数字需读原文，但根据这类系统论文的惯例：

吞吐量基准：在不同 GPU（H100 / A100 / 4090）上跑 1k / 4k / 16k 并行 env，测每秒 step 数。
任务复现：把 Isaac Gym 上经典的 locomotion / manipulation 任务迁移过来，看训练曲线是否对齐或更好。
sim-to-real 验证：在 Isaac Lab 训出策略，部署到真机（如 Unitree H1、ANYmal、Franka），看 success rate 和 zero-shot transfer 表现。
多机器人异构：同一脚本里训练人形、四足、机械臂，验证 API 通用性。

你应该懂的几个新词 — 4-6 个

Isaac Gym：NV 2021 年开源的 GPU 物理 + RL 框架，本论文的前身。
Omniverse / OpenUSD：NV 主推的 3D 协作平台和场景描述格式，类比 Photoshop 之于图像，USD 之于 3D 场景。
PhysX 5：NV 的 GPU 物理引擎，支持 rigid body / soft body / 关节动力学。
多频率仿真（multi-rate simulation）：不同传感器/控制器以各自真实频率运行，避免被最高频拖累。
sim-to-real gap：在仿真器训出来的策略放到真机时性能下降的现象，是具身 AI 的核心难题。
domain randomization：训练时随机化光照、纹理、摩擦、质量等参数，让策略更鲁棒，是缩小 sim-to-real gap 的常用手段。

它和其他论文什么关系

直接前身：Isaac Gym（Makoviychuk 2021）—— 提供了 GPU 并行 RL 这个核心能力。
同代竞品：Genesis（2024 大学联合）、MuJoCo MJX（Google DeepMind 把 MuJoCo 上 GPU/TPU）、Brax（Google 的 JAX 物理引擎）、Drake（MIT，偏 control 严谨度）。
下游用户：几乎所有 2024-2026 的 humanoid locomotion 论文（H1、G1、Atlas 系）和很多 manipulation/whole-body control 工作都开始默认用 Isaac Lab。
方向上和 RoboCasa / Habitat 互补：后者专注 home/indoor 大场景资产，Isaac Lab 提供物理 + 渲染底座。

我建议这样读 — 3-4 步

先看官方 GitHub README 和 docs 的 quickstart，跑通一个 cartpole 或 ant 例子，对"环境抽象层"建立直观认知。
读论文的"架构图 + 多频率仿真"那一节，理解为什么这套抽象比 Isaac Gym 灵活。
跳到"benchmarks / sim-to-real 案例"看真机数字，决定是否值得迁移自己的项目。
如果你做 humanoid 或 manipulation，去 GitHub 翻 isaaclab_tasks，照着改一个任务比读完整论文更高效。

为什么值得读

2025-2026 具身 AI 的事实标准：人形 / 四足 / manipulation 论文里出现频率非常高，不熟它会读不懂别人的实验设置。
工程值得学：多频率调度、渲染 backend 抽象、资产 USD 化——这些是仿真平台设计的通用模式，不只对机器人有用。
门槛降低：相比 Isaac Gym，新手在 1-2 天内就能跑通自己的任务，写 paper 时省下来的工程时间可以投入到 idea 验证。
生态会持续：NV 在押人形和具身 AI，这条线在可见未来不会被废弃，学会回报期长。

◼

引用本笔记 / Cite this note

BibTeX

@online{eai_isaac_lab_2026,
  title       = {(readable note) Isaac Lab},
  author      = {Zhou, Jason},
  year        = {2026},
  note        = {Note on a 2025 paper},
  howpublished = {\url{https://estelledc.github.io/embodied-ai-reading-station/papers/isaac-lab/}},
  organization = {Embodied AI Reading Station}
}

All 156 papers (full index)