8域机器人行为学习统一框架
基于CLI的模仿学习(Imitation Learning)框架,从专家演示中学习策略并在仿真中评估。汽车、无人机、人形机器人、机器狗的经典4域与移动操作、仓储AGV、智慧农业机器人、造船厂起重机的工业4域——共8个域在统一obs/action模式上通过3行命令完成初始化、训练和仿真。11个命令组(含edge部署)、Domain Plugin扩展架构。
Open Source8个域、5种策略模型、通过复杂度级别控制的统一工作流
Internal Schema Boundary — 每个域拥有固定维度模式,所有模块以一致方式通信。
| 汽车 (road) | 4D状态 + 2D动作 — CARLA联动,nuScenes适配器 |
|---|---|
| 无人机 (aerial) | 6D状态 + 3D动作 — AirSim骨架 |
| 人形机器人 | 12D状态 + 6D动作 — MuJoCo Humanoid-v5联动 |
| 机器狗 (quadruped) | 12D状态 + 8D动作 — MuJoCo Ant-v5联动 |
工厂、物流、农业、造船 — 每个域包含专用Mock模拟器和数据适配器。
| 移动操作 | 18D状态 + 8D动作 — 推荐模型:ACT |
|---|---|
| 仓储AGV (warehouse) | 14D状态 + 4D动作 — 推荐模型:BC-RNN |
| 智慧农业机器人 | 16D状态 + 6D动作 — 推荐模型:Diffusion |
| 造船厂起重机 (shipyard) | 20D状态 + 9D动作 — 推荐模型:ACT |
| BC-MLP | 基础行为克隆(最快学习速度) |
|---|---|
| BC-RNN | 时序行为克隆 |
| BC-CNN | 基于视觉的行为克隆 |
| ACT | Action Chunking Transformer(操作SOTA) |
| Diffusion Policy | 基于扩散模型的策略 (DDPM) |
| L0 (Toy) | Mock模拟器 + BC-MLP — 教程/CI用 |
|---|---|
| L1 (Intermediate) | 域推荐模型 + Mock — 算法研究 |
| L2 (Advanced) | 真实后端 (CARLA/MuJoCo/Isaac Lab) + SOTA模型 |
从合成数据生成到仿真rollout的完整管线
合成数据生成、外部数据采集、增强、编辑——完整的数据工作流通过CLI完成。
在仿真中运行已学习的策略,并自动计算评估指标。
11个命令组(含edge部署)覆盖完整工作流
init从角色/级别自动生成YAML配置。
train训练BC策略。支持续训、GPU、检查点、项目追踪。
simrollout/replay — 在仿真中运行策略并评估。
datapull, ingest, augment, edit — 执行数据管线。
modelexport/load — 管理模型卡(SafeTensors + config.json)。
skill内置技能查询、初始化、跨域迁移。
deploy通过MessageBridge(mock/ROS2/ZeroMQ)部署策略。
scenario边角案例场景构建及套件运行。
edge边缘部署——模型量化、打包和设备推送。
validateYAML配置文件验证(50+规则)。
4层抽象栈将角色、配置、学习和评估分离
| Layer 4 | Skill/Meta-Agent — 基于角色/任务的推荐 |
|---|---|
| Layer 3 | Config/Validator — YAML清单 + 50+验证规则 |
| Layer 2 | Data/Model/Training — 管线、策略网络、BCTrainer |
| Layer 1 | Sim/Eval/Backend — 模拟器、评估、轨迹 |
| 语言 | Python 3.12+ |
|---|---|
| 框架 | PyTorch, Gymnasium |
| 模拟器 | Mock(内置), CARLA, MuJoCo |
| 日志 | W&B, MLflow(可选) |
| 模型格式 | SafeTensors + config.json |
| 错误格式 | 3行格式 (Category / Fix / See) |
通过分步指南快速掌握EulerAtlas
教程即将公开。
安装EulerAtlas并训练您的第一个策略
Python 3.12+, PyTorch
MuJoCo, W&B(可选)