机器人学习、VLA模型、仿真到现实迁移
具身智能(Embodied AI)研究如何让AI通过物理身体与环境交互学习,是通往通用人工智能的关键路径。
Vision-Language-Action模型将视觉感知、语言理解和动作控制统一,代表模型包括RT-2、OpenVLA。
通过域随机化、域适应等技术,将在仿真环境训练的策略迁移到真实机器人。