VLA模型已成为使机器人在真实环境中解决各类复杂操作任务极具前景的新范式,其发展仍受限于数据稀缺与泛化能力不足等问题,而强化学习能缓解数据依赖并显著提升模型性能与泛化性,正受到广泛关注。

本次报告将解读所提出的专为VLA模型设计的高效强化学习框架SimpleVLA-RL,内容主要分为三部分:
- • 首先概述VLA训练范式,并阐述引入强化学习的必要性;
- • 接着将详解SimpleVLA-RL架构设计;
- • 最后,展望VLA强化学习领域的未来发展趋势。

论文:SimpleVLA-RL: Open RL Framework for Vision–Language–Action Models
链接:https://arxiv.org/abs/2509.09674
代码:https://github.com/PRIME-RL/SimpleVLA-RL
11月1日(周六)上午10点,青稞Talk 第84期,清华大学博士生李昊展,将直播分享《SimpleVLA-RL:简单可拓展的VLA强化学习训练》。
分享嘉宾
李昊展,清华大学博士生,SimpleVLA-RL一作,TsinghuaC3I实验室,周伯文、丁宁教授联合指导。研究领域:大模型强化学习,VLA模型强化学习。
主题提纲
SimpleVLA-RL:简单可拓展的VLA强化学习训练
1、VLA训练范式,以及引入RL的必要性
2、SimpleVLA-RL 架构设计
3、VLA强化学习领域的未来发展趋势
直播时间
11月1日(周六)10:00 - 11:00
嘉宾已经入驻青稞社区·知识星球,想要提问交流的朋友可以加入星球!
![]()