从 LLM-RL 到 Agentic RL:如何让语言模型成为自主智能体

直播时间:
H5 YouTube Bilibili

Canvas – 831.png

9月18日(周四)晚8点,青稞Talk 第78期,新加坡国立大学博士生张桂彬,将直播分享《从 LLM-RL 到 Agentic RL:如何让语言模型成为自主智能体》。

分享嘉宾

张桂彬是新加坡国立大学计算学院博士研究生,导师为颜水成教授,研究方向为Multi-Agent System,Agent Memory和Self-Evolving Agent,目前在NeurIPS、ICML、ICLR、KDD、TKDE等顶级会议/期刊发表论文十余篇。他发表了Graph for Agent系列工作,包括G-Designer【ICML 2025 Oral】,G-Safeguard【ACL 2025】,以及G-Memory。其他工作如MaAS【ICML 2025 Oral】,AgentPrune【ICLR 2025】也受到关注。

主题提纲

从 LLM-RL 到 Agentic RL:如何让语言模型成为自主智能体

1、为什么需要 Agentic RL?
2、统一理论框架:用 POMDP 把“LLM 当 policy”
3、基于 RL,Agentic LLM 与环境之间的动态交互过程
4、在复杂环境中的应用及未来研究探讨

直播时间

9月18日20:00 - 21:00