分享嘉宾

张桂彬是新加坡国立大学计算学院博士研究生，导师为颜水成教授，研究方向为Multi-Agent System，Agent Memory和Self-Evolving Agent，目前在NeurIPS、ICML、ICLR、KDD、TKDE等顶级会议/期刊发表论文十余篇。他发表了Graph for Agent系列工作，包括G-Designer【ICML 2025 Oral】，G-Safeguard【ACL 2025】，以及G-Memory。其他工作如MaAS【ICML 2025 Oral】，AgentPrune【ICLR 2025】也受到关注。

主题提纲

从 LLM-RL 到 Agentic RL：如何让语言模型成为自主智能体

1、为什么需要 Agentic RL？
2、统一理论框架：用 POMDP 把“LLM 当 policy”
3、基于 RL，Agentic LLM 与环境之间的动态交互过程
4、在复杂环境中的应用及未来研究探讨

直播时间

9月18日20:00 - 21:00

从 LLM-RL 到 Agentic RL：如何让语言模型成为自主智能体

直播平台

相关资源

分享嘉宾

主题提纲

直播时间