11月4日(周二)晚8点,青稞Talk 第85期,NUS AI Researcher倪瑾杰,将直播分享《OpenMoE 2: Sparse Diffusion Language Models》,聊一聊为什么 Diffusion MoE 可能是下一代大模型架构方向。
分享嘉宾
倪瑾杰,NUS AI Researcher, 研究兴趣包括Large language models;pretraining; Diffusion language models; Reinforcement learning for LLM reasoning; Model architectures。
主题提纲
OpenMoE 2: Sparse Diffusion Language Models
1、Diffusion Language Model 概述
2、OpenMoE 2:DLM + MoE
- Diffusion MoE 的可调密度与灵活计算
- 多轮训练(multi-epoch)下的对比分析
3、未来研究的探讨
直播时间
11月4日(周二)20:00 - 21:00
如何观看
Talk 将在青稞社区【视频号:青稞AI、Bilibili:青稞AI】上进行直播!
同时,嘉宾已经入驻青稞社区·知识星球,想要提问交流的朋友可以加入星球!
![]()