Chain-of-Model (模型链):引入因果建模,全新的大模型 Scaling 结构

📅 直播时间:2025-06-09 20:00 🎥 观看直播

Canvas – 738.png

6月9日20:00,青稞Talk 第53期,论文成果一作、微软亚洲研究院高级研究员宋恺涛,将直播分享《Chain-of-Model (模型链):引入因果建模,全新的大模型 Scaling 结构》。

分享嘉宾

宋恺涛,微软亚洲研究院高级研究员,博士毕业于南京理工大学。其主要研究方向为自然语言处理,大语言模型,AI智能体、语音识别等。其在顶级学术会议和期刊上发表了超过40余篇论文,谷歌学术引用数超过12K。代表作包括HuggingGPT,MASS,MPNet,Muzic等学术成功,并在开源社区获得超过30K stars。曾担任ICML、NeurIPS、ICLR、ACL、EMNLP等会议的程序委员会成员。

主题提纲

Chain-of-Model (模型链):引入因果建模,全新的大模型 Scaling 结构

1、大模型中的 Scaling Law 以及 Scaling 架构发展
2、从表征链(CoR)到模型链(CoM),表征学习新范式
3、Transformer 架构的链式改造:CoLM 与 CoLM-Air
4、CoM/CoLM 范式的验证与使用

直播时间

6月9日20:00 - 21:00

参与方式

Talk 将在青稞·知识社区上进行,扫码对暗号:" 0609 ",报名进群!