7月5日(周六)上午10:00,青稞Talk 第60期,新加坡科技设计大学博士生曾广韬,将直播分享《Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程》。
分享嘉宾
曾广韬,新加坡科技设计大学的四年级博士生,研究方向为 Large Language Model 以及 Reasoning;在ACL、EMNLP等顶级会议和期刊上,以第一作者或共同第一作者的身份发表了5+ 篇论文,其谷歌学术引用量超过1000次 。
主题提纲
Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程
1、小语言模型的性能瓶颈
2、EvoScale:从 patch 生成转变为迭代式“进化”过程
3、classical SFT、mutation SFT 和针对性 RL 流程解析
4、Satori-SWE-32B 模型性能验证
成果连接
Paper:Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering
Abs:https://arxiv.org/abs/2505.23604
HuggingFace:https://huggingface.co/Satori-reasoning
Github:https://github.com/satori-reasoning/Satori-SWE
直播时间
7月5日(周六)上午10:00 - 11:00
参与方式
Talk 将在青稞·知识社区上进行,扫码对暗号:" 0705 ",报名进群!