Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

📅 直播时间:2025-07-05 10:00 🎥 观看直播

Canvas – 773.png

7月5日(周六)上午10:00,青稞Talk 第60期,新加坡科技设计大学博士生曾广韬,将直播分享《Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程》。

分享嘉宾

曾广韬,新加坡科技设计大学的四年级博士生,研究方向为 Large Language Model 以及 Reasoning;在ACL、EMNLP等顶级会议和期刊上,以第一作者或共同第一作者的身份发表了5+ 篇论文,其谷歌学术引用量超过1000次 。

主题提纲

Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

1、小语言模型的性能瓶颈
2、EvoScale:从 patch 生成转变为迭代式“进化”过程
3、classical SFT、mutation SFT 和针对性 RL 流程解析
4、Satori-SWE-32B 模型性能验证

成果连接

Paper:Satori-SWE: Evolutionary Test-Time Scaling for Sample-Efficient Software Engineering
Abs:https://arxiv.org/abs/2505.23604
HuggingFace:https://huggingface.co/Satori-reasoning
Github:https://github.com/satori-reasoning/Satori-SWE

直播时间

7月5日(周六)上午10:00 - 11:00

参与方式

Talk 将在青稞·知识社区上进行,扫码对暗号:" 0705 ",报名进群!