·
青稞AMA
直播预告|从 MiniLLM 开始,为什么 OPD 正在成为推理模型时代的“基础设施”?
过去一年里,OPD 几乎成为后训练领域最火热的话题之一。 越来越多工作开始发现: 学生模型并不只是“模仿教师” On-policy 数据可能比静态 SFT 数据
阅读更多
16