青稞AMA

· 青稞AMA

直播预告｜从 MiniLLM 开始，为什么 OPD 正在成为推理模型时代的“基础设施”？

过去一年里，OPD 几乎成为后训练领域最火热的话题之一。越来越多工作开始发现：学生模型并不只是“模仿教师” On-policy 数据可能比静态 SFT 数据

阅读更多
227
· 青稞AMA

直播预告！深度探讨：世界模型（World Model）是进化终点还是视觉幻象？

物理智能的“预言家”：世界模型（World Model）是进化终点还是视觉幻象？在具身智能的演进历程中，我们正处于从“机械模仿”向“认知决策”跨越的关键节点。早期的模型主要依赖行为克隆，但在涉及精密操作时难以为继。如今，世界模型正成为连接数字智慧与物理交互的桥梁，它不仅让机器人知道“做什么”，更

阅读更多
222
· 青稞AMA

Agent如何“在经验中成长”：关于自进化的关键问题与技术路径对谈

回顾刚过去的2025年，AI领域最引人注目的范式转移正在悄然发生。如果说大语言模型的"顿悟时刻"是让机器学会了思考，那么Agent自进化的"镜像时刻"，则让AI第一次拥有了"从经验中成长"的能力。它不再是静态的工具，而是一个能够与环境持续交互、从失败中学习、在任务中迭代策略的数字生命体。这不是

阅读更多
845