网站Logo 青稞社区
青稞Talk青稞Tea青稞Trailblazers关于
登录

热门领域 | PPT(提取码: r86c)

3D生成(1)空间智能(1)具身智能(1)3DGS(1)RAG(1)SGLang(1)大模型推理(4)多模态大模型(9)视觉语言大模型(4)视频生成(5)AIGC(9)推理大模型(4)大模型量化(7)4D生成(1)强化学习(7)视频编辑(1)大模型(28)AI Agent(7)
ProRL: 延长强化学习训练框架,拓展大语言模型的推理边界

图片加载失败

ProRL: 延长强化学习训练框架,拓展大语言模型的推理边界

2025-07-12 10:00
🎥 观看直播
强化学习 大模型 大模型推理
Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

图片加载失败

Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

2025-07-05 10:00
🎥 观看直播
推理大模型 强化学习 大模型
大模型推理强化学习中的熵机制

图片加载失败

大模型推理强化学习中的熵机制

2025-07-01 20:00
🎥 观看直播
强化学习 推理大模型 大模型
从 TTS 到 TTRL:无标签数据强化学习探索与展望

图片加载失败

从 TTS 到 TTRL:无标签数据强化学习探索与展望

2025-05-14 20:00
🎥 观看直播
强化学习 大模型 推理大模型
从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化

图片加载失败

从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化

2025-04-22 09:00
🎥 观看直播
大模型 强化学习
B-STaR & SimpleRL-Zoo:通过强化学习自我提升推理性能和效率

图片加载失败

B-STaR & SimpleRL-Zoo:通过强化学习自我提升推理性能和效率

2025-04-19 11:00
🎥 观看直播
大模型 强化学习
PRIME: 结合隐式过程奖励的强化学习

图片加载失败

PRIME: 结合隐式过程奖励的强化学习

2025-02-22 11:00
🎥 观看直播
大模型 强化学习