青稞社区

热门领域｜ PPT（提取码: r86c）

3D生成(1)空间智能(1)具身智能(1)3DGS(1)RAG(1)SGLang(1)大模型推理(4)多模态大模型(9)视觉语言大模型(4)视频生成(5)AIGC(9)推理大模型(4)大模型量化(7)4D生成(1)强化学习(7)视频编辑(1)大模型(28)AI Agent(7)

ProRL: 延长强化学习训练框架，拓展大语言模型的推理边界

ProRL: 延长强化学习训练框架，拓展大语言模型的推理边界

2025-07-12 10:00

🎥 观看直播

强化学习大模型大模型推理

Satori-SWE：用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

Satori-SWE：用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

2025-07-05 10:00

🎥 观看直播

推理大模型强化学习大模型

大模型推理强化学习中的熵机制

大模型推理强化学习中的熵机制

2025-07-01 20:00

🎥 观看直播

强化学习推理大模型大模型

从 TTS 到 TTRL：无标签数据强化学习探索与展望

从 TTS 到 TTRL：无标签数据强化学习探索与展望

2025-05-14 20:00

🎥 观看直播

强化学习大模型推理大模型

从 TinyZero 到 APR：语言模型推理能力的探索与自适应并行化

从 TinyZero 到 APR：语言模型推理能力的探索与自适应并行化

2025-04-22 09:00

🎥 观看直播

大模型强化学习

B-STaR & SimpleRL-Zoo：通过强化学习自我提升推理性能和效率

B-STaR & SimpleRL-Zoo：通过强化学习自我提升推理性能和效率

2025-04-19 11:00

🎥 观看直播

大模型强化学习

PRIME: 结合隐式过程奖励的强化学习

PRIME: 结合隐式过程奖励的强化学习

2025-02-22 11:00

🎥 观看直播

大模型强化学习