网站Logo 青稞社区
青稞Talk青稞Tea青稞Talent关于青稞

热门领域 | PPT(提取码: r86c)

RL Infra(2)流水线并行(1)3D生成(2)空间智能(1)具身智能(1)3DGS(1)RAG(1)SGLang(1)大模型推理(4)多模态大模型(10)视觉语言大模型(4)视频生成(6)AIGC(10)推理大模型(4)大模型量化(7)4D生成(1)强化学习(11)视频编辑(1)大模型(33)AI Agent(8)
FlashRL:探讨现代 RL 框架中推理与训练的错位问题及解决方案

图片加载失败

FlashRL:探讨现代 RL 框架中推理与训练的错位问题及解决方案

2025-08-30 11:00
🎥 观看直播
强化学习
ROLL:面向 Agentic 场景的生产级大规模强化学习训练框架

图片加载失败

ROLL:面向 Agentic 场景的生产级大规模强化学习训练框架

2025-08-23 10:00
🎥 观看直播
RL Infra 强化学习 大模型
RLPR:基于参考概率奖励的强化学习,推广 RLVR 到通用领域推理问题

图片加载失败

RLPR:基于参考概率奖励的强化学习,推广 RLVR 到通用领域推理问题

2025-08-12 20:00
🎥 观看直播
强化学习 大模型
GSPO:大规模强化学习训练算法,迈向持续拓展的语言模型强化学习

图片加载失败

GSPO:大规模强化学习训练算法,迈向持续拓展的语言模型强化学习

2025-08-07 20:00
🎥 观看直播
大模型 强化学习
ProRL: 延长强化学习训练框架,拓展大语言模型的推理边界

图片加载失败

ProRL: 延长强化学习训练框架,拓展大语言模型的推理边界

2025-07-12 10:00
🎥 观看直播
强化学习 大模型 大模型推理
Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

图片加载失败

Satori-SWE:用 Evolutionary Test-Time Scaling 让小语言模型解决复杂软件工程

2025-07-05 10:00
🎥 观看直播
推理大模型 强化学习 大模型
大模型推理强化学习中的熵机制

图片加载失败

大模型推理强化学习中的熵机制

2025-07-01 20:00
🎥 观看直播
强化学习 推理大模型 大模型
从 TTS 到 TTRL:无标签数据强化学习探索与展望

图片加载失败

从 TTS 到 TTRL:无标签数据强化学习探索与展望

2025-05-14 20:00
🎥 观看直播
强化学习 大模型 推理大模型
从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化

图片加载失败

从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化

2025-04-22 09:00
🎥 观看直播
大模型 强化学习
B-STaR & SimpleRL-Zoo:通过强化学习自我提升推理性能和效率

图片加载失败

B-STaR & SimpleRL-Zoo:通过强化学习自我提升推理性能和效率

2025-04-19 11:00
🎥 观看直播
大模型 强化学习
PRIME: 结合隐式过程奖励的强化学习

图片加载失败

PRIME: 结合隐式过程奖励的强化学习

2025-02-22 11:00
🎥 观看直播
大模型 强化学习