网站Logo 青稞社区
青稞Talk青稞's
登录

热门领域 | PPT(提取码: r86c)

3DGS(1)RAG(1)SGLang(1)大模型推理(2)多模态大模型(5)视觉语言大模型(4)视频生成(5)AIGC(8)推理大模型(2)大模型量化(7)4D生成(1)强化学习(4)视频编辑(1)大模型(24)AI Agent(6)
Sparse VideoGen:无需重新训练的 DiTs 推理加速框架

图片加载失败

Sparse VideoGen:无需重新训练的 DiTs 推理加速框架

2025-05-29 09:00
🎥 观看直播
视频生成 大模型量化
COAT:显存高效的 FP8 训练,实现高效深度学习

图片加载失败

COAT:显存高效的 FP8 训练,实现高效深度学习

2025-03-22 11:00
🎥 观看直播
大模型 大模型量化
LLMC:大语言模型压缩工具的开发实践

图片加载失败

LLMC:大语言模型压缩工具的开发实践

2024-12-16 20:00
🎥 观看直播
大模型量化 大模型
DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化

图片加载失败

DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化

2024-11-05 19:00
🎥 观看直播
大模型量化 大模型
LLMC:大语言模型的量化基准

图片加载失败

LLMC:大语言模型的量化基准

2024-10-11 19:00
🎥 观看直播
大模型量化 大模型
S-LoRA:实现多 LoRA 大模型的高效并行化推理

图片加载失败

S-LoRA:实现多 LoRA 大模型的高效并行化推理

2024-08-26 11:00
🎥 观看直播
大模型 大模型量化
AWQ:激活值感知的LLM低位权重量化

图片加载失败

AWQ:激活值感知的LLM低位权重量化

2024-08-14 19:00
🎥 观看直播
大模型量化 大模型