青稞Talk

· 青稞Talk

PRIME: 结合隐式过程奖励的强化学习

2月22日上午11点，青稞Talk 第39期，上海人工智能实验室青年科学家崔淦渠，将直播分享《PRIME: 结合隐式过程奖励的强化学习》。主讲嘉宾崔淦渠，上海人工智能实验室青年科学家，博士毕业于清华大学计算机系，导师为刘知远副教授。研究方向为大语言模型的对齐与强化学习技术。在ICML, Neur

阅读更多
171
· 青稞Talk

Satori：通过训练LLM做自回归搜索来增强推理能力

2月15日上午11点，青稞Talk 第38期，Satori第一作者、MIT博士生沈茂昊，将直播分享《Satori：通过训练LLM做自回归搜索来增强推理能力》。主讲嘉宾沈茂昊，MIT EECS系四年级博士生，长期和MIT-IBM Watson AI lab 合作，本科毕业于UIUC ECE系。研究

阅读更多
77
· 青稞Talk

Motion Dreamer：面向自动驾驶与物理世界对齐的视频生成模型

1月14日19:00，青稞Talk 第37期，香港科技大学（广州）博士生许添硕，将直播分享《Motion Dreamer：面向自动驾驶与物理世界对齐的视频生成模型》。主讲嘉宾许添硕，香港科技大学（广州）博士生，导师为陈颖聪教授，研究兴趣是自动驾驶、视频生成。主题提纲 Motion Dreame

阅读更多
113
· 青稞Talk

Follow Family：可控视频生成方法探索与应用

主讲嘉宾马跃，香港科技大学计算机博士生，清华大学电子信息硕士，主要研究领域是视频生成、图片生成等，曾在百度，腾讯 AI Lab，腾讯混元作为算法研究实习，在NeurIPS，Siggraph，AAAI，CVPR，TMM等发表多篇高水平文章，曾经获得北京市优秀毕业生等荣誉称号。主题提纲 Follow

阅读更多
154
· 青稞Talk

Tuning-Free Enhence：通过噪声初始化和采样轨迹优化增强预训练扩散模型

12月28日11点，青稞Talk 第35期，香港科技大学广州博士生周子凯，将直播分享《Tuning-Free Enhence：通过噪声初始化和采样轨迹优化增强预训练扩散模型》。主讲嘉宾周子凯，香港科技大学广州博士生。研究方向为扩散模型与模型压缩，发表IJCAI，NIPS等多篇论文。主题提纲 T

阅读更多
130
· 青稞Talk

K-Sort Arena：视觉生成模型的高效人类偏好竞技场

12月24日20点，青稞Talk 第34期，中国科学院自动化研究所博士生、新加坡国立大学访问博士生李志凯，将直播分享《K-Sort Arena：视觉生成模型的高效人类偏好竞技场》。主讲嘉宾李志凯，中国科学院自动化研究所博士生，新加坡国立大学访问博士生。研究方向为高效深度学习和模型压缩，以第一作者

阅读更多
158
· 青稞Talk

XGrammar：高效实现 LLM灵活且可移植的结构化生成

12月21日11点，青稞Talk 第33期，CMU 博士生董易昕，将直播分享《XGrammar：高效实现 LLM灵活且可移植的结构化生成》。分享嘉宾董易昕，卡内基梅隆大学计算机科学系的一年级博士生，导师为陈天奇教授；本科毕业于上海交通大学计算机科学专业（ACM班）；研究聚焦于机器学习与系统的交叉

阅读更多
203
· 青稞Talk

LLMC：大语言模型压缩工具的开发实践

12月16日晚8点，青稞Talk第32期，商汤科技研究院谷石桥和雍洋两位模型压缩研究员，将对LLMC进行直播分享，主题为《LLMC：大语言模型压缩工具的开发实践》。他们将从工具框架设计，常用算法解读和工具使用方式等角度，为大家详细讲解LLMC及实践，希望大家可以从中获益。主讲嘉宾谷石桥，商汤科

阅读更多
135
· 青稞Talk

Rectified Flow：矫正流生成式模型的概念及应用实践

12月14日11点，青稞Talk 第31期，深度求索(DeepSeek)研究员、UT Austin博士刘星超，将直播分享《Rectified Flow：矫正流生成式模型的概念及应用实践》。主讲嘉宾刘星超，深度求索(DeepSeek)研究员，UT Austin博士，师从刘强教授。研究兴趣是生成式模

阅读更多
230
· 青稞Talk

OminiParser：基于纯视觉的 GUI Agent

11月30日上午11点，微软研究院 AI Frontiers 实验室高级研究员鲁亚东，将直播分享《OminiParser：基于纯视觉的 GUI Agent》。主讲嘉宾鲁亚东，微软研究院 AI Frontiers 实验室高级研究员。研究兴趣主要集中在大型视觉语言模型上，专注于构建能够在图形用户界面

阅读更多
134
· 青稞Talk

VILA^2 :视觉语言模型能力的自我提升

主讲嘉宾方云浩，本科毕业于浙江大学，硕士毕业于UCSD（苏昊教授），自24年2月起在Nvidia VILA团队实习（陆垚博士、韩松教授）。主要科研方向是大模型相关的1. 推理能力（通过探索提升推理上限: Unleashing the Creative Mind；通过演绎验证获得可靠思维链: Ded

阅读更多
107
· 青稞Talk

DuQuant：基于正交变换实现大型语言模型的 SOTA级 4 bit 量化

11月5日19点，青稞Talk 第28期，中科院自动化所和香港城市大学联合培养博士生林浩坤，将直播分享《DuQuant：基于正交变换实现大型语言模型的 SOTA级 4 bit 量化》。DuQuant 的论文在NeurIPS 2024 上获得 88877 的分数并被接收为Oral。主讲嘉宾林浩坤

阅读更多
215
· 青稞Talk

GenAD & Vista：构建通用可泛化的自动驾驶世界模型

10月17日19点，青稞Talk 第27期，香港科技大学在读博士高深远，将直播分享《GenAD & Vista：构建通用可泛化的自动驾驶世界模型》。主讲嘉宾高深远，香港科技大学在读博士，研究兴趣主要围绕具身场景中世界模型的构建及应用。曾在CVPR、NeurIPS、ECCV以第一作者身份发表多篇论

阅读更多
110
· 青稞Talk

VITA：开源交互式多模态基础大模型

10月14日19点，青稞Talk 第26期，VITA 第一作者，南京大学智能科学与技术学院研究员、助理教授、博导傅朝友，将直播分享《VITA：开源交互式多模态基础大模型》。主讲嘉宾傅朝友，南京大学智能科学与技术学院研究员，助理教授，博导。2022年博士毕业于中国科学院自动化研究所，2022年-2

阅读更多
142
· 青稞Talk

LLMC：大语言模型的量化基准

10月11日晚7点，青稞Talk 第25期，商汤科技算法实习生、香港科技大学准博士生黄雨石，将直播分享《LLMC:大语言模型的量化基准》。主讲嘉宾黄雨石，本科毕业于北京航空航天大学，即将进入香港科技大学攻读计算机博士学位。研究方向为高效的AIGC模型，神经网络压缩与加速等，目前已在CVPR， E

阅读更多
86
· 青稞Talk

使用CAMEL Agents构建GraphRAG及应用实践

9月26日19点，青稞Talk 第24期，Eigent AI Founding Engineer、CAMEL AI开源多智能体框架核心贡献者范文栋，将直播分享《使用 CAMEL Agents 构建 GraphRAG 及应用实践》主讲嘉宾范文栋，Eigent AI Founding Enginee

阅读更多
122
· 青稞Talk

CogVideoX 视频生成开源模型上手实践

9月23日20点，青稞Talk 第23期，智谱AI算法工程师，CogVideoX作者之一张昱轩，将直播分享《CogVideoX 视频生成开源模型上手实践》主讲嘉宾张昱轩，智谱AI算法工程师，CogVideoX作者之一；智谱多个开源仓库的核心贡献者。主题提纲 CogVideoX 视频生成开源模型

阅读更多
160
· 青稞Talk

mPLUG-Owl3：探索长序列模型架构的通用多模态大模型

9月10日19点，青稞Talk 第22期，阿里巴巴通义实验室高级算法工程师、华东师范大学博士叶加博，将直播分享《mPLUG-Owl3：探索长序列模型架构的通用多模态大模型》。主讲嘉宾叶加博，华东师范大学博士，阿里巴巴通义实验室高级算法工程师，参与通义多模态大模型mPLUG家族的研发，包含多模态底

阅读更多
206
· 青稞Talk

SGLang v0.2：面向 LLM 和 VLM 的快速、高效通用服务引擎

9月3日11点，青稞Talk第21期，Databricks Mosaic Research研究科学家，斯坦福大学博士盛颖，将直播分享的《SGLang v0.2：面向 LLM 和 VLM 的快速、高效通用服务引擎》。主讲嘉宾盛颖，Databricks Mosaic Research研究科学家，斯

阅读更多
328
· 青稞Talk

S-LoRA：实现多 LoRA 大模型的高效并行化推理

8月26日11点，青稞Talk第20期，UC Berkeley 博士生曹诗怡，将对 S-Lora 进行分享，主题为《S-LoRA：实现多 LoRA 大模型的高效并行化推理》。主讲嘉宾曹诗怡，UC Berkeley 博士生；导师是Ion Stoica和Joseph E. Gonzalez教授，主要

阅读更多
195
· 青稞Talk

AWQ：激活值感知的LLM低位权重量化

8月14日晚7点，青稞Talk第19期，MIT准博士生唐嘉铭，将直播分享《AWQ：激活值感知的LLM低位权重量化》。主讲嘉宾唐嘉铭，MIT准博士生；导师是韩松教授；此前，在上海交通大学（ACM班）获得了计算机科学学士学位；大三期间，在上海交通大学高性能计算中心实验室（EPCCLab）进行科研实习

阅读更多
139
· 青稞Talk

InternVL 2.0：通过渐进式策略扩展开源多模态大模型的性能边界

8月6日晚7点，青稞Talk第18期，香港中文大学博士后、上海人工智能实验室青年科学家、“书生”系列视觉基础模型核心开发者王文海，将直播分享《InternVL 2.0：通过渐进式策略扩展开源多模态大模型的性能边界》。他将和大家一起探讨图文多模态大模型的基本原理和技术，如何利用开源套件构建强大的多模态

阅读更多
99
· 青稞Talk

SEED-Story：生成长篇图文故事的多模态大型语言模型

7月30日晚7点，青稞Talk第17期，香港科技大学（广州）博士生杨帅，将直播分享《SEED-Story：生成长篇图文故事的多模态大型语言模型》。主讲嘉宾杨帅，香港科技大学（广州）人工智能方向的博士研究生，导师是陈颖聪博士。他的研究方向是高效深度学习和生成模型，相关成果已发表在ICCV，ICLR

阅读更多
109
· 青稞Talk

YOLO-World：基于视觉语言模型的实时开放词汇物体检测

7月23日晚7点，青稞Talk第16期，华中科技大学博士生程天恒，将直播分享《YOLO-World：基于视觉语言模型的实时开放词汇物体检测》。主讲嘉宾程天恒，华中科技大学博士生；2019年获得华中科技大学（HUST）电子信息与通信专业的学士学位；研究兴趣包括计算机视觉、通用物体检测与分割以及多模

阅读更多
208
· 青稞Talk

MiniCPM-V：端侧可用的GPT-4V级多模态大模型

7月15日晚7点，青稞Talk第15期，清华大学自然语言处理实验室博士生余天予，将直播分享《MiniCPM-V：端侧可用的 GPT-4V 级多模态大模型》。分享嘉宾余天予，清华大学自然语言处理实验室博士生，发表AAAI、CVPR 等人工智能顶会论文多篇，主要研究方向为多模态大模型。主题提纲 M

阅读更多
151
· 青稞Talk

Mobile-Agent：基于多模态Agent架构的手机智能体

7月11日晚7点，青稞Talk第14期，阿里通义实验室高级算法专家徐海洋，将直播分享《Mobile-Agent：基于多模态Agent架构的手机智能体》。分享嘉宾徐海洋，阿里通义实验室高级算法专家，负责通义多模态大模型mPLUG系列工作，包括基础多模态模型mPLUG/mPLUG-2，多模态对话大模

阅读更多
146
· 青稞Talk

LLaMA Factory：从预训练到RLHF，大模型高效训练框架

7月8日晚7点，青稞Talk第13期，北京航空航天大学博士生郑耀威，将直播分享《LLaMA Factory：从预训练到RLHF，大模型高效训练框架》。分享嘉宾郑耀威，北京航空航天大学博士生。以第一作者在ACL、CVPR、AAAI、WWW等国际会议发表多篇论文，担任AAAI、EMNLP、Neura

阅读更多
193
· 青稞Talk

VillagerAgent：减少幻觉、提高任务分解效率的多智能协作体框架

6月27日晚7点，青稞社区组织【青稞Talk】第十二期，VillagerAgent一作、浙江大学硕士研究生董玉博，将直播分享 ACL 2024 findings 成果《VillagerAgent：减少幻觉、提高任务分解效率的多智能协作体框架》。主讲嘉宾董玉博，2023级浙江大学硕士研究生一年级。

阅读更多
83
· 青稞Talk

LLaMA Pro：扩展Transformer块优化的大型语言模型继续预训练

6月17日晚7点，青稞社区组织【青稞Talk】第十一期，LLAMA PRO一座、香港大学MMLAB在读博士吴成岳，将直播分享 ACL 2024最新成果《LLaMA Pro：扩展Transformer块优化的大型语言模型继续预训练》。主讲嘉宾吴成岳，香港大学MMLAB在读博士，师从罗平老师，研究方

阅读更多
136
· 青稞Talk

PiSSA：收敛快、误差小的大模型参数高效微调方法

6月13日晚7点，青稞社区组织【青稞Talk】第十期，北京大学人工智能研究院孟繁续博士，将直播分享《PiSSA：收敛快、误差小的大模型参数高效微调方法》。分享嘉宾孟繁续，北京大学人工智能研究院在读博士；师从张牧涵教授。曾获哈尔滨工业大学优秀毕业生，师从卢光明教授。曾就职于腾讯优图实验室任研究员，

阅读更多
113
· 青稞Talk

具身多模态大模型的视觉表征预训练研究

6月6日晚7点，青稞社区组织【青稞Talk】第九期，上海人工智能实验室青年研究员、OpenDriveLab具身智能方向负责人曾嘉博士，将直播分享《具身多模态大模型的视觉表征预训练研究》。主讲嘉宾曾嘉，上海人工智能实验室青年研究员，OpenDriveLab具身智能方向负责人。博士毕业于上海交通大学

阅读更多
252
· 青稞Talk

VideoBooth：文本和图像提示共同驱动的视频生成

5月29日晚7点，青稞社区组织【青稞Talk】第八期，南洋理工大学 MMLab 实验室在读博士姜瑜铭，将直播分享《VideoBooth：文本和图像提示共同驱动的视频生成》。主讲嘉宾姜瑜铭，南洋理工大学 MMLab 实验室在读博士生。导师为刘子纬(Ziwei Liu)教授和吕健勤(Chen Cha

阅读更多
122
· 青稞Talk

MixEval：混合评测数据集来拟合大语言模型的人类评估

5月24日晚7点，青稞社区组织【青稞Talk】第七期，新加坡国立大学Research Fellow倪瑾杰博士，将直播分享《MixEval：混合评测数据集来拟合大语言模型的人类评估》。分享嘉宾倪瑾杰，新加坡国立大学Research Fellow。目前致力于大模型的高效训练，评估，以及多模态模型的训

阅读更多
136
· 青稞Talk

实时渲染 3DGS 中的反走样及逆渲染应用

5月21日晚7点，青稞社区组织【青稞Talk】第六期，邀请到华南理工大学几何感知与智能实验室博士梁智灏参与，分享《实时渲染 3DGS 中的反走样及逆渲染应用》。分享嘉宾梁智灏，华南理工大学几何感知与智能实验室博士，导师为贾奎教授；代表作三维语义分析方向（分割，检测）：SSTNet、VISTA；

阅读更多
112
· 青稞Talk

3D-VLA：构建生成式三维具身世界模型

5月10日晚7点，青稞社区组织【青稞Talk】第五期，邀请到 3D-VLA 一作甄昊宇参与，分享《3D-VLA：构建生成式三维具身世界模型》。分享嘉宾甄昊宇，上海交通大学大四，麻省理工学院访问学生，在ICML、NeurIPS、ICCV等会议上发表多篇论文。主题提纲 3D-VLA：构建生成式三维

阅读更多
141
· 青稞Talk

Mini-Gemini：挖掘多模态视觉语言大模型的潜力

4月24日晚7点，青稞社区组织【青稞Talk】第四期，邀请到 Mini-Gemini 一作、香港中文大学在读博士李彦玮参与，分享《Mini-Gemini：挖掘多模态视觉语言大模型的潜力》。分享嘉宾李彦玮，香港中文大学计算机科学与工程系四年级博士生，师从贾佳亚教授；主要关注方向为计算机视觉和多模态

阅读更多
140
· 青稞Talk

从 3D LLM 到 MultiPLY ，3D 具身基础模型的构建

4月19日早9点，青稞社区组织【青稞Talk】第三期，邀请到 3D-LLM 和 MultiPLY 一作、加州大学洛杉矶分校在读博士洪逸宁参与，分享《从 3D LLM 到 MultiPLY ，3D 具身基础模型的构建》。分享嘉宾洪逸宁，加州大学洛杉矶分校在读博士，MIT-IBM沃森人工智能实验室研

阅读更多
167
· 青稞Talk

ChatDev：大语言模型驱动的多智能体协作与演化

4月15日晚7点，青稞社区组织【青稞Talk】第二期，并邀请到 ChatDev 一作、清华大学自然语言处理实验室（THUNLP）博士后钱忱参与，分享《ChatDev：大语言模型驱动的多智能体协作与演化》。本次 Talk 会基于 ChatDev 的关键思路，围绕大语言模型智能体的构建、协同、进化等方面

阅读更多
206
· 青稞Talk

SceneTex：高质量三维室内场景纹理图生成

4月10日晚7点，青稞社区组织【青稞Talk】第一期，并邀请到 SceneTex 一作、慕尼黑工业大学视觉计算实验室陈振宇博士参与，分享《SceneTex:高质量三维室内场景纹理图生成》。参与嘉宾陈振宇，慕尼黑工业大学视觉计算实验室博士；师从3D视觉著名教授Matthias Niessner，主

阅读更多
175

1 2