InternVL3,GPT-4o开源平替:多模态通用感知大模型的技术演进与应用探索

📅 直播时间:2025-06-21 10:00 🎥 观看直播

发展更为通用的智能技术是下一代人工智能的重要突破口,学习一个可以广泛应用于各种模态和各种任务的通用感知模型是发展更为通用的智能技术的重要步骤。

6月21日10:00点,青稞Talk第56期,复旦大学博士生王玮赟,将直播分享《InternVL3,GPT-4o开源平替:多模态通用感知大模型的技术演进与应用探索》。

Canvas – 753.png
本期Talk旨在围绕书生·万象多模态大模型的技术演进过程来介绍多模态大模型研究的相关研究,包括多模态增量预训练/指令微调/后训练/测试时增强等技术及其中的训练算法设计,探索多模态通用感知模型的高效研发方案。

分享嘉宾

王玮赟,复旦大学在读博士生。研究方向为多模态通用感知模型、多模态大模型后训练算法,在人工智能国际顶级会议及期刊发表论文十余篇,作为核心作者(共一二作)参与研发的多模态大模型InternVL-Chat系列模型在HuggingFace社区累计下载量突破1000万次,开源代码在Github获得stars超过8000个。

主题提纲

InternVL3,GPT-4o开源平替:多模态通用感知大模型的技术演进与应用探索

1、多模态大模型的介绍及实现路径
2、InternVL 核心技术解析
- 多模态增量预训练/指令微调
- 后训练/测试时增强
3、训练算法设计及应用实践

直播时间

6月21日10:00 - 11:00

参与方式

Talk 将在青稞·知识社区上进行,扫码对暗号:" 0621 ",报名进群!