• GenAD & Vista:构建通用可泛化的自动驾驶世界模型
    · 青稞Talk

    GenAD & Vista:构建通用可泛化的自动驾驶世界模型

    10月17日19点,青稞Talk 第27期,香港科技大学在读博士高深远,将直播分享《GenAD & Vista:构建通用可泛化的自动驾驶世界模型》。 主讲嘉宾 高深远,香港科技大学在读博士,研究兴趣主要围绕具身场景中世界模型的构建及应用。曾在CVPR、NeurIPS、ECCV以第一作者身份发表多篇论

  • VITA:开源交互式多模态基础大模型
    · 青稞Talk

    VITA:开源交互式多模态基础大模型

    10月14日19点,青稞Talk 第26期,VITA 第一作者,南京大学智能科学与技术学院研究员、助理教授、博导傅朝友,将直播分享《VITA:开源交互式多模态基础大模型》。 主讲嘉宾 傅朝友,南京大学智能科学与技术学院研究员,助理教授,博导。2022年博士毕业于中国科学院自动化研究所,2022年-2

  • LLMC:大语言模型的量化基准
    · 青稞Talk

    LLMC:大语言模型的量化基准

    10月11日晚7点,青稞Talk 第25期,商汤科技算法实习生、香港科技大学准博士生黄雨石,将直播分享《LLMC:大语言模型的量化基准》。 主讲嘉宾 黄雨石,本科毕业于北京航空航天大学,即将进入香港科技大学攻读计算机博士学位。研究方向为高效的AIGC模型,神经网络压缩与加速等,目前已在CVPR, E

  • 使用CAMEL Agents构建GraphRAG及应用实践
    · 青稞Talk

    使用CAMEL Agents构建GraphRAG及应用实践

    9月26日19点,青稞Talk 第24期,Eigent AI Founding Engineer、CAMEL AI开源多智能体框架核心贡献者范文栋,将直播分享《使用 CAMEL Agents 构建 GraphRAG 及应用实践》 主讲嘉宾 范文栋,Eigent AI Founding Enginee

  • CogVideoX 视频生成开源模型上手实践
    · 青稞Talk

    CogVideoX 视频生成开源模型上手实践

    9月23日20点,青稞Talk 第23期,智谱AI算法工程师,CogVideoX作者之一张昱轩,将直播分享《CogVideoX 视频生成开源模型上手实践》 主讲嘉宾 张昱轩,智谱AI算法工程师,CogVideoX作者之一;智谱多个开源仓库的核心贡献者。 主题提纲 CogVideoX 视频生成开源模型

  • mPLUG-Owl3:探索长序列模型架构的通用多模态大模型
    · 青稞Talk

    mPLUG-Owl3:探索长序列模型架构的通用多模态大模型

    9月10日19点,青稞Talk 第22期,阿里巴巴通义实验室高级算法工程师、华东师范大学博士叶加博,将直播分享《mPLUG-Owl3:探索长序列模型架构的通用多模态大模型》。 主讲嘉宾 叶加博,华东师范大学博士,阿里巴巴通义实验室高级算法工程师,参与通义多模态大模型mPLUG家族的研发,包含多模态底

  • S-LoRA:实现多 LoRA 大模型的高效并行化推理
    · 青稞Talk

    S-LoRA:实现多 LoRA 大模型的高效并行化推理

    8月26日11点,青稞Talk第20期,UC Berkeley 博士生曹诗怡,将对 S-Lora 进行分享,主题为《S-LoRA:实现多 LoRA 大模型的高效并行化推理》。 主讲嘉宾 曹诗怡,UC Berkeley 博士生;导师是Ion Stoica和Joseph E. Gonzalez教授,主要

  • AWQ:激活值感知的LLM低位权重量化
    · 青稞Talk

    AWQ:激活值感知的LLM低位权重量化

    8月14日晚7点,青稞Talk第19期,MIT准博士生唐嘉铭,将直播分享《AWQ:激活值感知的LLM低位权重量化》。 主讲嘉宾 唐嘉铭,MIT准博士生;导师是韩松教授;此前,在上海交通大学(ACM班)获得了计算机科学学士学位;大三期间,在上海交通大学高性能计算中心实验室(EPCCLab)进行科研实习

  • InternVL 2.0:通过渐进式策略扩展开源多模态大模型的性能边界
    · 青稞Talk

    InternVL 2.0:通过渐进式策略扩展开源多模态大模型的性能边界

    8月6日晚7点,青稞Talk第18期,香港中文大学博士后、上海人工智能实验室青年科学家、“书生”系列视觉基础模型核心开发者王文海,将直播分享《InternVL 2.0:通过渐进式策略扩展开源多模态大模型的性能边界》。他将和大家一起探讨图文多模态大模型的基本原理和技术,如何利用开源套件构建强大的多模态

  • SEED-Story:生成长篇图文故事的多模态大型语言模型
    · 青稞Talk

    SEED-Story:生成长篇图文故事的多模态大型语言模型

    7月30日晚7点,青稞Talk第17期,香港科技大学(广州)博士生杨帅,将直播分享《SEED-Story:生成长篇图文故事的多模态大型语言模型》。 主讲嘉宾 杨帅,香港科技大学(广州)人工智能方向的博士研究生,导师是陈颖聪博士。他的研究方向是高效深度学习和生成模型,相关成果已发表在ICCV,ICLR

  • YOLO-World:基于视觉语言模型的实时开放词汇物体检测
    · 青稞Talk

    YOLO-World:基于视觉语言模型的实时开放词汇物体检测

    7月23日晚7点,青稞Talk第16期,华中科技大学博士生程天恒,将直播分享《YOLO-World:基于视觉语言模型的实时开放词汇物体检测》。 主讲嘉宾 程天恒,华中科技大学博士生;2019年获得华中科技大学(HUST)电子信息与通信专业的学士学位;研究兴趣包括计算机视觉、通用物体检测与分割以及多模

  • MiniCPM-V:端侧可用的GPT-4V级多模态大模型
    · 青稞Talk

    MiniCPM-V:端侧可用的GPT-4V级多模态大模型

    7月15日晚7点,青稞Talk第15期,清华大学自然语言处理实验室博士生余天予,将直播分享《MiniCPM-V:端侧可用的 GPT-4V 级多模态大模型》。 分享嘉宾 余天予,清华大学自然语言处理实验室博士生,发表AAAI、CVPR 等人工智能顶会论文多篇,主要研究方向为多模态大模型。 主题提纲 M

  • Mobile-Agent:基于多模态Agent架构的手机智能体
    · 青稞Talk

    Mobile-Agent:基于多模态Agent架构的手机智能体

    7月11日晚7点,青稞Talk第14期,阿里通义实验室高级算法专家徐海洋,将直播分享《Mobile-Agent:基于多模态Agent架构的手机智能体》。 分享嘉宾 徐海洋,阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模

  • LLaMA Factory:从预训练到RLHF,大模型高效训练框架
    · 青稞Talk

    LLaMA Factory:从预训练到RLHF,大模型高效训练框架

    7月8日晚7点,青稞Talk第13期,北京航空航天大学博士生郑耀威,将直播分享《LLaMA Factory:从预训练到RLHF,大模型高效训练框架》。 分享嘉宾 郑耀威,北京航空航天大学博士生。以第一作者在ACL、CVPR、AAAI、WWW等国际会议发表多篇论文,担任AAAI、EMNLP、Neura

  • PiSSA:收敛快、误差小的大模型参数高效微调方法
    · 青稞Talk

    PiSSA:收敛快、误差小的大模型参数高效微调方法

    6月13日晚7点,青稞社区组织【青稞Talk】第十期,北京大学人工智能研究院孟繁续博士,将直播分享《PiSSA:收敛快、误差小的大模型参数高效微调方法》。 分享嘉宾 孟繁续,北京大学人工智能研究院在读博士;师从张牧涵教授。曾获哈尔滨工业大学优秀毕业生,师从卢光明教授。曾就职于腾讯优图实验室任研究员,

  • 具身多模态大模型的视觉表征预训练研究
    · 青稞Talk

    具身多模态大模型的视觉表征预训练研究

    6月6日晚7点,青稞社区组织【青稞Talk】第九期,上海人工智能实验室青年研究员、OpenDriveLab具身智能方向负责人曾嘉博士,将直播分享《具身多模态大模型的视觉表征预训练研究》。 主讲嘉宾 曾嘉,上海人工智能实验室青年研究员,OpenDriveLab具身智能方向负责人。博士毕业于上海交通大学

  • VideoBooth:文本和图像提示共同驱动的视频生成
    · 青稞Talk

    VideoBooth:文本和图像提示共同驱动的视频生成

    5月29日晚7点,青稞社区组织【青稞Talk】第八期,南洋理工大学 MMLab 实验室在读博士姜瑜铭,将直播分享《VideoBooth:文本和图像提示共同驱动的视频生成》。 主讲嘉宾 姜瑜铭,南洋理工大学 MMLab 实验室在读博士生。导师为刘子纬(Ziwei Liu)教授和吕健勤(Chen Cha

  • MixEval:混合评测数据集来拟合大语言模型的人类评估
    · 青稞Talk

    MixEval:混合评测数据集来拟合大语言模型的人类评估

    5月24日晚7点,青稞社区组织【青稞Talk】第七期,新加坡国立大学Research Fellow倪瑾杰博士,将直播分享《MixEval:混合评测数据集来拟合大语言模型的人类评估》。 分享嘉宾 倪瑾杰,新加坡国立大学Research Fellow。目前致力于大模型的高效训练,评估,以及多模态模型的训

  • 实时渲染 3DGS 中的反走样及逆渲染应用
    · 青稞Talk

    实时渲染 3DGS 中的反走样及逆渲染应用

    5月21日晚7点,青稞社区组织【青稞Talk】第六期,邀请到华南理工大学几何感知与智能实验室博士梁智灏参与,分享《实时渲染 3DGS 中的反走样及逆渲染应用》。 分享嘉宾 梁智灏,华南理工大学几何感知与智能实验室博士 ,导师为贾奎教授;代表作三维语义分析方向(分割,检测):SSTNet、VISTA;

  • 3D-VLA:构建生成式三维具身世界模型
    · 青稞Talk

    3D-VLA:构建生成式三维具身世界模型

    5月10日晚7点,青稞社区组织【青稞Talk】第五期,邀请到 3D-VLA 一作甄昊宇参与,分享《3D-VLA:构建生成式三维具身世界模型》。 分享嘉宾 甄昊宇,上海交通大学大四,麻省理工学院访问学生,在ICML、NeurIPS、ICCV等会议上发表多篇论文。 主题提纲 3D-VLA:构建生成式三维

  • Mini-Gemini:挖掘多模态视觉语言大模型的潜力
    · 青稞Talk

    Mini-Gemini:挖掘多模态视觉语言大模型的潜力

    4月24日晚7点,青稞社区组织【青稞Talk】第四期,邀请到 Mini-Gemini 一作、香港中文大学在读博士李彦玮参与,分享《Mini-Gemini:挖掘多模态视觉语言大模型的潜力》。 分享嘉宾 李彦玮,香港中文大学计算机科学与工程系四年级博士生,师从贾佳亚教授;主要关注方向为计算机视觉和多模态

  • 从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建
    · 青稞Talk

    从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建

    4月19日早9点,青稞社区组织【青稞Talk】第三期,邀请到 3D-LLM 和 MultiPLY 一作、加州大学洛杉矶分校在读博士洪逸宁参与,分享《从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建》。 分享嘉宾 洪逸宁,加州大学洛杉矶分校在读博士,MIT-IBM沃森人工智能实验室研

  • ChatDev:大语言模型驱动的多智能体协作与演化
    · 青稞Talk

    ChatDev:大语言模型驱动的多智能体协作与演化

    4月15日晚7点,青稞社区组织【青稞Talk】第二期,并邀请到 ChatDev 一作、清华大学自然语言处理实验室(THUNLP)博士后钱忱参与,分享《ChatDev:大语言模型驱动的多智能体协作与演化》。本次 Talk 会基于 ChatDev 的关键思路,围绕大语言模型智能体的构建、协同、进化等方面

  • SceneTex:高质量三维室内场景纹理图生成
    · 青稞Talk

    SceneTex:高质量三维室内场景纹理图生成

    4月10日晚7点,青稞社区组织【青稞Talk】第一期,并邀请到 SceneTex 一作、慕尼黑工业大学视觉计算实验室陈振宇博士参与,分享《SceneTex:高质量三维室内场景纹理图生成》。 参与嘉宾 陈振宇,慕尼黑工业大学视觉计算实验室博士;师从3D视觉著名教授Matthias Niessner,主

1 2