1. 首页
  2. 青稞Talk
  3. YOLO-World:基于视觉语言模型的实时开放词汇物体检测

YOLO-World:基于视觉语言模型的实时开放词汇物体检测

  • 发布于 2024-07-23
  • 100 次阅读

讲师:

直播平台

哔哩哔哩

YouTube

PC端

相关资源

演示文稿 (PPT)

直播配套幻灯片

下载

7月23日晚7点,青稞Talk第16期,华中科技大学博士生程天恒,将直播分享《YOLO-World:基于视觉语言模型的实时开放词汇物体检测》。

主讲嘉宾

程天恒,华中科技大学博士生;2019年获得华中科技大学(HUST)电子信息与通信专业的学士学位;研究兴趣包括计算机视觉、通用物体检测与分割以及多模态视觉模型,在人工智能与计算机视觉的顶级会议上发表学术论文11篇。

主题提纲

YOLO-World:基于视觉语言模型的实时开放词汇物体检测

  • 1、迈向更通用的开放词汇物体检测
  • 2、YOLO-World:模型设计与大规模数据训练
  • 3、YOLO-World微调与应用实践
  • 4、多模态大模型时代的物体检测

成果链接

直播时间

7月23日(周二)19:00-20:00