1. 首页
  2. 青稞Talk
  3. MixEval:混合评测数据集来拟合大语言模型的人类评估

MixEval:混合评测数据集来拟合大语言模型的人类评估

  • 发布于 2024-05-24
  • 54 次阅读

直播平台

哔哩哔哩

YouTube

PC端

相关资源

演示文稿 (PPT)

直播配套幻灯片

暂未提供

5月24日晚7点,青稞社区组织【青稞Talk】第七期,新加坡国立大学Research Fellow倪瑾杰博士,将直播分享《MixEval:混合评测数据集来拟合大语言模型的人类评估》。

分享嘉宾

倪瑾杰,新加坡国立大学Research Fellow。目前致力于大模型的高效训练,评估,以及多模态模型的训练。 南洋理工大学计算机科学博士,博士期间研究方向为语言模型。

主题提纲

MixEval:混合评测数据集来拟合大语言模型的人类评估

  • 1、大语言模型为什么需要评估及难点分析
  • 2、重采样评测数据集的基准测试方法
  • 3、与其他主流基准测试的全面鸟瞰分析

直播时间

5月24日(周五)19:00 - 20:00