EditReward ：当 AI 学会“审美”，可控多模态生成的下一代范式

发布于 2026-03-11
107 次阅读

讲师：吴科明

清华大学在读博士生

直播平台

视频号

哔哩哔哩

YouTube

分享嘉宾

吴科明，清华大学在读博士生，目前专注于多模态生成（侧重Post-training 与强化学习对齐）及复杂多模态推理研究。其研究成果多次发表于ICLR、CVPR、ICCV、ACM MM 等顶会。作为核心作者，他在ICLR 2026 提出了人类对齐奖励模型 EditReward，并在CVPR 2026 推出多模态推理框架 OpenMMReasoner。曾于微软亚洲研究院（MSRA）进行深度学术访问与研究。

主题提纲

EditReward ：当 AI 学会“审美”，可控多模态生成的下一代范式

1、为什么开源图像编辑模型总是“不听话”？
2、EditReward：让 AI 学会“人类审美”的奖励模型
3、用 EditReward 驱动多模态 RLHF
4、大规模多模态评测的实战心得
5、未来方向探讨 & AMA （Ask Me Anything）

直播时间

3月14日（周六）10:00 - 11:00

EditReward ： 当 AI 学会“审美”，可控多模态生成的下一代范式

讲师： 吴科明

直播平台

相关资源

分享嘉宾

主题提纲

直播时间

EditReward ：当 AI 学会“审美”，可控多模态生成的下一代范式

讲师：吴科明