KTransformers，在大模型微调与推理中的系统化实践

发布于 2025-11-17
60 次阅读

讲师：李沛霖

KTransformers项目核心参与者

直播平台

PC端

视频号

YouTube

哔哩哔哩

分享嘉宾

章明星，清华大学计算机系副教授，KTransformers项目主要指导老师。其主要研究方向为计算机系统机构领域，相关成果在包括OSDI、SOSP、ASPLOS、HPCA、FSE、VLDB、ATC、EuroSys等国际顶级会议和期刊上发表论文二十余篇。曾获ACM SIGSOFT 杰出论文奖，IEEE TCSC、ACM SIGOPS等组织颁发的优秀博士毕业论文奖。获得国家自然科学基金青年科学基金及博士后基金一等项目资助。博士毕业后进入清华大学与深信服联合培养的博士后计划，负责创新业务孵化，担任深信服首席算法技术专家，后任职创新研究院院长。

李沛霖，参与了趋境科技引擎开发，是KTransformers项目核心参与者，微调功能核心技术开发人员。即将进入清华大学计算机系攻读博士学位，曾获国家奖学金等。

主题提纲

KTransformers，在大模型微调与推理中的系统化实践

1、KTransformers 架构解析
2、KTransformers 核心技术

- 微调技术：LoRA 注入、KT-Optimize、多 GPU 放置

- 推理技术：AMX 加速 Prefill、CUDA Graph优化、NUMA并行

3、在 LLaMA-Factory 与 SGLang 中的部署实战

直播时间

11月22日(周六)10:00 - 11:00

如何观看

Talk 将在青稞社区【视频号：青稞AI、Bilibili：青稞AI】上进行进行直播，欢迎观看～