1. 首页
  2. 青稞Talk
  3. δ-mem:从长上下文到在线记忆,动态演化原生记忆的一次尝试

δ-mem:从长上下文到在线记忆,动态演化原生记忆的一次尝试

  • 发布于 2026-05-21
  • 1 次阅读

直播平台

视频号

相关资源

演示文稿 (PPT)

直播配套幻灯片

暂未提供

δ-mem是一种面向大语言模型的轻量级在线记忆机制。不同于把历史全部塞进长上下文,δ-mem 将过去信息压缩进一个极小的在线关联记忆状态,并在生成时通过低秩 correction 直接调制 frozen Transformer 的 attention computation。

主实验中,仅使用 8 × 8 state,δ-mem 就能在 Qwen3-4B-Instruct 上将平均分从 46.79% 提升到 51.66%,并在MemoryAgentBench、LoCoMo 等 memory-heavy benchmarks 上取得显著收益。

δ-mem 以低参数和显存开销实现了动态、在线、可更新的记忆能力。结果表明:有效的长期记忆不一定依赖更长上下文或大型外部模块,一个紧凑的在线状态也可以直接辅助模型的记忆。


5月26日(周二)晚8点,青稞Talk 第127期,Mind Lab 研究员、南洋理工大学博士生雷京迪,将直播分享《δ-mem:从长上下文到在线记忆,动态演化原生记忆的一次尝试》。

分享嘉宾

雷京迪是南洋理工大学一年级博士生,Mind Lab 研究员,导师为Soujanya Poria副教授,研究方向主要为LLM、Post-training,在ICLR、CVPR、NAACL、AAAI、TKDE等会议与期刊上发表多篇论文,以一作/共一身份发表了OffTopicEval、EFLA、LLaMA-Berry、Critic-V等多篇受到社区广泛讨论的工作

主题提纲

δ-mem:从长上下文到在线记忆,动态演化原生记忆的一次尝试

1、为什么需要长期记忆?
2、现有的大模型记忆机制及局限
3、轻量级在线记忆机制 δ-mem 架构解析
4、δ-mem 的有效性验证
5、记忆架构的范式展望 & AMA 环节

直播时间

5月26日(周二)20:00 - 21:00