精选文章

  • 当谈论 FP8 训练的时候,我们到底在聊什么?
    · 精选文章

    当谈论 FP8 训练的时候,我们到底在聊什么?

    作者:瑕疵很多的大宝贝 https://zhuanlan.zhihu.com/p/1969540014166761755 随着 DeepSeek-V3、Ling 2.0、Minimax-M2 等顶级开源大模型纷纷使用 FP8 精度进行预训练,FP8 训练也算经受住了考验,得到了顶尖实验室的认可。本文

  • Agent记忆的第三种可能:生成式隐式记忆
    · 精选文章

    Agent记忆的第三种可能:生成式隐式记忆

    作者:Guibin Zhang # 导语 由大型语言模型(LLM)驱动的智能体(Agent)的进化路径,其核心在于记忆机制的构建。现有范式主要分为两类:其一为参数化记忆(Parametric Memory),它通过修改模型权重来内化经验,但面临灾难性遗忘的风险;其二为基于检索的记忆(Retrieva

1 2