T
traeai
登录
返回首页
mem0(@mem0ai)

mem0 推出支持时间推理的记忆算法

8.5Score
mem0 推出支持时间推理的记忆算法

TL;DR · AI 摘要

mem0 新版记忆算法在 LoCoMo 和 LongMemEval 测试中分别达 92.5% 和 94.4%。

核心要点

  • LoCoMo 得分 92.5%,LongMemEval 得分 94.4%
  • 时间推理提升 3.8 分,多会话推理提升 1.5 分
  • 记忆衰减使近期记忆检索优先级提高 1.5 倍

结构提纲

按章节快速跳转。

  1. mem0 在 2026 年 5 月推出改进的记忆算法。

  2. LoCoMoLongMemEval 测试中分别取得 92.5% 和 94.4% 的成绩。

  3. 新增提取时间元数据功能,区分当前事实与历史事实。

  4. 近期记忆检索权重增加 1.5 倍,旧记忆权重降至 0.3 倍。

  5. 时间推理提升最显著,从 93.2% 提高到 97.0%。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • mem0 记忆算法更新
    • 性能提升
      • LoCoMo: 92.5%
      • LongMemEval: 94.4%
    • 核心功能
      • 时间推理
      • 记忆衰减
    • 测试结果
      • 时间推理提升 3.8 分
      • 多会话推理提升 1.5 分

金句 / Highlights

值得收藏与分享的关键句。

#AI#记忆系统#算法优化
打开原文

标题:mem0 在 X 平台发布:“高效用 Token 的记忆算法现已支持时间推理” / X

来源链接:https://x.com/mem0ai/status/2054976169007813053

发布时间:2026 年 5 月 15 日(星期五)03:28:31 GMT

Markdown 内容: 今年四月,我们发布了高效用 Token 的记忆算法,并指出:多会话推理(multi-session reasoning)与时间推理(temporal reasoning)是记忆能力中最具挑战性的两大类别。

今天,我们在上述两项能力上均取得显著提升:在相同 <7,000 Token 的检索预算下,时间推理得分提升 +3.8 分,多会话推理得分提升 +1.5 分。

四月版本基于单次提取(single-pass extraction)与分层检索(hierarchical retrieval)实现,在 Token 消耗仅为全上下文方法(通常每查询消耗 25,000+ Token)的 1/3–1/4 的前提下,达到了极具竞争力的基准性能。

本次更新新增两项能力:时间推理记忆衰减(Memory Decay),且不增加任何额外 Token 开销。二者协同作用,使检索更具“时间感知”能力,推动算法在 LoCoMo 基准上达到 92.5%,在 LongMemEval 基准上达到 94.4%

mem0 更新版高效用 Token 算法概览(2026 年 5 月):

图 1:示意图

注:本表展示的是整体 top_200 得分。各细分类别(含多会话推理与时间推理)的提升详情,请参见下方「结果」章节。

  1. 时间推理(Temporal Reasoning)

当一条记忆被写入时,Mem0 现在会同步提取其时间元数据(temporal metadata),包括:事件发生时间、是否为进行中或已完成状态、时间精度等级,以及该记忆所属类型。

这使得搜索可明确区分当前事实、历史事实、未来计划、偏好、关系及永恒事实(timeless facts)。例如,针对问题“Alice 当前就职于哪家公司?”,系统应返回其最新职位,而非仅因语义相似而偶然匹配的旧职位。

时间推理作为增强模块,叠加于现有检索流程之上——它既不替代语义相关性判断,也不主动过滤记忆条目,而是对具有时间敏感性的查询进行重排序(reranking),从而更大概率将正确的时间戳实例置顶。

对于持续性事实(ongoing facts),系统为其分配一个状态键(state key),用于关联围绕同一动态事实的所有记忆。当新状态生效时,旧状态将通过 event_end 标记终止。时间线保持清晰有序,历史上下文仍可完整检索。

完整技术解析:

  1. 记忆衰减(Memory Decay)

记忆衰减机制使近期被调用的记忆更易被检索到,而长期未被访问的“闲置”记忆则在排序中逐步后移。近期记忆最多可获得 1.5 倍的权重提升;而陈旧记忆的权重可衰减至低至 0.3 倍

所有记忆均不会被删除或隐藏。即使某条记忆已显陈旧,只要它是当前查询的最佳匹配项,依然可以被召回;它只是不再被默认视为“永远与最新状态等同”。

该机制有助于长期运行的智能体应对“缓慢累积问题”(slow accumulation problem):过往项目、过时偏好、已解决工单、失效计划等信息全部保留在记忆库中,但不再主导面向当下语境的检索。

记忆衰减仅在检索时生效。原有记忆内容、嵌入向量(embeddings)、分类标签及元数据均保持不变;中位搜索延迟亦基本不受影响。

完整技术解析:

LongMemEval

LongMemEval 在单会话与多会话场景下综合评估记忆能力,涵盖知识更新与时间推理任务。在 500 道测试题上,本算法得分达 94.4%,较基线 93.4% 提升明显。

图 2:示意图

三大亮点如下:

  • 时间推理提升最为显著:从 93.2% 提升至 97.0%
  • 多会话推理稳步进步:从 86.5% 提升至 88.0%,跨会话推理(cross-session reasoning)仍有优化空间;
  • 知识更新能力略有回落:下降 2.6 分;单会话助手(single-session-assistant)得分由满分 100.0% 微降至 98.2%

值得特别指出的是多会话能力——它高度映射真实生产环境中的记忆压力。例如:用户曾就职的旧公司与当前公司、六个月后变更的偏好、或悄然终止的副业项目,均可共存于同一记忆库中。

难点不在于存储这些事实,而在于精准检索出与当前问题真正匹配的那个事实

LoCoMo

LoCoMo 在 1,540 条对话式问题上,全面测试单跳(single-hop)、多跳(multi-hop)、开放域(open-domain)及时间性(temporal)回忆能力。

我们以两种维度呈现结果:按检索截断点(retrieval cutoff)划分,以及按问题类别划分。

图 3:示意图

最大提升集中于最关键的两类问题:时间性问题多跳问题——系统需自主判断哪个实例适用,以及“此刻”何者为真。

您可直接使用现有 API,无需任何迁移工作

  • 时间推理默认对新建项目启用;
  • 记忆衰减可通过控制台或 SDK 手动开启。

基础算法仍保留在开源 SDK 中。新增的两项能力——时间推理记忆衰减——目前仅限 Mem0 平台使用。

查阅文档:→

  • 时间抽象(Temporal abstraction):不仅记录“发生了什么”,更建模“事件如何随时间演进”。BEAM 10M 得分定义了当前前沿水平。
  • 跨会话结构(Cross-session structure):刻画信息如何在多次会话间演化。需将零散交互串联为连贯的时间线。
  • 智能体原生记忆(Agent-native memory):抽取与检索作为异步基础设施运行,使智能体无需耗费计算资源自行管理上下文。

搭载时间推理记忆衰减的高效用 Token 记忆算法,今日已在 Mem0 平台正式上线。

两项新功能目前均为平台专属;基础算法仍保留在开源 SDK 中。

AI 可能会生成不准确的信息,请核实重要内容

mem0 推出支持时间推理的记忆算法 | mem0(@mem0ai) | traeai