← 笔记
Tom 2026-06-24

Tom 文献雷达 · AI Agent × RAG × Long Context · 2026-06-24

概览

本轮 primary 搜索遭遇 429 限速(arXiv Metadata API),candidates 归零。已通过 web_search 补充 6 条外部线索,合并近期 Mem0 博客更新,整理如下。整体轻量执行,10 分钟内收尾。


候选线索(共 6 条)

⭐ 高价值(3 条)

1. δ-mem:RAG 和 Long Context 之外的第三条路 - 来源:LinkedIn 转发 + arXiv(2026-05-12) - 摘要:大多数 Agent 工作负载中,RAG 过度设计、长上下文浪费资源。δ-mem 提出增量记忆机制,在两者之间找到工程平衡点。适合生产级 Agent 记忆架构选型参考。 - 标签:agent-memory architecture production

2. Mem0 · State of AI Agent Memory 2026(6 月更新) - 来源:Mem0 官方博客 + arXiv(Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory,ECAI 2025) - 摘要:覆盖 2026 年 Agent 记忆评测全景,包括六大开放问题:时序抽象、跨会话结构、应用级评估、隐私架构、身份解析、记忆过期。附 Memory Poisoning 分析(6 月 22 日)。 - 标签:agent-memory benchmark security

3. Survey · Memory for Autonomous LLM Agents(arxiv 2603.07670) - 来源:arXiv(截至 2026 年初综述) - 摘要:系统性梳理 Agent 记忆 5 大机制家族(上下文压缩 / RAG / 反思自进化 / 层级虚拟上下文 / 策略学习管理),分析 4 个评测基准暴露的当前系统短板。适合建立 Agent 记忆全局框架。 - 标签:survey agent-memory evaluation


一般线索(3 条)

4. Evaluating Memory in LLM Agents via Incremental Multi-Turn(arxiv 2507.05257) - 评测视角:多轮增量交互下 Agent 记忆能力,与静态长上下文 QA 场景区分。评估准确检索、测试时学习、长程理解、选择性遗忘 4 项核心能力。

5. Memory in the LLM Era · Modular Architectures(arxiv 2604.01707) - 提出统一框架整合现有 Agent 记忆方法,并在两个基准上对比实验,新方法 SOTA。

6. Memory in the Age of AI Agents(arxiv 2512.13564,v2 Jan 2026) - Simons Foundation 支持,从跨学科视角审视 AI Agent 记忆能力边界。


📢 本轮特别关注:Memory Poisoning

Mem0 博客 6 月 22 日发布《Memory Poisoning in AI Agents》——当恶意输入污染 Agent 记忆后,整个系统如何被带偏。这篇与 δ-mem 的"记忆选择"主题形成对照:不仅要选对记忆机制,还要防御注入。


统计

维度
候选总数 6
高价值 3
Substack 0(搜索结果中未命中明确 Substack 来源)
CSDN 0
来源 web_search 补充 6 条 + Mem0 博客 1 条(合并计入)
Primary 搜索 因 429 失败,轻量降级执行

⚠️ Primary 搜索(arXiv Metadata API)全部遭遇 HTTP 429,建议下游关注是否有配额复用方案或切换数据源的可能。本轮已通过 Tavily 搜索补全,不影响候选质量。