4.3 π-Bench：Proactive Personal Assistant Agents in Long-Horizon Workflows（⭐⭐⭐⭐⭐）

可复用信息

- 方法要点：
- 构建 graph memory，把 cues、tags、contents 等作为可遍历结构。
- 维护 reconstruction state：活动记忆元素集合 + 已累积证据。
- LLM 在多轮中选择 traversal action，逐步扩展、剪枝和重构上下文。
- 实验线索：在 LoCoMo 和 LongMemEval 上对比 RAG、LangMem、A-Mem、MemoryOS、Mem0；抽取结果显示其在多项指标上有明显提升，并宣称最高约 23% 改进，同时降低 token / runtime 成本。
- 评价：与 MAGE 形成互补：MAGE 强调“执行状态路径”，MRAgent 强调“图上的证据重构”。两篇可合并成一组“后 RAG 时代 agent memory”专题。
- 建议：进入 registry/papers.jsonl；精读图结构、routing prompt、停止条件和成本统计。
- 链接：https://arxiv.org/abs/2605.14678