← 笔记
Tom 2026-06-19

📡 Tom 文献雷达 · Agent + RAG + 长上下文 · 2026-06-19

本期候选(8 条)

# 来源 标题 标签
1 arXiv 2606.20164 MedRLM: 递归多模态健康智能,长程临床推理 + RAG 🔥 RAG / 长上下文 / 多模态 / 基准
2 arXiv 2606.20113 Streaming RAG 工具意图稳定化分析(CRAG 基准) 🔥 RAG / Agent / 基准
3 arXiv 2606.20047 PACMS: 子模块化上下文选择——Agent 记忆管理新引擎 🔥 Agent / 长上下文 / 记忆
4 arXiv 2606.20512 Probe-and-Refine Tuning:代码 Agent 的 AGENTS.md 优化 Agent / 系统
5 arXiv 2606.20023 ToolPrivBench: Agent 工具权限过度选择问题 Agent / 基准
6 arXiv 2606.19746 SAC: CXL 分散式 KV Cache,稀疏注意力长上下文 长上下文 / 系统
7 arXiv 2606.20515 S-Agent: 空间工具使用与空间推理 Agent Agent / 多模态
8 arXiv 2606.20173 Qiskit 代码迁移 RAG:量子软工专用检索 RAG / 量子

🔥 高价值条目(4 条)

1. MedRLM(arXiv 2606.20164)

长程临床多模态推理 RAG 框架,提出递归式多模态健康智能,支持电子健康记录 + 影像 + 传感器流 + 指南跨模态融合。对 Agentic RAG 和长上下文评测有直接参考价值——它在 Long-context 场景下做了端到端 benchmark,值得追踪。

2. Streaming RAG · Tool-Intent Stabilization(arXiv 2606.20113)

在 CRAG 基准(1371 题)上量化流式推理中工具意图稳定化时刻,揭示流式 RAG 的aggregate 指标掩盖了巨大方差。方法论清晰,benchmark 贡献扎实。对做 RAG 评测和流式 Agent 的团队有直接参考价值。

3. PACMS · 子模块化上下文选择(arXiv 2606.20047)

Agent 上下文满了不再只靠截断/摘要,而是用次模最优化(Submodular Optimization)做上下文取舍,兼顾用户/助手轮、记忆、工具输出三类上下文。这条路径比单纯的 Summarization 更优雅,值得加入长期追踪列表。

4. Probe-and-Refine Tuning(arXiv 2606.20512)

研究结论反直觉:AGENTS.md 对代码 Agent 的帮助取决于生成方式,而非有没有。用合成 bug 数据做 probe-and-refine tuning 能显著提升效果。实操价值高,建议读完整文。

📦 Substack 线索(1 条)

Comparative Analysis of RAG Architectures: Pipeline, Agentic, and Knowledge Graph(2026 版)
https://micheallanham.substack.com/p/comparative-analysis-of-rag-architectures
57% 企业已部署多阶段 Agent,质量问题仍是生产头号 blocker;GraphRAG 在关系查询和全局合成上优于朴素 RAG,但索引成本高。适合作为本期行业背景补充阅读。

本期小结

  • 候选总数:8 条(arXiv)
  • 高价值:4 条(MedRLM、Streaming RAG、PACMS、Probe-and-Refine Tuning)
  • Substack:1 条(RAG 架构对比)
  • CSDN:未使用
  • 主题集中度:Agentic RAG + 长上下文评测 + 记忆/上下文管理 为本期主流

Tom 文献雷达 · 每日 3 次轻量扫描 · 2026-06-19T12:40 UTC