📡 Tom 文献雷达 · Agent + RAG + 长上下文 · 2026-06-19

本期候选（8 条）

#	来源	标题	标签
1	arXiv 2606.20164	MedRLM: 递归多模态健康智能，长程临床推理 + RAG	🔥 RAG / 长上下文 / 多模态 / 基准
2	arXiv 2606.20113	Streaming RAG 工具意图稳定化分析（CRAG 基准）	🔥 RAG / Agent / 基准
3	arXiv 2606.20047	PACMS: 子模块化上下文选择——Agent 记忆管理新引擎	🔥 Agent / 长上下文 / 记忆
4	arXiv 2606.20512	Probe-and-Refine Tuning：代码 Agent 的 AGENTS.md 优化	Agent / 系统
5	arXiv 2606.20023	ToolPrivBench: Agent 工具权限过度选择问题	Agent / 基准
6	arXiv 2606.19746	SAC: CXL 分散式 KV Cache，稀疏注意力长上下文	长上下文 / 系统
7	arXiv 2606.20515	S-Agent: 空间工具使用与空间推理 Agent	Agent / 多模态
8	arXiv 2606.20173	Qiskit 代码迁移 RAG：量子软工专用检索	RAG / 量子

🔥 高价值条目（4 条）

1. MedRLM（arXiv 2606.20164）

长程临床多模态推理 RAG 框架，提出递归式多模态健康智能，支持电子健康记录 + 影像 + 传感器流 + 指南跨模态融合。对 Agentic RAG 和长上下文评测有直接参考价值——它在 Long-context 场景下做了端到端 benchmark，值得追踪。

2. Streaming RAG · Tool-Intent Stabilization（arXiv 2606.20113）

在 CRAG 基准（1371 题）上量化流式推理中工具意图稳定化时刻，揭示流式 RAG 的aggregate 指标掩盖了巨大方差。方法论清晰，benchmark 贡献扎实。对做 RAG 评测和流式 Agent 的团队有直接参考价值。

3. PACMS · 子模块化上下文选择（arXiv 2606.20047）

Agent 上下文满了不再只靠截断/摘要，而是用次模最优化（Submodular Optimization）做上下文取舍，兼顾用户/助手轮、记忆、工具输出三类上下文。这条路径比单纯的 Summarization 更优雅，值得加入长期追踪列表。

4. Probe-and-Refine Tuning（arXiv 2606.20512）

研究结论反直觉：AGENTS.md 对代码 Agent 的帮助取决于生成方式，而非有没有。用合成 bug 数据做 probe-and-refine tuning 能显著提升效果。实操价值高，建议读完整文。

📦 Substack 线索（1 条）

Comparative Analysis of RAG Architectures: Pipeline, Agentic, and Knowledge Graph（2026 版）
https://micheallanham.substack.com/p/comparative-analysis-of-rag-architectures
57% 企业已部署多阶段 Agent，质量问题仍是生产头号 blocker；GraphRAG 在关系查询和全局合成上优于朴素 RAG，但索引成本高。适合作为本期行业背景补充阅读。

本期小结

候选总数：8 条（arXiv）
高价值：4 条（MedRLM、Streaming RAG、PACMS、Probe-and-Refine Tuning）
Substack：1 条（RAG 架构对比）
CSDN：未使用
主题集中度：Agentic RAG + 长上下文评测 + 记忆/上下文管理为本期主流

Tom 文献雷达 · 每日 3 次轻量扫描 · 2026-06-19T12:40 UTC