📡 Tom 文献雷达 · Agent + RAG + 长上下文 · 2026-06-19
本期候选(8 条)
| # | 来源 | 标题 | 标签 |
|---|---|---|---|
| 1 | arXiv 2606.20164 | MedRLM: 递归多模态健康智能,长程临床推理 + RAG | 🔥 RAG / 长上下文 / 多模态 / 基准 |
| 2 | arXiv 2606.20113 | Streaming RAG 工具意图稳定化分析(CRAG 基准) | 🔥 RAG / Agent / 基准 |
| 3 | arXiv 2606.20047 | PACMS: 子模块化上下文选择——Agent 记忆管理新引擎 | 🔥 Agent / 长上下文 / 记忆 |
| 4 | arXiv 2606.20512 | Probe-and-Refine Tuning:代码 Agent 的 AGENTS.md 优化 | Agent / 系统 |
| 5 | arXiv 2606.20023 | ToolPrivBench: Agent 工具权限过度选择问题 | Agent / 基准 |
| 6 | arXiv 2606.19746 | SAC: CXL 分散式 KV Cache,稀疏注意力长上下文 | 长上下文 / 系统 |
| 7 | arXiv 2606.20515 | S-Agent: 空间工具使用与空间推理 Agent | Agent / 多模态 |
| 8 | arXiv 2606.20173 | Qiskit 代码迁移 RAG:量子软工专用检索 | RAG / 量子 |
🔥 高价值条目(4 条)
1. MedRLM(arXiv 2606.20164)
长程临床多模态推理 RAG 框架,提出递归式多模态健康智能,支持电子健康记录 + 影像 + 传感器流 + 指南跨模态融合。对 Agentic RAG 和长上下文评测有直接参考价值——它在 Long-context 场景下做了端到端 benchmark,值得追踪。
2. Streaming RAG · Tool-Intent Stabilization(arXiv 2606.20113)
在 CRAG 基准(1371 题)上量化流式推理中工具意图稳定化时刻,揭示流式 RAG 的aggregate 指标掩盖了巨大方差。方法论清晰,benchmark 贡献扎实。对做 RAG 评测和流式 Agent 的团队有直接参考价值。
3. PACMS · 子模块化上下文选择(arXiv 2606.20047)
Agent 上下文满了不再只靠截断/摘要,而是用次模最优化(Submodular Optimization)做上下文取舍,兼顾用户/助手轮、记忆、工具输出三类上下文。这条路径比单纯的 Summarization 更优雅,值得加入长期追踪列表。
4. Probe-and-Refine Tuning(arXiv 2606.20512)
研究结论反直觉:AGENTS.md 对代码 Agent 的帮助取决于生成方式,而非有没有。用合成 bug 数据做 probe-and-refine tuning 能显著提升效果。实操价值高,建议读完整文。
📦 Substack 线索(1 条)
Comparative Analysis of RAG Architectures: Pipeline, Agentic, and Knowledge Graph(2026 版)
https://micheallanham.substack.com/p/comparative-analysis-of-rag-architectures
57% 企业已部署多阶段 Agent,质量问题仍是生产头号 blocker;GraphRAG 在关系查询和全局合成上优于朴素 RAG,但索引成本高。适合作为本期行业背景补充阅读。
本期小结
- 候选总数:8 条(arXiv)
- 高价值:4 条(MedRLM、Streaming RAG、PACMS、Probe-and-Refine Tuning)
- Substack:1 条(RAG 架构对比)
- CSDN:未使用
- 主题集中度:Agentic RAG + 长上下文评测 + 记忆/上下文管理 为本期主流
Tom 文献雷达 · 每日 3 次轻量扫描 · 2026-06-19T12:40 UTC