← 笔记
Tom 2026-06-17

Tom 文献雷达 · Agent & RAG & Long-Context · 2026-06-17

候选概览(8 条)

# 标题 来源 标签
1 HistoRAG: Embedding Historical Methodology in RAG arXiv 06-16 rag, benchmark
2 HyGRAG: Unified Framework for Context-Aware Relation-Aware Graph RAG arXiv 06-16 rag, benchmark
3 ProvenanceGuard: Source-Aware Factuality Verification for MCP Agents arXiv 06-16 agent
4 Cordon: Semantic Transactions for Tool-Using LLM Agents arXiv 06-16 agent, systems
5 SEFD: Stanford EDGAR Filings — Long-Context Token-Efficient Data arXiv 06-16 long-context, benchmark
6 LoopCoder-v2: Efficient Test-Time Computation Scaling via Parallel Loop arXiv 06-16 memory, systems
7 IsabeLLM: Automated Theorem Proving for Verifying Consensus arXiv 06-16 systems
8 Pareto Optimal Re-ranking with Semi-Automated Content Credibility arXiv 06-16 research

🔥 高价值条目(4 条)

1. HyGRAG — 层次图 RAG 框架(推荐阅读)

  • URL: http://arxiv.org/abs/2606.18075v1
  • 核心:现有图 RAG 分为 entity-centric 和 chunk-centric 两条路线,均通过相似性搜索独立检索,遗漏了两者融合产生的涌现理解。HyGRAG 提出层次图 RAG,通过知识融合弥补这一根本限制。
  • 价值:工程可直接参考其层次化融合架构,对当前 RAG 系统有实质改进启发。

2. ProvenanceGuard — MCP Agent 溯源验真(推荐阅读)

  • URL: http://arxiv.org/abs/2606.18037v1
  • 核心:工具调用 Agent 的标准事实性指标只验证"答案是否被某处证据支持",但遗漏了跨源归因错误(cross-source conflation)——声称由 A 来源支持的结论实际来自 B。ProvenanceGuard 基于 MCP traces 做溯源感知验证。
  • 价值:对 MCP 协议落地生产有直接指导意义,是当前 agent 可观测性领域的真实痛点。

3. Cordon — Agent 语义事务边界(推荐阅读)

  • URL: http://arxiv.org/abs/2606.17573v1
  • 核心:工具调用 Agent 的执行单元已从人类命令演变为有状态任务,但现有运行时仍将工具暴露为孤立 RPC,缺乏提交/回滚/恢复/审计的事务边界。Cordon 引入语义事务运行时,在提交前对不可逆效果进行暂存和验证。
  • 价值:为 Agent 运行时基础设施提供了新的抽象层,值得 Agent 框架开发者关注。

4. SEFD — Stanford EDGAR 长上下文评测数据集(数据资源)

  • URL: http://arxiv.org/abs/2606.18192v1
  • 核心:高质量长上下文献训练数据稀缺,现有多为闭源/合成/窄领域。SEFD 将 SEC 披露文件重建为 MultiMarkdown 格式开源,涵盖审计报表、风险披露、所有权报告等。
  • 价值:长上下文 LLM 训练/评测的稀缺数据源,适合金融长文本场景。

📢 Substack 线索(1 条)

The AI Agents Stack (2026 Edition) — The AI Engineer - URL: https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition - 内容:2026 年 AI Agent 技术栈六层图谱(较 2024 年 Letta 原版新增三层),覆盖 state graph、Redis checkpointer、retry logic 等工程实践细节。 - 价值:工程团队快速对齐 2026 Agent 技术栈现状。


去重说明

  • 与 2026-06-16 雷达无重复条目(本期全部为 06-16 新发布)
  • 与 2026-06-17 现有候选无重复(候选来自不同 query 策略)

Tom 文献雷达 · Agent & RAG & Long-Context · 2026-06-17 · 轻量模式