Tom 文献雷达 · Agent & RAG & Long-Context · 2026-06-17
候选概览(8 条)
| # | 标题 | 来源 | 标签 |
|---|---|---|---|
| 1 | HistoRAG: Embedding Historical Methodology in RAG | arXiv 06-16 | rag, benchmark |
| 2 | HyGRAG: Unified Framework for Context-Aware Relation-Aware Graph RAG | arXiv 06-16 | rag, benchmark |
| 3 | ProvenanceGuard: Source-Aware Factuality Verification for MCP Agents | arXiv 06-16 | agent |
| 4 | Cordon: Semantic Transactions for Tool-Using LLM Agents | arXiv 06-16 | agent, systems |
| 5 | SEFD: Stanford EDGAR Filings — Long-Context Token-Efficient Data | arXiv 06-16 | long-context, benchmark |
| 6 | LoopCoder-v2: Efficient Test-Time Computation Scaling via Parallel Loop | arXiv 06-16 | memory, systems |
| 7 | IsabeLLM: Automated Theorem Proving for Verifying Consensus | arXiv 06-16 | systems |
| 8 | Pareto Optimal Re-ranking with Semi-Automated Content Credibility | arXiv 06-16 | research |
🔥 高价值条目(4 条)
1. HyGRAG — 层次图 RAG 框架(推荐阅读)
- URL: http://arxiv.org/abs/2606.18075v1
- 核心:现有图 RAG 分为 entity-centric 和 chunk-centric 两条路线,均通过相似性搜索独立检索,遗漏了两者融合产生的涌现理解。HyGRAG 提出层次图 RAG,通过知识融合弥补这一根本限制。
- 价值:工程可直接参考其层次化融合架构,对当前 RAG 系统有实质改进启发。
2. ProvenanceGuard — MCP Agent 溯源验真(推荐阅读)
- URL: http://arxiv.org/abs/2606.18037v1
- 核心:工具调用 Agent 的标准事实性指标只验证"答案是否被某处证据支持",但遗漏了跨源归因错误(cross-source conflation)——声称由 A 来源支持的结论实际来自 B。ProvenanceGuard 基于 MCP traces 做溯源感知验证。
- 价值:对 MCP 协议落地生产有直接指导意义,是当前 agent 可观测性领域的真实痛点。
3. Cordon — Agent 语义事务边界(推荐阅读)
- URL: http://arxiv.org/abs/2606.17573v1
- 核心:工具调用 Agent 的执行单元已从人类命令演变为有状态任务,但现有运行时仍将工具暴露为孤立 RPC,缺乏提交/回滚/恢复/审计的事务边界。Cordon 引入语义事务运行时,在提交前对不可逆效果进行暂存和验证。
- 价值:为 Agent 运行时基础设施提供了新的抽象层,值得 Agent 框架开发者关注。
4. SEFD — Stanford EDGAR 长上下文评测数据集(数据资源)
- URL: http://arxiv.org/abs/2606.18192v1
- 核心:高质量长上下文献训练数据稀缺,现有多为闭源/合成/窄领域。SEFD 将 SEC 披露文件重建为 MultiMarkdown 格式开源,涵盖审计报表、风险披露、所有权报告等。
- 价值:长上下文 LLM 训练/评测的稀缺数据源,适合金融长文本场景。
📢 Substack 线索(1 条)
The AI Agents Stack (2026 Edition) — The AI Engineer - URL: https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition - 内容:2026 年 AI Agent 技术栈六层图谱(较 2024 年 Letta 原版新增三层),覆盖 state graph、Redis checkpointer、retry logic 等工程实践细节。 - 价值:工程团队快速对齐 2026 Agent 技术栈现状。
去重说明
- 与 2026-06-16 雷达无重复条目(本期全部为 06-16 新发布)
- 与 2026-06-17 现有候选无重复(候选来自不同 query 策略)
Tom 文献雷达 · Agent & RAG & Long-Context · 2026-06-17 · 轻量模式