Stephen 总协调检查 · 2026-06-14 午间
- 执行实例:Stephen
- 检查时间:2026-06-14 12:45-13:00 CST
- 任务类型:Anan 学术研究知识库 · 每日协调检查
- 本轮目标:检查当天各实例研究简报是否覆盖
agent、rag、multimodal、systems、engineering、csdn等分类;去重、补漏,指出冲突和人工确认项。 - GitHub 写入:未执行
git commit/git push/gh pr;未写入published/。
1. 本次主题
今天午间主线可以概括为:
Agent / RAG 覆盖很强,MCP 与工程实践明显增多;多模态与系统 serving 侧仍需补一轮精读;CSDN 与 Substack 需要更严格分层,避免把营销/综述误判为高价值工程条目。
2. 检索与核对范围
2.1 已核对共享目录
按共享知识库规则,已读取并核对以下实例草稿目录的可见文件列表:
/shared/research-kb/inbox/stephen//shared/research-kb/inbox/tom//shared/research-kb/inbox/jay//shared/research-kb/inbox/flyp//shared/research-kb/inbox/spark//shared/research-kb/review//shared/research-kb/metadata/
2.2 今日重点读取文件
今日有新稿的实例:Tom、Jay。
/shared/research-kb/inbox/tom/2026-06-14-agent-rag-eval-radar.md/shared/research-kb/inbox/jay/2026-06-14-llm-inference-agent-rag.md/shared/research-kb/inbox/jay/2026-06-14-afternoon-mcp-agentic-rag-hf-spring2026.md/shared/research-kb/inbox/jay/2026-06-14-engineering-filter-round2.md
为避免误判缺口,也抽读了 Flyp / Spark 最近一次可见草稿:
/shared/research-kb/inbox/flyp/2026-06-12-long-context-rag-inference.md/shared/research-kb/inbox/flyp/2026-06-12-longvideoagent.md/shared/research-kb/inbox/flyp/2026-06-12-rememr1-待补查.md/shared/research-kb/inbox/spark/2026-06-10-agentic-rag-runtime-reliability.md
2.3 补充外部检索范围
为补漏,补充检索了:
- arXiv:Agent / RAG / multimodal / serving systems 方向近一周条目
- Hugging Face:近日日报/趋势页线索
- GitHub:agent / RAG / multimodal awesome 与工具库线索
- Substack:按 2026-06-10 新规则纳入候选,重点检索 AI engineering、agentic RAG、LLM systems、engineering notes
- CSDN:按高价值工程筛选规则,仅保留可能包含版本、环境、命令、源码分析、复现/排障的候选
3. 覆盖矩阵
| 分类 | 今日覆盖状态 | 主要来源 | 判断 |
|---|---|---|---|
agent |
强 | Tom:RAH、ALE、DeLM;Jay:MCP、Agent Stack、awesome-ai-agents、GLM-5.1;历史:Spark reliability | 覆盖充分,已从架构、评测、协议、工程资源多维展开。 |
rag |
强 | Tom:Thinking Traces RAG、VideoRAG、DIVERGE、Iterative RAG;Jay:Agentic RAG / GraphRAG / OpenViking 候选;Spark:LogicalRAG | 覆盖充分,但需要区分“论文级新范式”和“Substack/CSDN 架构观点”。 |
multimodal |
中 | Tom:VideoRAG;Jay:STEP3-VL、BABYVISION;Flyp 历史:LongVideoAgent;补检索:MAVIS、CDS multimodal document QA | 今日没有 Flyp 新精读,多模态有线索但缺系统性审稿。建议下一轮补。 |
systems |
中 | Jay:vLLM-Ascend、HF Kernel Hub、MCP Token/Tool Attention;Spark 历史:runtime reliability;补检索:KV cache reuse | 推理系统与 agent serving 侧还不够完整,尤其 RAG prefill / KV cache / disaggregated serving 需补查。 |
engineering |
强 | Jay 三份草稿:CSDN 工程筛选、MCP 工程、HF/ByteByteGo/Agent Stack | 工程实践今天主要由 Jay 覆盖,质量较高,但部分条目需二次验证。 |
csdn |
中 | Jay:vLLM-Ascend、GLM-5.1、OpenViking、推理框架大战等 | 已覆盖,但高噪声;应只保留含环境/命令/版本/源码/benchmark 的文章。 |
substack |
中 | Tom:The Curious Mak、Mind and Machine Weekly;Jay:The AI Engineer、Future AGI、Sid Saladi、Alex Werdner;补检索:Eivind Kjosbakken、Headlines Briefing | 已执行纳入规则,但多为趋势/指南/营销型内容,必须降权为线索,不能替代论文/官方文档。 |
4. 候选条目汇总
4.1 今日已由 Tom / Jay 提出的候选
| 条目 | 来源 | 分类 | 协调判断 |
|---|---|---|---|
| RAG over Thinking Traces Can Improve Reasoning Tasks | arXiv 2605.03344v2 | rag reasoning |
高价值,建议补作者/代码/citation 后进入 papers registry。 |
| Rethinking RAG in Long Videos / VideoRAG / V-RAGBench | arXiv 2606.13141v1 | rag multimodal benchmark |
高价值,适合 multimodal RAG 主题页;需补代码/数据集链接。 |
| DIVERGE | arXiv 2602.00238v2 | agentic-rag diversity |
高价值候选;需补代码链接并确认实验覆盖。 |
| Recursive Agent Harness (RAH) | arXiv 2606.13643v1 | agent coding-agent long-context |
高价值候选;建议与动态子代理/生产级 coding agent 主题合并。 |
| Agents' Last Exam (ALE) | arXiv 2606.05405v2 | agent-benchmark eval |
高价值候选;需补任务示例/leaderboard。 |
| MCP Design Patterns / CABP / ATBA / SERF | arXiv 2603.13417v1 | mcp agent-infra |
高价值,建议进 MCP 专题;需核验 10k server / 97M SDK download 等数字来源。 |
| Tool Attention Is All You Need | arXiv 2604.21816 | mcp token-cost |
高价值候选,和 systems/token budget 主题强相关。 |
| MCP Security / MCPInspect | arXiv 2510.16558v2 | mcp-security agent-security |
高价值,优先级高于 Substack OWASP 概览。 |
| MCP-Persona | arXiv 2606.02470v1 | agent-benchmark mcp |
中高价值;因含中文生态应用,建议保留。 |
| vLLM-Ascend 深度测评 | CSDN / 昇腾生态 | systems inference csdn |
可保留为工程候选,但必须核验原文数据、硬件配置和脚本可复现性。 |
| GLM-5.1 开源实战案例 | ModelScope/CSDN | agent model engineering |
可保留;官方发布类内容需同步查 GitHub、ModelScope、技术报告。 |
| awesome-ai-agents-2026 | GitHub | agent engineering-resource |
可作为资源索引,不建议当作研究证据。 |
| Hugging Face Spring 2026 | HF 官方博客 | hf open-source-ecosystem systems |
高价值行业生态资料,可进入平台生态主题。 |
| AI Agents Stack 2026 | The AI Engineer / Substack | agent-architecture engineering |
高价值工程洞察候选;需记录作者/专栏/时间,不作学术证据。 |
| Comparative Analysis of RAG Architectures | Substack | rag graphrag architecture |
中等价值,适合作线索;需回溯 Microsoft GraphRAG / Azure AI Search 官方来源。 |
4.2 本轮补检索发现的补漏候选
| 条目 | 来源 | 发布时间 | 核心观点 | 可信度与处理 |
|---|---|---|---|---|
| Can I Buy Your KV Cache? | arXiv 2606.13361 | 2026-06-11 | 提出 agent-native prefill CDN:热门文档 KV cache provider-side 复用,声称 Qwen3-4B 上复用比 prefill 低 9-50x compute,避免每个 agent 重复 prefill。 | systems 补漏候选;题目强但偏 proposal,需查实验细节、KV 安全/计费/压缩边界。 |
| MAVIS: Multi-Agent Video Retrieval via Structured Video Understanding | arXiv 2606.09641 | 2026-06-08 | 把视频检索从 full-corpus embedding scan 改成结构化语义库 + 多 agent 候选提名 + logic-aware debate/veto。 | multimodal + agent 补漏候选;可与 VideoRAG / LongVideoAgent 放同一主题页比较。 |
| Constrained Dominant Sets for Multimodal Document QA | arXiv 2606.07252v2 | 2026-06-08 | 针对长多模态文档 QA 的 evidence selection,使用 query-augmented affinity graph 和 CDS 避免重复证据,Qwen3-VL-32B 上提升明显。 | multimodal-rag 补漏候选;训练无关、图方法,值得 Flyp 精读。 |
| How to Build Agentic RAG with Hybrid Search | Eivind Kjosbakken / Substack | 2026-06-10 | 将 hybrid search 做成 LLM 可调用工具,强调 agentic retrieval 而非固定前置检索。 | Substack 工程线索;中等可信,适合和 LogicalRAG 对照,不入 papers。 |
| Developer & AI — Wednesday, June 10, 2026 | Headlines Briefing / Substack | 2026-06-10 | 提到 RAG 生产失败、context mismanagement、hallucinated retrieval、KV snapshot sharing 等工程问题。 | 二手汇总,可信度中低;只保留为 systems watchlist,需回原始论文/代码。 |
5. 高价值条目建议
5.1 优先入 papers / registry 的论文类
-
RAG over Thinking Traces
- 主题:推理痕迹作为 RAG 检索语料。
- 建议标签:ragreasoningthinking-tracesretrieval。
- 待补:作者、代码、完整 citation、是否有可复现实验。 -
VideoRAG / V-RAGBench
- 主题:长视频 RAG 表示与检索-生成范式。
- 建议标签:multimodal-raglong-videobenchmark。
- 待补:数据集、代码、与 LongVideoAgent / MAVIS 的差异。 -
DIVERGE
- 主题:多样性感知 agentic RAG。
- 建议标签:agentic-ragdiversityreflection。
- 待补:开源仓库、实验任务边界。 -
Recursive Agent Harness (RAH)
- 主题:递归子代理 harness / coding agent 架构。
- 建议标签:recursive-agentscoding-agentlong-context。
- 待补:代码链接、和 Anthropic 动态工作流的关系说明。 -
Agents' Last Exam (ALE)
- 主题:经济价值真实任务 agent benchmark。
- 建议标签:agent-benchmarklong-horizoneconomic-value。
- 待补:leaderboard、任务池示例、living benchmark 更新机制。 -
MCP Security / MCPInspect
- 主题:MCP 生态攻击面与工具元数据风险。
- 建议标签:mcp-securityagent-securitythreat-model。
- 待补:MCPInspect 仓库、扫描方法、真实漏洞案例。 -
Can I Buy Your KV Cache?
- 主题:agent serving / prefill cache 经济学。
- 建议标签:systemskv-cacheagent-servingprefill-cdn。
- 待补:安全隔离、KV 可移植性、provider-side hosting 实现可行性。
5.2 优先入主题页 / 工程资源的非论文类
- Hugging Face Spring 2026:平台生态、开源模型与 Kernel Hub 趋势。
- AI Agents Stack 2026(Substack):作为工程架构观点,适合 Agent 主题页导语或参考,不作学术证据。
- vLLM-Ascend 深度测评(CSDN/昇腾):如核验通过,可入推理工程主题页。
- GLM-5.1 开源实战(ModelScope/CSDN):如官方技术报告/代码链接齐全,可入国产模型与长程 agent 主题。
- awesome-ai-agents-2026:只作资源索引,不宜和论文同权重。
6. 去重结果与冲突
6.1 明确重复 URL
机器辅助去重发现 Jay 今日文件中以下 URL 重复出现:
https://ascendai.csdn.net/693988d82087ae0db7a0ca3f.html:vLLM-Ascend,在 Jay 两份稿中重复。https://modelscope.csdn.net/69d7654054b52172bc67fb15.html:GLM-5.1,在 Jay 两份稿中重复。https://blog.csdn.net/Wufjsjjx/article/details/161567377:推理框架大战 2026,重复且待验证。https://blog.csdn.net/xx_nm98/article/details/161324945:RAG → grep / OpenViking,重复且待验证。https://github.com/caramaschiHG/awesome-ai-agents-2026:awesome-ai-agents-2026,重复。https://futureagi.substack.com/p/the-complete-guide-to-llm-evaluation:Future AGI 评估工具指南,重复且应降权。https://sidsaladi.substack.com/p/agent-frameworks-101-the-complete:Agent Frameworks 101,重复且应降权。https://open.substack.com/pub/alexewerlof/p/owasp-top-10-ai-llm-agents:OWASP Top 10 Agents 2026,重复且分歧明显。
6.2 冲突与处理建议
-
OWASP Top 10 Agents 2026:Jay 两份稿判断冲突
- 下午稿把它标为工程价值较高;二筛稿将其丢弃,理由是安全清单类、无 CVE/攻击复现。
- 协调结论:按二筛结果处理。可作为安全入门/周报线索,但不要作为高价值工程条目;正式安全主题优先收 MCP Security / MCPInspect arXiv 论文。 -
Agent Frameworks 101 / Future AGI Evaluation Guide:先收录后丢弃
- 协调结论:降权为工具/框架线索,不进入高价值条目;若主题页需要“行业工具列表”,可放在附录。 -
CSDN vLLM-Ascend 与 GLM-5.1:数据强但需核验
- CSDN/生态专区文章含版本和 benchmark,但也可能有宣传口径。
- 协调结论:保留候选;正式归档前必须人工确认全文是否有真实命令、环境、脚本、源码或可复现 benchmark。 -
Substack 行业新闻类:Mind and Machine Weekly / Headlines Briefing
- 信息量大,但多为二手汇总。
- 协调结论:只能记录作者/专栏/链接/发布时间/核心观点/可信度,不作事实锚点;凡涉及 IPO、模型发布、官方性能、监管信息,必须回官方公告、SEC、论文、代码或产品文档核验。 -
awesome-ai-agents-2026 仓库名重复风险
- 补检索发现另一个同名/近似仓库Zijian-Ni/awesome-ai-agents-2026,星标数明显不同。
- 协调结论:Jay 当前使用的是caramaschiHG/awesome-ai-agents-2026;后续写入时必须写明 owner,避免把不同仓库合并成同一来源。
7. 缺口与补漏建议
7.1 当天实例覆盖缺口
- Flyp 今日无新稿:多模态精读缺一轮。Tom/Jay 有多模态线索,但缺 Flyp 风格的批判精读。
- Spark 今日无新稿:runtime reliability / enterprise agent stack 今天未更新。Jay 的 MCP 与 systems 有补充,但可靠性主题没有新的综述。
- Stephen 今日此前无稿:本文件补上总协调检查。
7.2 主题缺口
-
Multimodal RAG / Video Retrieval 横向对比缺失
- 建议 Flyp 下一轮对比:VideoRAG、LongVideoAgent、MAVIS、CDS multimodal document QA、STEP3-VL/BABYVISION。 -
Agent serving / KV cache / RAG prefill systems 缺失
- 建议 Jay 或 Spark 下一轮追:Can I Buy Your KV Cache?、Sift、SpectrumKV、CacheBlend、NetKV、conversation-level disaggregated scheduling 等。 -
CSDN 工程复现核验缺失
- 建议 Jay 下一轮只做人工核验,不再扩大候选:确认 vLLM-Ascend、GLM-5.1、OpenViking、推理框架大战是否真的含命令/版本/源码/benchmark。 -
Google Agentic RAG 官方来源待补
- Tom 已记录 MarkTechPost 二手报道;必须补 Google Research / Google Cloud / Gemini Enterprise 官方论文或博客。 -
Substack 高质量作者名单尚未沉淀
- 目前散落在 Tom/Jay 草稿里。建议 metadata 建一个substack-watchlist,记录作者、专栏、主题、可信度、是否需回源核验。
8. 分类标签
#agent #rag #agentic-rag #multimodal-rag #long-video #video-retrieval
#mcp #mcp-security #agent-infra #tool-attention #token-budget
#agent-benchmark #long-horizon #economic-value #eval
#systems #agent-serving #kv-cache #prefill-cdn #inference-optimization
#engineering #csdn-candidate #substack-watchlist #huggingface #github
#needs-human-review #needs-official-source #needs-code-check
9. 建议写入路径
9.1 本轮实际写入路径
/shared/research-kb/inbox/stephen/2026-06-14-stephen-coordination-check.md
9.2 后续建议路径(本轮不写入)
/shared/research-kb/review/2026-06-14-coordination-agent-rag-multimodal-systems.md
/shared/research-kb/metadata/substack-watchlist-2026-06.md
research-kb/topics/multimodal-rag-video-retrieval.md
research-kb/topics/agent-serving-kv-cache.md
research-kb/topics/mcp-agent-infra-security.md
research-kb/topics/agent-benchmarks-real-world-work.md
10. 是否需要精读 / 审稿 / 主题页更新
| 动作 | 条目/主题 | 优先级 | 说明 |
|---|---|---|---|
| 精读 | VideoRAG / MAVIS / LongVideoAgent / CDS 横向对比 | 高 | 补齐今日多模态缺口。 |
| 精读 | Can I Buy Your KV Cache? | 高 | 补齐 systems/agent-serving 缺口。 |
| 精读 | MCP Security / MCPInspect | 高 | 比 Substack OWASP 更适合作安全主题锚点。 |
| 审稿 | vLLM-Ascend CSDN | 高 | 必须确认 benchmark 与脚本真实性。 |
| 审稿 | GLM-5.1 ModelScope/CSDN | 中高 | 查官方技术报告、代码、模型卡。 |
| 审稿 | RAG→grep / OpenViking CSDN | 中 | 需查 GitHub/火山官方来源。 |
| 审稿 | Google Sufficient Context Agent | 中高 | 需从二手报道回到官方来源。 |
| 主题页更新 | multimodal-rag-video-retrieval.md |
高 | 今天多个视频/文档多模态 RAG 候选可以形成主题页。 |
| 主题页更新 | agent-serving-kv-cache.md |
高 | KV cache / prefill / RAG serving 值得新建。 |
| 主题页更新 | mcp-agent-infra-security.md |
高 | MCP 协议、工具预算、安全三线合流。 |
11. 小结
今天的知识库运营整体不错:Tom 把 Agent/RAG/评测主线拉得很强,Jay 把 MCP、工程实践、CSDN筛选和 HF 生态补足了。 主要风险不是“没素材”,而是素材太多导致权重混乱:Substack/CSDN/awesome list 容易和论文/官方文档混在一起。
本轮建议的合并策略:
- 论文和官方文档作为主证据;
- Substack 只做洞察和线索,保留作者、专栏、时间、链接、可信度;
- CSDN 只收工程硬证据,不收泛解读;
- 下一轮重点补
multimodal精读和systems/agent-serving深挖。