Stephen 总协调检查 · 2026-06-14 晚间
- 执行实例:Stephen
- 检查时间:2026-06-14 22:45 CST 左右
- 任务类型:Anan 学术研究知识库 · 每日协调检查 · 晚间批次
- 本轮目标:核对当天各实例研究简报对
agent、rag、multimodal、systems、engineering、csdn等分类的覆盖;结合 Substack 新规则补充候选来源;指出缺口、冲突、重复与人工确认项。 - GitHub 写入:未执行
git commit/git push/gh pr;未写入/shared/research-kb/published/。
1. 本次主题
晚间总判断:
今天 Agent / RAG / 工程实践覆盖过饱和,systems 在晚间明显补强;多模态线索变多但仍缺 flyP 风格精读;CSDN 与 Substack 的主要问题不是缺少来源,而是重复、权重过高和二手观点混入主证据。
本轮建议把 2026-06-14 的素材拆成四条主线:
- Agent 评测与架构:RAH、ALE、SkillsBench、Text World Models、MCP 设计/安全。
- RAG 范式与系统优化:RAG over Thinking Traces、VideoRAG、DIVERGE、SIFT、GraphRAG vs VectorRAG、reranking/hybrid search。
- Agent serving / systems:Can I Buy Your KV Cache、AgentServeSim、Maestro、InfraMind、Tencent HPC-Ops、Spice v2.0。
- 工程来源治理:CSDN 只收可复现硬证据;Substack 只做洞察和线索,必须记录作者、专栏、链接、时间、可信度与回源核验要求。
2. 检索与核对范围
2.1 已核对共享目录
按共享知识库规则,本轮读取并核对了以下可见草稿目录:
/shared/research-kb/inbox/stephen/
/shared/research-kb/inbox/tom/
/shared/research-kb/inbox/jay/
/shared/research-kb/inbox/flyp/
/shared/research-kb/inbox/spark/
/shared/research-kb/review/
/shared/research-kb/metadata/
其中:
/shared/research-kb/review/:本轮未发现可见文件。/shared/research-kb/metadata/:本轮未发现可见文件。- flyP 最新可见草稿停留在 2026-06-12。
- spark 最新可见草稿停留在 2026-06-10。
2.2 今日重点读取与核对文件
Tom:
/shared/research-kb/inbox/tom/2026-06-14-agent-rag-eval-radar.md
Jay:
/shared/research-kb/inbox/jay/2026-06-14-llm-inference-agent-rag.md
/shared/research-kb/inbox/jay/2026-06-14-engineering-filter-round2.md
/shared/research-kb/inbox/jay/2026-06-14-afternoon-mcp-agentic-rag-hf-spring2026.md
/shared/research-kb/inbox/jay/2026-06-14-afternoon-engineering-filter-round3.md
/shared/research-kb/inbox/jay/2026-06-14-1620-agentic-rag-multimodal-stack-2026.md
/shared/research-kb/inbox/jay/2026-06-14-1735-ai-stack-agentic-substack-trending.md
/shared/research-kb/inbox/jay/2026-06-14-ai-engineering-trending.md
/shared/research-kb/inbox/jay/2026-06-14-llm-agent-rag-engineering.md
/shared/research-kb/inbox/jay/2026-06-14-evening-briefing.md
/shared/research-kb/inbox/jay/2026-06-14-night-briefing.md
Stephen 已有午间协调稿:
/shared/research-kb/inbox/stephen/2026-06-14-stephen-coordination-check.md
为确认历史覆盖与缺口,也核对了各实例可见草稿文件列表和标题/标签/来源域名摘要,覆盖 Stephen、Tom、Jay、flyP、spark 的全部可见草稿。
2.3 外部补充检索范围
本轮外部检索覆盖:
- 学术平台:arXiv、OpenReview 相关线索;重点检索 LLM agents、agent serving、KV cache、RAG prefill、multimodal RAG。
- GitHub / Hugging Face:Agent/RAG/multimodal/inference 相关项目与模型卡;包括 Hugging Face、GitHub、GitHub Blog。
- 官方技术博客 / 工程博客:结合 Jay 草稿中的 HF、NVIDIA、Tencent、Spice、Modular 等官方或准官方工程来源。
- CSDN / 中文技术社区:重点查找含版本、环境、命令、源码分析、复现过程、真实排障经验的候选;本轮外部 CSDN 检索噪声较高,未新增比 Jay 已收条目更强的高价值 CSDN 候选。
- Substack:按 2026-06-10 新规则纳入候选来源,重点检索 AI engineering、LLM systems、agentic RAG、reranking、agent architecture、engineering notes。
3. 覆盖矩阵
| 分类 | 晚间覆盖状态 | 主要覆盖来源 | 协调判断 |
|---|---|---|---|
agent |
强 | Tom:RAH、ALE;Jay:SkillsBench、Text World Models、MCP、Agent Stack;Substack:agentic system 工程观点 | 覆盖充分。应把论文/benchmark 放主证据,Substack 只做工程视角。 |
rag |
强 | Tom:Thinking Traces、VideoRAG、DIVERGE;Jay:SIFT、UnWeaving GraphRAG、BRTR;Substack:hybrid search、reranking | 覆盖充分,但需要把 RAG 范式、系统优化、工程教程分层。 |
multimodal |
中高 | Tom:VideoRAG;Jay:BRTR、多模态 spreadsheet retrieval、HF multimodal 模型线索;历史 flyP:LongVideoAgent、LLaDA-V | 线索变多,但 flyP 今日无新精读;缺横向批判综述。 |
systems |
强 | Jay:SIFT、Tencent HPC-Ops、Spice v2.0、MLSys/Modular;补检索:Can I Buy Your KV Cache、AgentServeSim、Maestro、InfraMind | 晚间明显补强。建议新建 agent-serving-kv-cache / rag-prefill-systems 主题。 |
engineering |
强 | Jay 多份工程筛选;Substack:production failure/eval gap、reranking、agentic RAG;CSDN:vLLM-Ascend、GLM-5.1 等 | 内容充足但噪声高;必须区分可复现工程证据与架构观点。 |
csdn |
中 | Jay:vLLM-Ascend、GLM-5.1、推理框架大战、OpenViking/RAG→grep | 已覆盖但重复多;正式入库前要查全文、命令、版本、硬件、benchmark。 |
substack |
强但需降权 | The AI Engineer、ByteByteGo、Eivind Kjosbakken、Tech in General/Hari Krishna、Causal Data Science/erdogant、OSINTech | 已执行纳入规则;但多数是工程观点或工具清单,不替代论文/官方文档。 |
4. 候选条目
4.1 今日实例已提出的主要候选
| 条目 | 来源 | 分类 | 协调判断 |
|---|---|---|---|
| RAG over Thinking Traces Can Improve Reasoning Tasks | arXiv 2605.03344v2 / Tom | rag reasoning |
高价值,适合进入 RAG/reasoning registry;需补作者、代码、实验边界。 |
| Rethinking RAG in Long Videos / VideoRAG / V-RAGBench | arXiv 2606.13141v1 / Tom | multimodal-rag long-video |
高价值,适合多模态 RAG 主题页;需和 LongVideoAgent、MAVIS、VimRAG 横向比较。 |
| DIVERGE | arXiv 2602.00238v2 / Tom | agentic-rag diversity |
高价值候选;需补代码和 diversity-quality tradeoff 的复现实验。 |
| Recursive Agent Harness (RAH) | arXiv 2606.13643v1 / Tom | agent coding-agent |
高价值;适合和动态子代理、生产级 coding agent harness 主题合并。 |
| Agents' Last Exam (ALE) | arXiv 2606.05405v2 / Tom | agent-benchmark eval |
高价值;需补 leaderboard、任务池和 living benchmark 更新机制。 |
| BRTR — Beyond Rows to Reasoning | arXiv 2603.06503v1 / Jay | multimodal-rag spreadsheet-ai |
高价值;多模态表格/电子表格 agentic retrieval,适合 multimodal RAG 主题。 |
| Text World Models for LLM-based Agents | arXiv 2606.09032v1 / Jay | agent world-model |
高价值研究线索;需核验方法类别和评测任务。 |
| Compound AI Systems 综述 | arXiv 2506.04565v2 / Jay | compound-ai survey |
适合作主题页背景,不宜和 2026 新论文同权重。 |
| SkillsBench | arXiv 2602.12670 / Jay | agent-benchmark skills |
高价值;含任务、领域、配置和 deterministic verifiers,建议优先精读。 |
| MCP Design Patterns / Tool Attention / MCP Security | arXiv / Jay | mcp agent-infra security |
高价值;优先级高于泛化 Substack 安全清单。 |
| SIFT — Selective-Index for Fast Compute of RAG Prefill | arXiv 2606.09441 / Jay | rag-systems prefill |
高价值 systems 补强;需查代码与 attention invariance 指标。 |
| When More Cores Hurts | arXiv 2606.08950 / Jay | vector-db hpc |
中高价值;补齐 RAG 数据侧扩展问题。 |
| UnWeaving GraphRAG | arXiv 2603.29875v3 / Jay | graphrag retrieval-theory |
高争议但有价值;需实证验证,避免直接采纳“GraphRAG 被过度宣传”的结论。 |
| Tencent HPC-Ops | GitHub / Jay | inference-kernel cuda |
高工程价值;腾讯混元 AI Infra 官方工程项目,适合 systems 工程主题。 |
| Spice v2.0.0 | GitHub release / Jay | database ai-data-infra |
中高价值;作为 AI 数据基础设施线索,需查官方 release 与生产案例。 |
| vLLM-Ascend 深度测评 | CSDN/昇腾生态 / Jay | csdn inference |
可保留候选;必须核验硬件、版本、脚本、benchmark 可复现性。 |
| GLM-5.1 开源实战 | ModelScope/CSDN / Jay | model agent |
可保留候选;需回到官方模型卡、GitHub、技术报告。 |
4.2 本轮外部补充候选
| 条目 | 来源 | 发布时间 | 核心观点 | 可信度与处理建议 |
|---|---|---|---|---|
| Can I Buy Your KV Cache? | arXiv 2606.13361 | 2026-06-11 | 提出 provider-side KV cache / prefill 复用经济学,面向大规模 agent 重复读取热门长文档。 | systems 高价值候选;需核验安全隔离、KV 迁移成本、计费模型、实验设置。 |
| AgentServeSim | arXiv 2606.09613v1 | 2026-06 | 面向多轮 LLM Agent serving 的硬件感知模拟器,显式建模 tool gaps、KV residency、session-aware routing。 | agent-serving 高价值候选;建议与 Maestro/InfraMind 同入 systems 主题。 |
| Maestro: Workload-Aware Cross-Cluster Scheduling for LLM-Based Multi-Agent Systems | arXiv 2606.12950v1 | 2026-06-11 | 关注多 Agent 系统跨集群调度、stage cost prediction、KV cache 与模型放置。 | systems 高价值候选;需查代码、模拟/真实集群实验。 |
| InfraMind: Infrastructure-Aware Multi-Agent Orchestration | arXiv 2606.11440v1 | 2026-06 | 使用 serving telemetry 做跨模型/跨 agent routing,弥补 vLLM/SGLang 只优化单模型内部推理的边界。 | systems 中高价值;需确认评测负载和开源状态。 |
| A Survey on Long-Term Memory Security in LLM Agents | arXiv 2604.16548v2 | 2026-06-11 v2 | 从长期记忆生命周期梳理攻击、防御和治理,覆盖 memory poisoning、retrieval corruption、governance。 | agent-security 高价值综述;可补 Spark 可靠性/安全主题缺口。 |
| Google Gemma-4-E2B model card | Hugging Face | 待核验 | HF 搜索命中多模态/音频/长上下文模型卡与 benchmark 表。 | hf 候选;需确认是否官方、版本日期、license、实际能力,不直接写高价值。 |
| nvidia/llama-nemotron-rerank-1b-v2 | Hugging Face | 待核验 | RAG reranking 模型卡,含 vLLM scoring 示例和 Nemotron RAG 关联。 | rag reranker 中高价值;可与 Substack reranking 工程文对照,需查 NVIDIA 官方说明。 |
| Zijian-Ni/awesome-ai-agents-2026 | GitHub | 2026 | 另一个同名/近似 agent 资源列表,覆盖 RAG、coding agents、agent frameworks。 | 只作资源索引;注意和 caramaschiHG/awesome-ai-agents-2026、nickovchinnikov/awesome-ai-agents-2026 区分 owner。 |
4.3 Substack 候选记录(按新规则)
| 作者/专栏 | 原文链接 | 发布时间 | 核心观点 | 可信度判断 | 是否需进一步核验 |
|---|---|---|---|---|---|
| Eivind Kjosbakken / Eivind Kjosbakken | https://eivindkjosbakken.substack.com/p/how-to-build-agentic-rag-with-hybrid | 2026-06-10;文末说明原发 TDS 为 2026-03-13 | 把 hybrid search 做成 agent 可调用工具,允许 agent 改写查询、迭代检索、动态调整 keyword/vector 权重。 | 中高;工程解释清晰,但偏教程/观点。 | 需要用论文/官方文档核验 hybrid search、BM25/RRF、agentic retrieval 的实验收益。 |
| Hari Krishna / Tech in General | https://nandigamharikrishna.substack.com/p/reranking-in-rag-the-missing-layer | 2026-06-13 | 区分 candidate recall、RRF、neural reranking、cross-encoder/late interaction,并强调端到端评测、延迟、成本、权限过滤。 | 高;含代码示例和 primary sources 列表,工程实践价值较强。 | 需回源 Cohere、BAAI、Qwen、ColBERTv2、BEIR、RRF 原始文档/论文。 |
| erdogant / Causal Data Science | https://erdogant.substack.com/p/step-by-step-guide-for-agentic-systems | 2026-06-14 | 用 LLM OS/agentic team 类比解释个人 agentic system,强调结构化、可复现、多 agent、RAG、embedding search。 | 中;部分内容付费,公开段落偏概念导入。 | 只作学习线索;若引用 LLMlight 或实现细节,需查代码/文档。 |
| OSINTech / OSINTech’s OSINT Anatomy Substack | https://osintech.substack.com/p/osintechs-timeline-166-11062026 | 2026-06-14;覆盖 2026-06-05~11 | 工具雷达,列出 Local Deep Research、Superpowers、agent-skills、All Agentic Architectures、AgentShield、Ship-Safe 等。 | 中;人工工具清单,适合发现 GitHub 候选,不适合作技术证据。 | 需要逐个回 GitHub repo 查 stars、license、维护状态、安全边界。 |
| The AI Engineer / Paolo Perrone | https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition | Jay 草稿多次记录为 2026-03/06,日期需核对 | Agent 六层栈、eval layer 不成熟、production failure/eval gap。 | 中高;工程洞察强,但已严重重复。 | 需要核验作者、发布时间、LangChain 调查、benchmark 来源;只做观点,不作学术证据。 |
| ByteByteGo Newsletter | https://blog.bytebytego.com/p/top-ai-github-repositories-in-2026 | Jay 记录为 2026-03 | AI GitHub repo 生态盘点。 | 中;工程 newsletter,适合工具发现。 | 需回 GitHub owner/repo,避免把榜单当事实主证据。 |
5. 高价值条目建议
5.1 优先精读 / registry 的论文与官方来源
-
SkillsBench - 标签:
agent-benchmarkskillsdeterministic-verifier。 - 原因:直接关系到 Claude Code / Gemini CLI / Codex CLI 类 agent skills 的系统性评估。 - 待补:任务样例、负向效果任务、官方网站/GitHub、复现命令。 -
SIFT — RAG Prefill 加速 - 标签:
rag-systemsprefillattention-invariancevector-db。 - 原因:补齐 RAG 从检索到 prefill 的系统瓶颈。 - 待补:attention invariance 指标、硬件设置、代码开源状态。 -
AgentServeSim / Maestro / InfraMind / Can I Buy Your KV Cache? - 标签:
agent-servingkv-cachemulti-agent-systemsscheduling。 - 原因:共同构成“Agent serving 不等于普通 LLM serving”的 systems 主线。 - 待补:真实负载、模拟器代码、与 vLLM/SGLang/Ray Serve/AIBrix 的关系。 -
VideoRAG / BRTR / LongVideoAgent / MAVIS / VimRAG 横向组 - 标签:
multimodal-raglong-videospreadsheet-aievidence-selection。 - 原因:今天多模态线索够形成主题页,但缺批判精读。 - 待补:数据集、代码、评测指标、是否只是在 benchmark 上有效。 -
MCP Security / MCPInspect + Long-Term Memory Security Survey - 标签:
agent-securitymcp-securitymemory-security。 - 原因:安全主题应以论文/工具为主,不以 Substack OWASP 概览为主。 - 待补:攻击面 taxonomy、检测工具仓库、真实案例。 -
Tencent HPC-Ops - 标签:
inference-kernelcudamoeh20vllmsglang。 - 原因:中文大厂官方推理算子库,工程价值高。 - 待补:release、benchmark、license、与 FlashInfer/TensorRT-LLM 对比。
5.2 可入主题页但不作为主证据的工程/观点来源
- The AI Agents Stack 2026:Agent 架构导语/观点材料,需降权并去重。
- Tech in General / Reranking in RAG:RAG reranking 工程实践,可做主题页“工程 checklist”。
- Eivind Kjosbakken / Agentic RAG with Hybrid Search:agentic hybrid retrieval 教程线索。
- ByteByteGo Top AI GitHub Repositories:工具发现来源,不作为项目质量证据。
- OSINTech Timeline:GitHub 工具发现来源;每个 repo 必须回源验证。
5.3 CSDN 保留/待验证建议
保留候选:
- vLLM-Ascend 深度测评:若全文确有硬件、版本、脚本、benchmark,可入
推理工程/CSDN复现。 - GLM-5.1 开源实战:若官方模型卡/代码齐全,可入国产模型/Agent 主题。
待验证或降权:
- LLM 推理框架大战 2026:待全文确认原创性与数据来源。
- RAG → grep / OpenViking:需回火山/字节官方或 GitHub,不能只靠 CSDN 摘要。
- ICLR 2026 Oral 解读:直接读论文更可靠,CSDN 只作中文导读。
6. 去重结果与冲突
6.1 明确重复 URL(2026-06-14 文件内)
本轮机器辅助去重发现重复最明显的条目:
https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition:出现于 5 份 Jay 今日稿。https://open.substack.com/pub/alexewerlof/p/owasp-top-10-ai-llm-agents:出现于 4 份 Jay 今日稿。https://github.com/caramaschiHG/awesome-ai-agents-2026:出现于 3 份 Jay 今日稿。https://ascendai.csdn.net/693988d82087ae0db7a0ca3f.html:vLLM-Ascend,出现于 2 份 Jay 今日稿。https://modelscope.csdn.net/69d7654054b52172bc67fb15.html:GLM-5.1,出现于 2 份 Jay 今日稿。https://blog.csdn.net/Wufjsjjx/article/details/161567377:推理框架大战,出现于 2 份 Jay 今日稿。https://blog.csdn.net/xx_nm98/article/details/161324945:RAG→grep / OpenViking,出现于 2 份 Jay 今日稿。https://futureagi.substack.com/p/the-complete-guide-to-llm-evaluation:出现于 2 份 Jay 今日稿,且已有丢弃判断。https://sidsaladi.substack.com/p/agent-frameworks-101-the-complete:出现于 2 份 Jay 今日稿,且已有丢弃判断。https://arxiv.org/html/2605.03344v2:Tom 与 Jay night briefing 均提到 RAG over Thinking Traces。https://mindandmachineweekly.substack.com/p/weekly-ai-newsletter-may-31-june:Tom 与 Jay night briefing 均提到。
6.2 判断冲突
-
OWASP Top 10 Agents / AI Vulnerabilities - Jay 早些稿件保留,后续二筛丢弃。 - 协调结论:按二筛处理。可作安全入门线索;正式安全主题优先 MCP Security、MCPInspect、Long-Term Memory Security Survey。
-
The AI Agents Stack 2026 - 多稿高频重复,且时间记录有 2026-03 与 2026-06 不一致。 - 协调结论:保留一条标准化记录即可;需核验作者、发布时间、原文是否更新。不要重复写入多个主题页。
-
awesome-ai-agents-2026 owner 混淆 - Jay 今日至少涉及
caramaschiHG/awesome-ai-agents-2026;外部检索还发现Zijian-Ni/awesome-ai-agents-2026、nickovchinnikov/awesome-ai-agents-2026。 - 协调结论:正式入库必须写清 owner/repo/stars/date,不能合并成一个“awesome-ai-agents-2026”。 -
CSDN 条目价值判断不稳定 -
推理框架大战、RAG→grep/OpenViking在初稿中被提及,二筛中标记待验证。 - 协调结论:维持“待验证”。没有全文、命令、版本、benchmark、源码分析前,不进入高价值条目。 -
Substack 可信度被高估 - 多个 Substack 条目被标记为 ⭐⭐⭐⭐⭐,但实质是工程观点/工具清单/趋势文。 - 协调结论:Substack 的可信度应拆成“作者/专栏可信度”和“事实证据可信度”。事实必须回论文、代码、官方文档。
7. 缺口与补漏建议
7.1 实例覆盖缺口
- flyP 今日无新稿:多模态精读缺口仍在。虽然 Tom/Jay 有 VideoRAG、BRTR、HF multimodal 线索,但缺批判性审稿。
- spark 今日无新稿:runtime reliability / enterprise agent stack / 安全治理今日没有独立更新。可由 Long-Term Memory Security Survey、MCP Security、AgentServeSim 补一轮。
- Jay 今日稿过多且重复:需要合并去重,不建议同步任务逐条照搬。
- Tom 覆盖质量高但作者/代码字段常待补:Tom 的论文雷达应补 citation metadata 和 GitHub/code 链接。
7.2 主题缺口
-
Multimodal RAG 横向精读缺失 - 推荐对比:VideoRAG、LongVideoAgent、MAVIS、VimRAG、BRTR、CDS multimodal document QA、MAGIC-Video。
-
Agent serving / KV cache / RAG prefill 主题页缺失 - 推荐收:Can I Buy Your KV Cache、SIFT、SpectrumKV、AgentServeSim、Maestro、InfraMind、NetKV、CacheBlend、conversation-level scheduling。
-
Agent security / memory security 主题页需要升级 - 推荐收:MCP Security / MCPInspect、Long-Term Memory Security Survey、AgentShield/Ship-Safe(需回 GitHub 验证)。
-
RAG reranking / hybrid retrieval 工程页可补 - 推荐结构:candidate recall → hybrid retrieval/RRF → neural reranker → provenance/ACL → answer eval → latency/cost。 - Substack 可做工程 checklist,主证据回 Cohere/BAAI/Qwen/ColBERT/BEIR/RRF。
-
CSDN 人工核验缺口 - 下一轮 Jay 不应继续扩大 CSDN 候选,而应逐条核验现有条目全文质量。
8. 分类标签
#agent #agent-benchmark #agent-skills #recursive-agents #world-models
#rag #agentic-rag #reranking #hybrid-search #graphrag #thinking-traces
#multimodal-rag #long-video #spreadsheet-ai #visual-document-retrieval
#systems #agent-serving #kv-cache #rag-prefill #scheduling #inference-kernel
#mcp #mcp-security #agent-infra #tool-attention #token-budget
#engineering #llmops #production-eval #observability #csdn-candidate
#substack-watchlist #github-watchlist #huggingface #official-blog
#needs-human-review #needs-code-check #needs-official-source #dedup-required
9. 建议写入路径
9.1 本轮实际写入路径
/shared/research-kb/inbox/stephen/2026-06-14-stephen-coordination-check-evening.md
9.2 后续建议路径(本轮不写入)
/shared/research-kb/review/2026-06-14-evening-coordination-agent-rag-systems.md
/shared/research-kb/metadata/substack-watchlist-2026-06.md
/shared/research-kb/metadata/dedup-index-2026-06-14.md
research-kb/topics/agent-serving-kv-cache.md
research-kb/topics/rag-prefill-systems.md
research-kb/topics/multimodal-rag-video-document.md
research-kb/topics/rag-reranking-hybrid-search.md
research-kb/topics/agent-skills-benchmarks.md
research-kb/topics/mcp-agent-security-memory-security.md
10. 是否需要精读 / 审稿 / 主题页更新
| 动作 | 条目/主题 | 优先级 | 说明 |
|---|---|---|---|
| 精读 | SkillsBench | 高 | 直接关系 agent skills 方法论和评测,可服务 Stephen/Anan 的 skill 体系。 |
| 精读 | SIFT + Can I Buy Your KV Cache + AgentServeSim + Maestro + InfraMind | 高 | 形成 agent serving / RAG prefill systems 主线。 |
| 精读 | VideoRAG + BRTR + LongVideoAgent + MAVIS + VimRAG | 高 | 补齐多模态 RAG 横向对比。 |
| 精读 | MCP Security / MCPInspect + Long-Term Memory Security Survey | 高 | 替代泛 Substack 安全清单,建立 Agent 安全主题。 |
| 审稿 | vLLM-Ascend CSDN | 高 | 核验硬件、版本、命令、脚本、benchmark 数据。 |
| 审稿 | GLM-5.1 ModelScope/CSDN | 中高 | 回官方模型卡、技术报告、GitHub/ModelScope。 |
| 审稿 | 推理框架大战 2026 / OpenViking CSDN | 中 | 无全文或无复现细节则降权或丢弃。 |
| 主题页更新 | agent-serving-kv-cache.md / rag-prefill-systems.md |
高 | 晚间 systems 线索已足够成页。 |
| 主题页更新 | multimodal-rag-video-document.md |
高 | 多模态线索充足,但需 flyP 精读支持。 |
| 主题页更新 | rag-reranking-hybrid-search.md |
中高 | Substack 工程文 + 原始论文/模型卡可组合成实用页。 |
| 元数据 | substack-watchlist-2026-06.md |
中高 | 建议沉淀作者/专栏/主题/可信度/回源要求,避免每轮重复检索。 |
11. 小结
今天晚间总体状态:素材非常充足,但同步入库前必须先去重和分层。
建议同步任务采用以下规则:
- 主证据优先级:论文 / 官方文档 / GitHub release / 模型卡 > 高质量工程博客 > Substack/CSDN 观点。
- Substack:保留作者、专栏、链接、时间、核心观点、可信度、回源要求;不复制原文长段,不当事实锚点。
- CSDN:只收含版本、环境、命令、源码分析、复现/排障、真实 benchmark 的文章;泛解读直接降权。
- Jay 今日稿先合并再写库:The AI Agents Stack、OWASP、awesome-ai-agents、CSDN 候选重复明显。
- 下一轮最该补的不是更多搜索,而是三件事:多模态精读、systems/agent-serving 专题、CSDN/Substack 人工核验。