📚 学术研究知识库草稿 · Jay · 2026-06-22

主题： LLM Agent / RAG / Mamba SSM / 多模态 2026 Q2 高频检索 检索范围： arXiv、Substack、CSDN (OPC)、SegmentFault、GitHub、Hugging Face 本次高频词： Agentic RAG、Mamba-3、Hybrid-Architecture、Nemotron 3 Super、Context Caching、LLM Agent Stack 2026

🏆 高价值条目（优先精读）

1. Agentic RAG 综述（精读 ⭐⭐⭐⭐⭐）

标题： Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
来源： arXiv:2501.09136 [cs.AI]，2026年4月最新修订 v4
作者： Aditi Singh, Abul Ehtesham, Saket Kumar, Tala Talaei Khoei, Athanasios V. Vasilakos
链接： https://arxiv.org/abs/2501.09136
核心观点： 传统 RAG 受限于静态工作流，Agentic RAG 将 LLM Agent 嵌入 RAG 管道，实现自主规划检索策略、多步推理、动态知识更新。涵盖 Taxonomy、Architectures、Evaluation 三大维度。
工程价值： 高——完整分类体系，适合构建 Agentic RAG 系统架构参考
可信度： 高（arXiv 同行评审，ICLR 投稿级别）
后续行动： 建议审稿，补充到知识库 RAG 主题页

2. Mamba-3 状态空间模型（精读 ⭐⭐⭐⭐⭐）

标题： Mamba-3: Improved Sequence Modeling Using State Space Principles
来源： arXiv:2603.15569 [cs.LG]，ICLR 2026
作者： Aakash Lahoti, Kevin Y. Li, Berlin Chen, Caitlin Wang, Aviv Bick, J. Zico Kolter, Tri Dao, Albert Gu
链接： https://arxiv.org/abs/2603.15569
核心观点： Mamba 系列的第三代改进，继续推进选择性状态空间模型（Selective SSM），结合 SSM 与 Transformer 各自优势，目标是长上下文高效建模。
工程价值： 高——Nemotron 3 Super 等 2026 新模型已采用 Mamba-2 混合架构，Mamba-3 将是下一代混合模型基础
可信度： 极高（Albert Gu + Tri Dao 原创团队，ICLR 2026）
后续行动： 建议精读，对比 Qwen3.6 Gated DeltaNet 混合架构

3. Sebastian Raschka · LLM Research Papers 2026 List (Jan–May)（精读 ⭐⭐⭐⭐⭐）

来源： Substack — Sebastian Raschka (AI Research Scientist)
链接： https://magazine.sebastianraschka.com/p/llm-research-papers-2026-part1
核心观点（按类别）：
架构设计： GLM-5 (智谱, Agentic Engineering)、Arcee Trinity、ViT-5、Delta Attention Residuals、Gated DeltaNet-2
长上下文： The Spike, the Sparse and the Sink: Massive Activations and Attention Sinks
Agent 系统： Nemotron 3 Super (Mamba-2 混合 MoE，Agentic Reasoning)
蒸馏/效率： Attention to Mamba (跨架构蒸馏)
小模型： Tiny Aya (多语言)、Nanbeige 4.1-3B
作者/专栏可信度： 高——Sebastian Raschka 是知名 AI 研究者，前 PyTorch Lightning 成员，专栏质量稳定
工程价值： 高——2026 年前 5 个月论文完整分类索引
后续行动： 建议加入知识库「论文速览」系列，按月追踪

4. The AI Agent Stack in 2026（⭐⭐⭐⭐）

来源： Substack — Aishwarya Naresh Reganti
链接： https://thenuancedperspective.substack.com/p/the-ai-agent-stack-in-2026
核心观点： 2026 Agent 技术栈九层架构，从 LLM Provider → 推理优化 → Memory → Tool Registry → Planning → Execution → Observability/Evals → Governance/Security。关键变化：
Guardrails 从 I/O 过滤升级为「行动前授权」（guardrails before action）
OWASP MCP Top 10 (beta) 发布，工具安全成独立领域
Evals 成为 Agent 工程核心，而非事后再补
工程价值： 高——生产 Agent 架构全景图
可信度： 中高（行业工程师视角，有实战经验）
后续行动： 建议作为 OpenClaw Agent 架构页补充参考

5. The AI Agents Stack: LLM to Production (2026 Edition)（⭐⭐⭐⭐）

来源： Substack — Paolo Perrone (The AI Engineer)
链接： https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition
核心观点： 2026 年 Agent 技术栈三大变化： 1. Memory 从「向量数据库+RAG」升级为「三层架构原生记忆」 2. Context Engineering 取代 Prompt Engineering 成为核心学科 3. Memory Blocks（命名结构化字段）出现，Agent 管理自身状态
工程价值： 高——对比 Claude Skills vs MCP，边界设计是关键
可信度： 中高（Engineer-focused Newsletter）
后续行动： 对比 OpenClaw 当前 Memory 实现

6. All You Need to Know About RAG in 2026（⭐⭐⭐⭐）

来源： Substack — Aishwarya Srinivasan
链接： https://aishwaryasrinivasan.substack.com/p/all-you-need-to-know-about-rag-in
核心观点：
语义分块（Semantic Chunking）：基于 cosine distance 判断主题转移，而非固定字符数切分
Small-to-Big 策略：小 Chunk 检索精度 + 大 Parent Document 上下文
2026 Pipeline：Hybrid Search (BM25+向量) → Top 100 → Cross-Encoder Re-rank → Top 5-10 → LLM
Context Caching：主流厂商已原生集成，可节省 90% 成本
工程价值： 高——RAG 分块与重排序实战技巧
可信度： 中（技术博客，但内容扎实）
后续行动： 建议加入 RAG 工程最佳实践主题页

7. CSDN OPC · RAG+AI Agent 企业级方案深度解析（附完整可运行代码）（⭐⭐⭐）

来源： CSDN OPC 开发者社区
链接： https://opc.csdn.net/6a2d3c4610ee7a33f27c4ea0.html
作者： 里昂肯尼迪
核心观点： 企业级 RAG+Agent 完整实战教程，含：
文档解析（PDF/Word/Excel/Markdown）→ 分块 → 向量化 → 向量库 → RAG → Agent
完整 Python 代码（可直接运行）
生产优化：bge-reranker 重排序、混合检索、Function Call、Docker+K8s 部署
工程价值： 高——代码可运行，二次开发友好
版本信息： Python + LangChain/LangGraph 生态（2026）
可信度： 中（CSDN 质量参差，但这篇有源码、注释完整、工程导向）
后续行动： 建议归入「RAG 实战代码库」参考，注意核实代码时效性

8. CSDN OPC · 2026年必学的五大AI技术（⭐⭐⭐）

来源： CSDN OPC — AtomGit 开源社区
链接： https://gitcode.csdn.net/6a0086b40a2f6a37c5a8f44e.html
核心观点： LLM / RAG / Agent / MCP / Skill 五大技术演进路径（2023→2026）：
RAG 三代演进：Naive RAG → Advanced RAG → Agentic RAG
新范式：GraphRAG、CAG、Agentic RAG 对比表（准确率 60-70% → 85-95%）
MCP 是 AI 的 USB-C，已捐赠 Linux 基金会
工程价值： 中高——技术选型决策树，适合入门者建立全局观
后续行动： 适合作为知识库「AI 技术演进路线图」参考

9. 掘金 · 从零到生产：2026年 AI Agent 学习路线完整版（⭐⭐⭐⭐）

来源： 稀土掘金
链接： https://juejin.cn/post/7638440497716363302
核心观点： Agent 学习路线倒着讲（从痛点反推框架）：
阶段一： 吃透 LLM 边界（成本模型、Function Calling 可靠性、Structured Output、Prompt Caching）
阶段二： 200 行无框架手写 Agent（核心循环：llm.call → execute_tool → append result）
阶段三： LangGraph + Pydantic AI + DSPy 三大框架 Demo
阶段四： 生产化（Eval、观测、部署）
避坑： Token 成本控制、中间状态丢失、死循环打断、多模型降级
工程价值： 高——工程化视角，不止于 Demo
后续行动： 推荐作为 Agent 学习路径主题页核心参考

10. 腾讯云开发者 · 2026 RAG 全景：万字长文（⭐⭐⭐⭐）

来源： 腾讯云开发者社区
链接： https://cloud.tencent.com/developer/article/2654878
核心观点： RAG 完整技术栈：
数据入库流水线：Parser → Cleaner → Chunker → Embedder → Indexer
向量库选型：FAISS / pgvector / Pinecone / ES 全面对比
LLM 选型矩阵：GPT-4o / Qwen2.5-72B / DeepSeek-V3 等
RAG 框架选型：LangChain / LlamaIndex / 自研决策标准
生产飞轮 + 可观测性建设
工程价值： 高——万字全景，覆盖选型决策
后续行动： 建议加入 RAG 主题页

📂 分类标签

#LLM #Agent #RAG #Agentic-RAG #GraphRAG #Mamba #SSM #Hybrid-Architecture
#MCP #Context-Caching #Multimodal #MLOps #OpenClaw #Sebastian-Raschka
#Substack #CSDN #Juejin #Engineering #Production-RAG #Knowledge-Graph

📋 建议写入路径

条目	路径	操作
Agentic RAG Survey	`/shared/research-kb/inbox/jay/2026-06-22-agentic-rag-survey.md`	新建，审稿
Mamba-3 论文	`/shared/research-kb/inbox/jay/2026-06-22-mamba3-iclr2026.md`	新建，精读
Raschka 2026 Q1-Q2 论文列表	`/shared/research-kb/inbox/jay/2026-06-22-raschka-llm-papers-2026.md`	新建，加入论文速览系列
Agent Stack 2026 Substack x2	`/shared/research-kb/inbox/jay/2026-06-22-agent-stack-2026-substack.md`	新建
RAG in 2026 Substack	`/shared/research-kb/inbox/jay/2026-06-22-rag-2026-substack.md`	新建
CSDN RAG+Agent 实战	`/shared/research-kb/inbox/jay/2026-06-22-csdn-rag-agent-code.md`	新建，归档
掘金 Agent 学习路线	`/shared/research-kb/inbox/jay/2026-06-22-juejin-agent-learning-path.md`	新建
腾讯云 RAG 全景	`/shared/research-kb/inbox/jay/2026-06-22-tencent-rag-2026.md`	新建

🔍 本次 Substack 来源记录

作者/机构	专栏	可信度	主题
Sebastian Raschka	magazine.sebastianraschka.com	⭐⭐⭐⭐⭐ 高	LLM Research 论文追踪
Aishwarya Naresh Reganti	thenuancedperspective.substack.com	⭐⭐⭐⭐ 中高	AI Agent Stack 2026
Paolo Perrone	theaiengineer.substack.com	⭐⭐⭐⭐ 中高	Agent 工程化
Aishwarya Srinivasan	aishwaryasrinivasan.substack.com	⭐⭐⭐ 中	RAG 2026 实战
FUNDA AI	fundaai.substack.com	⭐⭐⭐ 中	Deep LLM 2026

✅ 后续行动

精读： Mamba-3 论文（arXiv:2603.15569）+ Agentic RAG Survey（arXiv:2501.09136 v4）
审稿： Raschka 2026 Q1-Q2 论文列表，建立月度追踪机制
主题页更新： RAG 主题页补充 GraphRAG vs Agentic RAG 对比；Agent 主题页补充 2026 技术栈
CSDN 过滤说明： 本次 CSDN 收录 3 篇（1 篇带源码、1 篇万字综述、1 篇学习路线），均为有工程价值的原创内容；其余 CSDN 结果多为视频导流/低质搬运，已过滤

草稿整理：Jay · 2026-06-22 · 共收录 10 个高价值条目 · Substack 占 5 个 · arXiv 占 2 个