← 笔记
Jay 2026-06-22

📚 学术研究知识库草稿 · Jay · 2026-06-22

主题: LLM Agent / RAG / Mamba SSM / 多模态 2026 Q2 高频检索 检索范围: arXiv、Substack、CSDN (OPC)、SegmentFault、GitHub、Hugging Face 本次高频词: Agentic RAG、Mamba-3、Hybrid-Architecture、Nemotron 3 Super、Context Caching、LLM Agent Stack 2026


🏆 高价值条目(优先精读)

1. Agentic RAG 综述(精读 ⭐⭐⭐⭐⭐)

  • 标题: Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
  • 来源: arXiv:2501.09136 [cs.AI],2026年4月最新修订 v4
  • 作者: Aditi Singh, Abul Ehtesham, Saket Kumar, Tala Talaei Khoei, Athanasios V. Vasilakos
  • 链接: https://arxiv.org/abs/2501.09136
  • 核心观点: 传统 RAG 受限于静态工作流,Agentic RAG 将 LLM Agent 嵌入 RAG 管道,实现自主规划检索策略、多步推理、动态知识更新。涵盖 Taxonomy、Architectures、Evaluation 三大维度。
  • 工程价值: 高——完整分类体系,适合构建 Agentic RAG 系统架构参考
  • 可信度: 高(arXiv 同行评审,ICLR 投稿级别)
  • 后续行动: 建议审稿,补充到知识库 RAG 主题页

2. Mamba-3 状态空间模型(精读 ⭐⭐⭐⭐⭐)

  • 标题: Mamba-3: Improved Sequence Modeling Using State Space Principles
  • 来源: arXiv:2603.15569 [cs.LG],ICLR 2026
  • 作者: Aakash Lahoti, Kevin Y. Li, Berlin Chen, Caitlin Wang, Aviv Bick, J. Zico Kolter, Tri Dao, Albert Gu
  • 链接: https://arxiv.org/abs/2603.15569
  • 核心观点: Mamba 系列的第三代改进,继续推进选择性状态空间模型(Selective SSM),结合 SSM 与 Transformer 各自优势,目标是长上下文高效建模。
  • 工程价值: 高——Nemotron 3 Super 等 2026 新模型已采用 Mamba-2 混合架构,Mamba-3 将是下一代混合模型基础
  • 可信度: 极高(Albert Gu + Tri Dao 原创团队,ICLR 2026)
  • 后续行动: 建议精读,对比 Qwen3.6 Gated DeltaNet 混合架构

3. Sebastian Raschka · LLM Research Papers 2026 List (Jan–May)(精读 ⭐⭐⭐⭐⭐)

  • 来源: Substack — Sebastian Raschka (AI Research Scientist)
  • 链接: https://magazine.sebastianraschka.com/p/llm-research-papers-2026-part1
  • 核心观点(按类别):
  • 架构设计: GLM-5 (智谱, Agentic Engineering)、Arcee Trinity、ViT-5、Delta Attention Residuals、Gated DeltaNet-2
  • 长上下文: The Spike, the Sparse and the Sink: Massive Activations and Attention Sinks
  • Agent 系统: Nemotron 3 Super (Mamba-2 混合 MoE,Agentic Reasoning)
  • 蒸馏/效率: Attention to Mamba (跨架构蒸馏)
  • 小模型: Tiny Aya (多语言)、Nanbeige 4.1-3B
  • 作者/专栏可信度: 高——Sebastian Raschka 是知名 AI 研究者,前 PyTorch Lightning 成员,专栏质量稳定
  • 工程价值: 高——2026 年前 5 个月论文完整分类索引
  • 后续行动: 建议加入知识库「论文速览」系列,按月追踪

4. The AI Agent Stack in 2026(⭐⭐⭐⭐)

  • 来源: Substack — Aishwarya Naresh Reganti
  • 链接: https://thenuancedperspective.substack.com/p/the-ai-agent-stack-in-2026
  • 核心观点: 2026 Agent 技术栈九层架构,从 LLM Provider → 推理优化 → Memory → Tool Registry → Planning → Execution → Observability/Evals → Governance/Security。关键变化:
  • Guardrails 从 I/O 过滤升级为「行动前授权」(guardrails before action)
  • OWASP MCP Top 10 (beta) 发布,工具安全成独立领域
  • Evals 成为 Agent 工程核心,而非事后再补
  • 工程价值: 高——生产 Agent 架构全景图
  • 可信度: 中高(行业工程师视角,有实战经验)
  • 后续行动: 建议作为 OpenClaw Agent 架构页补充参考

5. The AI Agents Stack: LLM to Production (2026 Edition)(⭐⭐⭐⭐)

  • 来源: Substack — Paolo Perrone (The AI Engineer)
  • 链接: https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition
  • 核心观点: 2026 年 Agent 技术栈三大变化: 1. Memory 从「向量数据库+RAG」升级为「三层架构原生记忆」 2. Context Engineering 取代 Prompt Engineering 成为核心学科 3. Memory Blocks(命名结构化字段)出现,Agent 管理自身状态
  • 工程价值: 高——对比 Claude Skills vs MCP,边界设计是关键
  • 可信度: 中高(Engineer-focused Newsletter)
  • 后续行动: 对比 OpenClaw 当前 Memory 实现

6. All You Need to Know About RAG in 2026(⭐⭐⭐⭐)

  • 来源: Substack — Aishwarya Srinivasan
  • 链接: https://aishwaryasrinivasan.substack.com/p/all-you-need-to-know-about-rag-in
  • 核心观点:
  • 语义分块(Semantic Chunking):基于 cosine distance 判断主题转移,而非固定字符数切分
  • Small-to-Big 策略:小 Chunk 检索精度 + 大 Parent Document 上下文
  • 2026 Pipeline:Hybrid Search (BM25+向量) → Top 100 → Cross-Encoder Re-rank → Top 5-10 → LLM
  • Context Caching:主流厂商已原生集成,可节省 90% 成本
  • 工程价值: 高——RAG 分块与重排序实战技巧
  • 可信度: 中(技术博客,但内容扎实)
  • 后续行动: 建议加入 RAG 工程最佳实践主题页

7. CSDN OPC · RAG+AI Agent 企业级方案深度解析(附完整可运行代码)(⭐⭐⭐)

  • 来源: CSDN OPC 开发者社区
  • 链接: https://opc.csdn.net/6a2d3c4610ee7a33f27c4ea0.html
  • 作者: 里昂肯尼迪
  • 核心观点: 企业级 RAG+Agent 完整实战教程,含:
  • 文档解析(PDF/Word/Excel/Markdown)→ 分块 → 向量化 → 向量库 → RAG → Agent
  • 完整 Python 代码(可直接运行)
  • 生产优化:bge-reranker 重排序、混合检索、Function Call、Docker+K8s 部署
  • 工程价值: 高——代码可运行,二次开发友好
  • 版本信息: Python + LangChain/LangGraph 生态(2026)
  • 可信度: 中(CSDN 质量参差,但这篇有源码、注释完整、工程导向)
  • 后续行动: 建议归入「RAG 实战代码库」参考,注意核实代码时效性

8. CSDN OPC · 2026年必学的五大AI技术(⭐⭐⭐)

  • 来源: CSDN OPC — AtomGit 开源社区
  • 链接: https://gitcode.csdn.net/6a0086b40a2f6a37c5a8f44e.html
  • 核心观点: LLM / RAG / Agent / MCP / Skill 五大技术演进路径(2023→2026):
  • RAG 三代演进:Naive RAG → Advanced RAG → Agentic RAG
  • 新范式:GraphRAG、CAG、Agentic RAG 对比表(准确率 60-70% → 85-95%)
  • MCP 是 AI 的 USB-C,已捐赠 Linux 基金会
  • 工程价值: 中高——技术选型决策树,适合入门者建立全局观
  • 后续行动: 适合作为知识库「AI 技术演进路线图」参考

9. 掘金 · 从零到生产:2026年 AI Agent 学习路线完整版(⭐⭐⭐⭐)

  • 来源: 稀土掘金
  • 链接: https://juejin.cn/post/7638440497716363302
  • 核心观点: Agent 学习路线倒着讲(从痛点反推框架):
  • 阶段一: 吃透 LLM 边界(成本模型、Function Calling 可靠性、Structured Output、Prompt Caching)
  • 阶段二: 200 行无框架手写 Agent(核心循环:llm.call → execute_tool → append result)
  • 阶段三: LangGraph + Pydantic AI + DSPy 三大框架 Demo
  • 阶段四: 生产化(Eval、观测、部署)
  • 避坑: Token 成本控制、中间状态丢失、死循环打断、多模型降级
  • 工程价值: 高——工程化视角,不止于 Demo
  • 后续行动: 推荐作为 Agent 学习路径主题页核心参考

10. 腾讯云开发者 · 2026 RAG 全景:万字长文(⭐⭐⭐⭐)

  • 来源: 腾讯云开发者社区
  • 链接: https://cloud.tencent.com/developer/article/2654878
  • 核心观点: RAG 完整技术栈:
  • 数据入库流水线:Parser → Cleaner → Chunker → Embedder → Indexer
  • 向量库选型:FAISS / pgvector / Pinecone / ES 全面对比
  • LLM 选型矩阵:GPT-4o / Qwen2.5-72B / DeepSeek-V3 等
  • RAG 框架选型:LangChain / LlamaIndex / 自研决策标准
  • 生产飞轮 + 可观测性建设
  • 工程价值: 高——万字全景,覆盖选型决策
  • 后续行动: 建议加入 RAG 主题页

📂 分类标签

#LLM #Agent #RAG #Agentic-RAG #GraphRAG #Mamba #SSM #Hybrid-Architecture
#MCP #Context-Caching #Multimodal #MLOps #OpenClaw #Sebastian-Raschka
#Substack #CSDN #Juejin #Engineering #Production-RAG #Knowledge-Graph

📋 建议写入路径

条目 路径 操作
Agentic RAG Survey /shared/research-kb/inbox/jay/2026-06-22-agentic-rag-survey.md 新建,审稿
Mamba-3 论文 /shared/research-kb/inbox/jay/2026-06-22-mamba3-iclr2026.md 新建,精读
Raschka 2026 Q1-Q2 论文列表 /shared/research-kb/inbox/jay/2026-06-22-raschka-llm-papers-2026.md 新建,加入论文速览系列
Agent Stack 2026 Substack x2 /shared/research-kb/inbox/jay/2026-06-22-agent-stack-2026-substack.md 新建
RAG in 2026 Substack /shared/research-kb/inbox/jay/2026-06-22-rag-2026-substack.md 新建
CSDN RAG+Agent 实战 /shared/research-kb/inbox/jay/2026-06-22-csdn-rag-agent-code.md 新建,归档
掘金 Agent 学习路线 /shared/research-kb/inbox/jay/2026-06-22-juejin-agent-learning-path.md 新建
腾讯云 RAG 全景 /shared/research-kb/inbox/jay/2026-06-22-tencent-rag-2026.md 新建

🔍 本次 Substack 来源记录

作者/机构 专栏 可信度 主题
Sebastian Raschka magazine.sebastianraschka.com ⭐⭐⭐⭐⭐ 高 LLM Research 论文追踪
Aishwarya Naresh Reganti thenuancedperspective.substack.com ⭐⭐⭐⭐ 中高 AI Agent Stack 2026
Paolo Perrone theaiengineer.substack.com ⭐⭐⭐⭐ 中高 Agent 工程化
Aishwarya Srinivasan aishwaryasrinivasan.substack.com ⭐⭐⭐ 中 RAG 2026 实战
FUNDA AI fundaai.substack.com ⭐⭐⭐ 中 Deep LLM 2026

✅ 后续行动

  1. 精读: Mamba-3 论文(arXiv:2603.15569)+ Agentic RAG Survey(arXiv:2501.09136 v4)
  2. 审稿: Raschka 2026 Q1-Q2 论文列表,建立月度追踪机制
  3. 主题页更新: RAG 主题页补充 GraphRAG vs Agentic RAG 对比;Agent 主题页补充 2026 技术栈
  4. CSDN 过滤说明: 本次 CSDN 收录 3 篇(1 篇带源码、1 篇万字综述、1 篇学习路线),均为有工程价值的原创内容;其余 CSDN 结果多为视频导流/低质搬运,已过滤

草稿整理:Jay · 2026-06-22 · 共收录 10 个高价值条目 · Substack 占 5 个 · arXiv 占 2 个