📚 学术研究知识库草稿 · Jay · 2026-06-22
主题: LLM Agent / RAG / Mamba SSM / 多模态 2026 Q2 高频检索 检索范围: arXiv、Substack、CSDN (OPC)、SegmentFault、GitHub、Hugging Face 本次高频词: Agentic RAG、Mamba-3、Hybrid-Architecture、Nemotron 3 Super、Context Caching、LLM Agent Stack 2026
🏆 高价值条目(优先精读)
1. Agentic RAG 综述(精读 ⭐⭐⭐⭐⭐)
- 标题: Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
- 来源: arXiv:2501.09136 [cs.AI],2026年4月最新修订 v4
- 作者: Aditi Singh, Abul Ehtesham, Saket Kumar, Tala Talaei Khoei, Athanasios V. Vasilakos
- 链接: https://arxiv.org/abs/2501.09136
- 核心观点: 传统 RAG 受限于静态工作流,Agentic RAG 将 LLM Agent 嵌入 RAG 管道,实现自主规划检索策略、多步推理、动态知识更新。涵盖 Taxonomy、Architectures、Evaluation 三大维度。
- 工程价值: 高——完整分类体系,适合构建 Agentic RAG 系统架构参考
- 可信度: 高(arXiv 同行评审,ICLR 投稿级别)
- 后续行动: 建议审稿,补充到知识库 RAG 主题页
2. Mamba-3 状态空间模型(精读 ⭐⭐⭐⭐⭐)
- 标题: Mamba-3: Improved Sequence Modeling Using State Space Principles
- 来源: arXiv:2603.15569 [cs.LG],ICLR 2026
- 作者: Aakash Lahoti, Kevin Y. Li, Berlin Chen, Caitlin Wang, Aviv Bick, J. Zico Kolter, Tri Dao, Albert Gu
- 链接: https://arxiv.org/abs/2603.15569
- 核心观点: Mamba 系列的第三代改进,继续推进选择性状态空间模型(Selective SSM),结合 SSM 与 Transformer 各自优势,目标是长上下文高效建模。
- 工程价值: 高——Nemotron 3 Super 等 2026 新模型已采用 Mamba-2 混合架构,Mamba-3 将是下一代混合模型基础
- 可信度: 极高(Albert Gu + Tri Dao 原创团队,ICLR 2026)
- 后续行动: 建议精读,对比 Qwen3.6 Gated DeltaNet 混合架构
3. Sebastian Raschka · LLM Research Papers 2026 List (Jan–May)(精读 ⭐⭐⭐⭐⭐)
- 来源: Substack — Sebastian Raschka (AI Research Scientist)
- 链接: https://magazine.sebastianraschka.com/p/llm-research-papers-2026-part1
- 核心观点(按类别):
- 架构设计: GLM-5 (智谱, Agentic Engineering)、Arcee Trinity、ViT-5、Delta Attention Residuals、Gated DeltaNet-2
- 长上下文: The Spike, the Sparse and the Sink: Massive Activations and Attention Sinks
- Agent 系统: Nemotron 3 Super (Mamba-2 混合 MoE,Agentic Reasoning)
- 蒸馏/效率: Attention to Mamba (跨架构蒸馏)
- 小模型: Tiny Aya (多语言)、Nanbeige 4.1-3B
- 作者/专栏可信度: 高——Sebastian Raschka 是知名 AI 研究者,前 PyTorch Lightning 成员,专栏质量稳定
- 工程价值: 高——2026 年前 5 个月论文完整分类索引
- 后续行动: 建议加入知识库「论文速览」系列,按月追踪
4. The AI Agent Stack in 2026(⭐⭐⭐⭐)
- 来源: Substack — Aishwarya Naresh Reganti
- 链接: https://thenuancedperspective.substack.com/p/the-ai-agent-stack-in-2026
- 核心观点: 2026 Agent 技术栈九层架构,从 LLM Provider → 推理优化 → Memory → Tool Registry → Planning → Execution → Observability/Evals → Governance/Security。关键变化:
- Guardrails 从 I/O 过滤升级为「行动前授权」(guardrails before action)
- OWASP MCP Top 10 (beta) 发布,工具安全成独立领域
- Evals 成为 Agent 工程核心,而非事后再补
- 工程价值: 高——生产 Agent 架构全景图
- 可信度: 中高(行业工程师视角,有实战经验)
- 后续行动: 建议作为 OpenClaw Agent 架构页补充参考
5. The AI Agents Stack: LLM to Production (2026 Edition)(⭐⭐⭐⭐)
- 来源: Substack — Paolo Perrone (The AI Engineer)
- 链接: https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition
- 核心观点: 2026 年 Agent 技术栈三大变化: 1. Memory 从「向量数据库+RAG」升级为「三层架构原生记忆」 2. Context Engineering 取代 Prompt Engineering 成为核心学科 3. Memory Blocks(命名结构化字段)出现,Agent 管理自身状态
- 工程价值: 高——对比 Claude Skills vs MCP,边界设计是关键
- 可信度: 中高(Engineer-focused Newsletter)
- 后续行动: 对比 OpenClaw 当前 Memory 实现
6. All You Need to Know About RAG in 2026(⭐⭐⭐⭐)
- 来源: Substack — Aishwarya Srinivasan
- 链接: https://aishwaryasrinivasan.substack.com/p/all-you-need-to-know-about-rag-in
- 核心观点:
- 语义分块(Semantic Chunking):基于 cosine distance 判断主题转移,而非固定字符数切分
- Small-to-Big 策略:小 Chunk 检索精度 + 大 Parent Document 上下文
- 2026 Pipeline:Hybrid Search (BM25+向量) → Top 100 → Cross-Encoder Re-rank → Top 5-10 → LLM
- Context Caching:主流厂商已原生集成,可节省 90% 成本
- 工程价值: 高——RAG 分块与重排序实战技巧
- 可信度: 中(技术博客,但内容扎实)
- 后续行动: 建议加入 RAG 工程最佳实践主题页
7. CSDN OPC · RAG+AI Agent 企业级方案深度解析(附完整可运行代码)(⭐⭐⭐)
- 来源: CSDN OPC 开发者社区
- 链接: https://opc.csdn.net/6a2d3c4610ee7a33f27c4ea0.html
- 作者: 里昂肯尼迪
- 核心观点: 企业级 RAG+Agent 完整实战教程,含:
- 文档解析(PDF/Word/Excel/Markdown)→ 分块 → 向量化 → 向量库 → RAG → Agent
- 完整 Python 代码(可直接运行)
- 生产优化:bge-reranker 重排序、混合检索、Function Call、Docker+K8s 部署
- 工程价值: 高——代码可运行,二次开发友好
- 版本信息: Python + LangChain/LangGraph 生态(2026)
- 可信度: 中(CSDN 质量参差,但这篇有源码、注释完整、工程导向)
- 后续行动: 建议归入「RAG 实战代码库」参考,注意核实代码时效性
8. CSDN OPC · 2026年必学的五大AI技术(⭐⭐⭐)
- 来源: CSDN OPC — AtomGit 开源社区
- 链接: https://gitcode.csdn.net/6a0086b40a2f6a37c5a8f44e.html
- 核心观点: LLM / RAG / Agent / MCP / Skill 五大技术演进路径(2023→2026):
- RAG 三代演进:Naive RAG → Advanced RAG → Agentic RAG
- 新范式:GraphRAG、CAG、Agentic RAG 对比表(准确率 60-70% → 85-95%)
- MCP 是 AI 的 USB-C,已捐赠 Linux 基金会
- 工程价值: 中高——技术选型决策树,适合入门者建立全局观
- 后续行动: 适合作为知识库「AI 技术演进路线图」参考
9. 掘金 · 从零到生产:2026年 AI Agent 学习路线完整版(⭐⭐⭐⭐)
- 来源: 稀土掘金
- 链接: https://juejin.cn/post/7638440497716363302
- 核心观点: Agent 学习路线倒着讲(从痛点反推框架):
- 阶段一: 吃透 LLM 边界(成本模型、Function Calling 可靠性、Structured Output、Prompt Caching)
- 阶段二: 200 行无框架手写 Agent(核心循环:llm.call → execute_tool → append result)
- 阶段三: LangGraph + Pydantic AI + DSPy 三大框架 Demo
- 阶段四: 生产化(Eval、观测、部署)
- 避坑: Token 成本控制、中间状态丢失、死循环打断、多模型降级
- 工程价值: 高——工程化视角,不止于 Demo
- 后续行动: 推荐作为 Agent 学习路径主题页核心参考
10. 腾讯云开发者 · 2026 RAG 全景:万字长文(⭐⭐⭐⭐)
- 来源: 腾讯云开发者社区
- 链接: https://cloud.tencent.com/developer/article/2654878
- 核心观点: RAG 完整技术栈:
- 数据入库流水线:Parser → Cleaner → Chunker → Embedder → Indexer
- 向量库选型:FAISS / pgvector / Pinecone / ES 全面对比
- LLM 选型矩阵:GPT-4o / Qwen2.5-72B / DeepSeek-V3 等
- RAG 框架选型:LangChain / LlamaIndex / 自研决策标准
- 生产飞轮 + 可观测性建设
- 工程价值: 高——万字全景,覆盖选型决策
- 后续行动: 建议加入 RAG 主题页
📂 分类标签
#LLM #Agent #RAG #Agentic-RAG #GraphRAG #Mamba #SSM #Hybrid-Architecture
#MCP #Context-Caching #Multimodal #MLOps #OpenClaw #Sebastian-Raschka
#Substack #CSDN #Juejin #Engineering #Production-RAG #Knowledge-Graph
📋 建议写入路径
| 条目 | 路径 | 操作 |
|---|---|---|
| Agentic RAG Survey | /shared/research-kb/inbox/jay/2026-06-22-agentic-rag-survey.md |
新建,审稿 |
| Mamba-3 论文 | /shared/research-kb/inbox/jay/2026-06-22-mamba3-iclr2026.md |
新建,精读 |
| Raschka 2026 Q1-Q2 论文列表 | /shared/research-kb/inbox/jay/2026-06-22-raschka-llm-papers-2026.md |
新建,加入论文速览系列 |
| Agent Stack 2026 Substack x2 | /shared/research-kb/inbox/jay/2026-06-22-agent-stack-2026-substack.md |
新建 |
| RAG in 2026 Substack | /shared/research-kb/inbox/jay/2026-06-22-rag-2026-substack.md |
新建 |
| CSDN RAG+Agent 实战 | /shared/research-kb/inbox/jay/2026-06-22-csdn-rag-agent-code.md |
新建,归档 |
| 掘金 Agent 学习路线 | /shared/research-kb/inbox/jay/2026-06-22-juejin-agent-learning-path.md |
新建 |
| 腾讯云 RAG 全景 | /shared/research-kb/inbox/jay/2026-06-22-tencent-rag-2026.md |
新建 |
🔍 本次 Substack 来源记录
| 作者/机构 | 专栏 | 可信度 | 主题 |
|---|---|---|---|
| Sebastian Raschka | magazine.sebastianraschka.com | ⭐⭐⭐⭐⭐ 高 | LLM Research 论文追踪 |
| Aishwarya Naresh Reganti | thenuancedperspective.substack.com | ⭐⭐⭐⭐ 中高 | AI Agent Stack 2026 |
| Paolo Perrone | theaiengineer.substack.com | ⭐⭐⭐⭐ 中高 | Agent 工程化 |
| Aishwarya Srinivasan | aishwaryasrinivasan.substack.com | ⭐⭐⭐ 中 | RAG 2026 实战 |
| FUNDA AI | fundaai.substack.com | ⭐⭐⭐ 中 | Deep LLM 2026 |
✅ 后续行动
- 精读: Mamba-3 论文(arXiv:2603.15569)+ Agentic RAG Survey(arXiv:2501.09136 v4)
- 审稿: Raschka 2026 Q1-Q2 论文列表,建立月度追踪机制
- 主题页更新: RAG 主题页补充 GraphRAG vs Agentic RAG 对比;Agent 主题页补充 2026 技术栈
- CSDN 过滤说明: 本次 CSDN 收录 3 篇(1 篇带源码、1 篇万字综述、1 篇学习路线),均为有工程价值的原创内容;其余 CSDN 结果多为视频导流/低质搬运,已过滤
草稿整理:Jay · 2026-06-22 · 共收录 10 个高价值条目 · Substack 占 5 个 · arXiv 占 2 个