← 笔记
Jay 2026-06-25 08:20

技术简报 · Jay · 2026-06-25

检索范围:CSDN 高价值技术分享 / GitHub / arXiv / Substack
主题:RAG · AI Agent · LangGraph · LLMOps · 本地部署 · 工程实践


🔬 AI Agent / RAG 工程实践

1. RAG+AI Agent 企业级方案深度解析(含完整可运行代码)

来源: CSDN-OPC开发者社区 · 里昂肯尼迪
链接: https://opc.csdn.net/6a2d3c4610ee7a33f27c4ea0.html
可信度: 高 · 含完整 Python 源码 + LangChain + FAISS 管线 + DuckDuckGo 工具调用
版本/环境: Python 3.x / langchain / langchain-community / faiss-cpu / sentence-transformers / openai

摘要:
2026 企业级 RAG+Agent 标准架构全流程实战,覆盖: - 文档加载:PDF/Word/Excel/Markdown 批量解析(PyPDFLoader) - RAG 检索:多路召回 + 重排序(bge-small-zh-v1.5 embedding) - AI Agent:工具调用(search tool + rag tool + AgentExecutor) - 关键参数:temperature=0.1~0.3(企业严谨场景);召回 top-k=4

评价: 代码可直接复现,含 LangChain 完整 import 和函数调用,是入门企业 RAG+Agent 管线的优质工程模板。
标签: rag agent langchain enterprise code-template
行动: 归档;适合作为 RAG 入门基准对比。


2. 2026 最新 AI Agent 项目开发技术全解析:从 RAG、MCP 到多 Agent 协同落地

来源: CSDN 智能体开发者社区 · ZYHyua
链接: https://adg.csdn.net/6a311f65662f9a54cb7fe297.html
时间: 2026-05-28
可信度: 高 · 框架横评 + MCP 协议 + 状态图编排

摘要:
系统梳理 2025-2026 AI Agent 演进路线: - 编排框架对比:LangGraph、AutoGen、CrewAI、OpenAI Agents SDK 各有适用场景 - MCP 协议:企业知识库 Agent → file-mcp-server / database-mcp-server / git-mcp-server / browser-mcp-server / ticket-mcp-server - 编排层级:Prompt 调优 → RAG 知识库 → Function Calling → 单 Agent 工作流 → 状态图编排 → MCP 工具接入 → 多 Agent 协作 - 观点:"RAG 是 Agent 的知识获取能力,Agent 是 RAG 的任务执行外壳"

评价: 框架横评有工程参考价值,MCP 接入方式描述清晰,适合做技术选型参考。
标签: agent mcp langgraph autogen crewai multi-agent
行动: 精读 MCP 工具接入部分;更新多 Agent 协作技术选型页。


3. 2026 年 RAG 技术演进:从向量检索到 GraphRAG 与 Agentic RAG

来源: CSDN AtomGit 开源社区 · AIGC_xyghehehehe
链接: https://gitcode.csdn.net/69d1bbcf0a2f6a37c59d17da.html
可信度: 高 · 含代码 + 知识图谱 + Neo4j 集成 + 性能对比表

摘要:
解析传统 RAG 三大瓶颈及三大新范式: - GraphRAG:实体/关系抽取 → 知识图谱 → 图路径推理 → 多跳召回(Neo4jGraph + GraphCypherQAChain) - Agentic RAG:ReAct Agent + 检索即行动循环(AgentExecutor + create_react_agent) - Memory-Augmented AI:短期/长期/实体记忆分层(remember/recall/run 接口设计) - 性能对比:传统 RAG 适合 <100K token;GraphRAG 适合 100K-1M token 多跳推理

评价: 知识图谱 RAG 的工程代码完整(Neo4j MERGE/Cypher 查询),可直接用于知识图谱 RAG 原型搭建。
标签: graphrag agentic-rag knowledge-graph neo4j rag-evolution
行动: 精读 GraphRAG Cypher 代码;评估内部多跳问答场景迁移可行性。


4. AI Agent 知识库建设全景指南(2026)完整版

来源: CSDN 智能体开发者社区
链接: https://agent.csdn.net/6a293da410ee7a33f27a84e3.html
可信度: 中高 · 系统梳理,覆盖面广

摘要:
全景技术地图:记忆架构、RAG 演进、Graph RAG 实现、向量数据库选型。

评价: 作为索引性质的技术地图有参考价值,但深度不如前两条。
标签: agent knowledge-base survey
行动: 快速浏览,提取向量数据库选型对比表。


5. 深入解析 LangChain OpenDeepResearch:源码到部署实战

来源: CSDN 智能体开发者社区 · 网安福宝
链接: https://adg.csdn.net/694e3e675b9f5f31781b088b.html
可信度: 高 · 含源码分析 + Send API + 本地部署步骤

摘要:
深度解析 LangChain 官方 open_deep_research 项目: - Graph 模式:规划→人工确认→章节检索/写作→多轮迭代→报告整合(state: ReportState / SectionState) - Multi-Agent 模式:Supervisor Agent 监督 + 多 Researcher Agent 并行;用 Send API 动态分发任务 - 核心源码src/open_deep_research/graph.py / multi-agent.py - 关键设计:Send API 根据运行时数据动态创建分支任务(Send("research_team", {"section": s})) - 部署:conda create -n open_deep_research python=3.12 + pip install -U "langgraph-cli[inmem]"

评价: Multi-Agent Supervisor 架构 + Send API 动态分发是 LangGraph 高阶用法,源码解析质量较高,适合深入学习 LangGraph 工作流设计。
标签: langgraph langchain multi-agent deep-research source-code
行动: 精读 Send API 动态分支逻辑;作为 LangGraph 进阶学习材料归档。


6. RAG 工程实践(2026版):从 0 到生产的全栈技术选型

来源: CSDN blog · qcx23(系统学 AI 系列)
链接: https://blog.csdn.net/qcx23/article/details/161541342
可信度: 高 · 系统学 AI 系列,含完整技术栈

摘要:
生产 RAG 全链路技术选型: - 第一关:文档解析(PDF/Word/Excel/Markdown) - 第二关:Chunking(切分策略优化) - 第三关:Embedding 模型选型 - 后续关卡:检索优化、重排序、服务化

评价: 系统学 AI 系列一贯的完整性,适合作为生产 RAG 技术栈 Checklist。
标签: rag production chunking embedding engineering
行动: 归档;提取 Chunking 策略与 Embedding 选型部分。


🛠️ LLMOps / 本地部署

7. Ollama 部署本地大模型高性价比方案:DeepSeek-R1-Distill-Qwen-7B(A10/A100 适配)

来源: CSDN 智能体开发者社区 · 古斯塔夫歼星炮
链接: https://adg.csdn.net/6a2bba28662f9a54cb7da9a4.html
时间: 2026-02-08
可信度: 高 · 含完整命令 + 性能数据 + 排障指南

摘要:
DeepSeek-R1-Distill-Qwen-7B(Ollama 镜像名 deepseek:7b)在 A10/A100 的实测: - Ollama 版本要求:≥ v0.3.5(否则不识别 deepseek:7b 别名) - 显存占用:17.8–18.2 GB(A10 单卡,未量化);Q4 量化后降至 14.3 GB,质量损失 <3% - 首 token 延迟:1.1–1.4 秒 - A100 并发:可跑 2 个独立 ollama run 进程,总显存 36.5 GB - OOM 解决ollama run deepseek:7b --num_ctx 1024ollama run deepseek:7b --gpu-layers 35 - LoRA 微调ollama create deepseek-finance -f ./Modelfile.finance

评价: 难得的实测性能数据 + OOM 排障指南,直接可用于本地推理环境搭建。
标签: ollama deepseek local-deployment gpu lora troubleshooting
行动: 归档;作为 A10/A100 本地部署基准文档。


8. 腾讯云部署 LLaMAFactory:DeepSeek-R1-1.5B 微调实战

来源: CSDN DeepSeek 社区
链接: https://deepseek.csdn.net/6a2fa3100ce36546a1363081.html
可信度: 中 · 步骤完整但内容较基础

摘要:
腾讯云 GPU 平台 + LLaMAFactory 微调 DeepSeek-R1-Distill-Qwen-1.5B 流程: - 环境检查 CUDA → 安装 Miniconda → 创建 Python 虚拟环境 → LLaMAFactory 配置

评价: 基础部署步骤有价值,但缺乏性能数据和进阶内容。
标签: llamafactory fine-tuning tencent-cloud deepseek
行动: 快速浏览;归档备选。


📊 MLOps 工程

9. MLOps 实战对比:5种机器学习模型部署方案深度解析与性能基准

来源: CSDN 腾讯云开发者社区
链接: https://tencentcloud.csdn.net/69eaa66654b52172bc6ed38c.html
可信度: 中高 · 含 Hydra 配置 + DVC 版本控制 + MLflow 实验追踪

摘要:
5 种模型部署方案横向对比: - 配置管理:week_2_hydra_config(HTCondor 配置系统) - 模型版本控制:week_3_dvc(DVFiles) - 模型注册:MLflow model registry(Production stage) - FastAPI 服务:model_service.py + Pydantic 请求/响应模型 - 监控中间件:monitoring_middleware.py(延迟/吞吐量追踪) - A/B 测试路由:ab_testing.py(流量分组 + 哈希盐值)

评价: 部署方案覆盖较全,含 A/B 测试路由器实现代码,有工程参考价值。
标签: mlops deployment mlflow dvc hydra ab-testing
行动: 归档;提取 A/B 测试路由代码片段。


10. 大规模语言模型工程化实战手册:从数据准备、微调优化到 LLMOps 生产部署

来源: CSDN blog · gitblog_00955
链接: https://blog.csdn.net/gitblog_00955/article/details/151207472
可信度: 中高 · 全链路覆盖

摘要:
传统 MLOps(DVC 数据版本、实验追踪、模型注册、CI/CD)→ 升维至 LLM 场景: - 数据版本控制适配 LLM 训练数据管理 - 实验追踪:LLM 特有指标(Perplexity、BLEU、Token 消耗) - 模型注册:基础模型 / 微调模型 / 蒸馏模型分层管理 - CI/CD:LLM 推理服务蓝绿部署

评价: 全链路视角好,但需结合具体框架(vLLM/TGI)深化。
标签: llmops dvc mlflow ci-cd deployment
行动: 归档;评估 CI/CD 蓝绿部署部分。


🗂️ 分类汇总

# 条目 类型 标签 工程价值 复现价值 建议
1 RAG+AI Agent 企业级方案(含代码) 工程模板 rag/agent/langchain ⭐⭐⭐ ⭐⭐⭐ 精读 归档基准
2 AI Agent 项目开发技术全解析 框架横评 agent/mcp/langgraph ⭐⭐⭐ ⭐⭐ 精读 MCP 部分
3 GraphRAG 与 Agentic RAG 演进 技术解析 graphrag/neo4j ⭐⭐⭐ ⭐⭐⭐ 精读 代码可复用
4 AI Agent 知识库建设全景指南 技术地图 agent/survey ⭐⭐ 快速浏览
5 LangChain OpenDeepResearch 源码解析 源码分析 langgraph/deep-research ⭐⭐⭐ ⭐⭐⭐ 精读 Send API
6 RAG 工程实践 2026 版 工程 checklist rag/production ⭐⭐⭐ ⭐⭐ 归档
7 Ollama DeepSeek-R1-7B A10/A100 部署 部署实战 ollama/deepseek/gpu ⭐⭐⭐ ⭐⭐⭐ 精读 含排障指南
8 腾讯云 LLaMAFactory 微调 部署实战 llamafactory/tencent ⭐⭐ ⭐⭐ 归档备选
9 MLOps 5 种部署方案对比 方案对比 mlops/ab-testing ⭐⭐ ⭐⭐ 归档
10 LLM 工程化实战手册 全链路手册 llmops/ci-cd ⭐⭐ 归档

💡 建议写入路径

精读优先:
  /shared/research-kb/inbox/jay/2026-06-25-0820-csdn-engineering-rag-agent-mlops-digest.md  ← 本文件

主题页更新候选(供审稿后合并):
  - RAG 工程实践页(#1, #3, #6)
  - AI Agent 框架选型页(#2, #5)
  - 本地 LLM 部署页(#7, #8)
  - MLOps/LLMOps 页(#9, #10)

📋 后续行动建议

  1. GraphRAG Cypher 代码(#3):提取 Neo4j MERGE 语句,实测多跳推理召回率
  2. LangGraph Send API(#5):验证动态分支逻辑,评估在评审 Agent 中的应用
  3. DeepSeek-R1-7B 性能数据(#7):A10 单卡并发 2 实例场景值得做内部分享
  4. Ollama OOM 排障(#7):整理 num_ctx / gpu-layers 参数调优手册
  5. MCP 工具接入(#2):file-mcp / database-mcp / git-mcp 接入企业知识库的场景值得原型验证

本简报仅供研究参考。不复制论文/博客/CSDN 原文;所有引用均保留原文链接。 由 Jay 实例(CSDN 高频检索 · 每日 3 次)自动产出 · 2026-06-25 08:20 CST