Jay CSDN 高价值检索 + Substack 研究线索

检索时间： 2026-06-20 16:20 (UTC+8) 检索范围： CSDN / Substack / Tavily 主题： LLM RAG Agent MCP + Qwen3/DeepSeek 部署微调

🔴 重要安全提示

CVE-2025-14930：Hugging Face Transformers 4.57.1 GLM4 反序列化 RCE

来源： NVD NIST / Zero Day Initiative
受影响版本： transformers==4.57.1
漏洞类型： GLM4 反序列化不受信任数据导致远程代码执行（RCE）
公告： ZDI-25-1145 / CISA-ADP 2026-06-17 更新
建议： 所有生产环境立即检查 pip show transformers 版本，如为 4.57.1 则降级至 4.57.0 或升级至最新稳定版；不要在不可信输入上调用 model.from_pretrained 路径的 GLM 系列模型。
后续核验： 待查 HF 官方 Changelog 确认修复版本
链接： https://nvd.nist.gov/vuln/detail/CVE-2025-14930

📌 CSDN 高价值条目（需浏览器访问确认全文）

1. ⭐⭐⭐ DeepSeek RAG微调实战手册（附可运行代码 + 私有模型量化方案）

URL： https://blog.csdn.net/VarChat/article/details/161313168
时间： 2026-05
标签： RAG DeepSeek LoRA微调 4-bit量化 私有化部署
摘要： 涵盖文档切分策略、向量检索优化、LoRA微调、4-bit量化部署全流程；附可运行代码。面向企业级知识库构建。
工程价值： 高——有代码、有量化方案
可信度： 中（需全文确认代码质量）
建议： 精读，关注文档切分粒度和量化压缩比数据
写入路径： /shared/research-kb/inbox/jay/2026-06-20-csdn-substack-rag-agent-mcp-qwen.md

2. ⭐⭐⭐ RK3588部署Qwen3.5：显存优化60% / 推理加速3倍（附源码与踩坑）

URL： https://blog.csdn.net/fox0329/article/details/160223777
标签： Qwen3.5 RK3588 边缘部署 推理加速 源码
摘要： 边缘AI实战，RK3588（ARM处理器）部署Qwen3.5的完整链路优化，包括显存降低60%、推理加速3倍的实测数据，附源码和真实踩坑记录。
工程价值： 高——边缘部署 + 真实排障经验
可信度： 中高（阅读量/互动量需确认）
建议： 精读，关注 RK3588 硬件约束和优化手段

3. ⭐⭐ Qwen3-235B-A22B + KTransformers 0.3 部署实践：源码安装与多并发测试

URL： https://blog.csdn.net/weixin_29081163/article/details/158860138
标签： Qwen3 MoE KTransformers 源码部署 并发测试
摘要： Qwen3-235B-A22B（MoE）与 KTransformers 0.3 的源码安装、多并发测试完整指南；GGUF 模型选择（Q4_K_M）及实测吞吐数据。
工程价值： 高——MoE 部署 + 源码级安装
建议： 精读

4. ⭐⭐ LangGraph Python 最佳实践 + MCP 集成

URL： https://blog.csdn.net/weixin_38805083/article/details/161898573
标签： LangGraph MCP Python 最佳实践
摘要： LangGraph 与 MCP（Model Context Protocol）集成的 Python 最佳实践，覆盖 MCP 工具桥接到 LangChain/LangGraph 的具体方式。
工程价值： 中高——框架集成实操
建议： 精读，关注 MCP 工具桥接的代码模式

5. ⭐ LangGraph 统一工具集成标准——MCP 工业级实战

URL： https://blog.csdn.net/liuzhupeng/article/details/159989980
标签： MCP Agentic Workflow LangGraph 工业化
摘要： 阐述 MCP 作为 Agentic Workflow 工业化标准协议的价值，分析其与简单接口规范的区别。
工程价值： 中——概念梳理
建议： 快速扫读，可与 Substack 的 The AI Engineers Stack 2026 交叉参考

6. ⭐ RAG、FC / LangGraph、A2A、MCP 区别与联系全景图

URL： https://blog.csdn.net/weixin_69500620/article/details/161209251
标签： RAG Function Calling LangGraph A2A MCP 协议对比
摘要： 横向对比 RAG、FC（Function Calling）、LangGraph、A2A（Agent-to-Agent）、MCP 各层协议/框架的定位与关系，附源码分析。
工程价值： 中——架构梳理
建议： 快速扫读，补充自身知识框架

7. ⭐ Qwen3.5-2B + vLLM 高吞吐部署

URL： https://blog.csdn.net/weixin_32999557/article/details/157495876
标签： Qwen3.5 vLLM 部署 高吞吐
摘要： 使用 vLLM 推理引擎部署 Qwen3.5-2B 的完整教程，含硬件要求、模型选择、启动命令及功能验证。
工程价值： 中——基础部署流程
建议： 快速扫读

🟡 Substack 研究线索

1. ⭐⭐⭐ Comparative Analysis of RAG Architectures: Pipeline, Agentic, and Knowledge Graph (2026)

作者/专栏： Michael Allan-Ham (micheallanham.substack.com)
URL： https://michaelallanham.substack.com/p/comparative-analysis-of-rag-architectures
时间： 2026-02
核心观点：
Pipeline RAG：单跳问答、低延迟基线
Agentic RAG：动态自纠正循环，迭代检索
Knowledge Graph RAG（GraphRAG）：关系查询和全局数据集综合更优，但索引成本高
57% 企业已部署多阶段 Agent，"质量"仍是生产最大障碍
Microsoft Azure AI Search 推出"agentic retrieval"，GraphRAG 已成为独立索引方向
可信度： 高（作者为 RAG 领域知名研究者）
后续行动： 核验 2026 State of AI Agents (Anthropic) 和 2026 State of Agent Engineering (LangChain) 完整报告
引用标签： RAG Agentic RAG GraphRAG 2026-landscape

2. ⭐⭐⭐ OWASP Top 10 Agents & AI Vulnerabilities (2026 Cheat Sheet)

作者/专栏： Alex Ewerlöf (open.substack.com/pub/alexewerlof)
URL： https://open.substack.com/pub/alexewerlof/p/owasp-top-10-ai-llm-agents
时间： 2026
核心观点：
覆盖 OWASP Top 10 LLM (LLM01-LLM10) + OWASP Top 10 Agents (ASI01-ASI10)
关键缓解：Semantic Firewall（用独立约束模型评估输入/输出）、最小权限原则
Agent 工作负载天然循环运行，需要更少监督 = 金融灾难配方
LLM 中指令（system prompt、function calls）和数据（RAG 文档）拼接为同一字符串送入推理引擎 → 注入攻击面
可信度： 高（OWASP 官方合作）
后续行动： 与 CVE-2025-14930 关联分析；建议在知识库安全专题中整合
引用标签： AI安全 OWASP Agent安全 红队

3. ⭐⭐ The AI Agents Stack (2026 Edition)

作者/专栏： The AI Engineer (theaiengineer.substack.com)
URL： https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition
核心观点：
2026 年 Agent 栈有 6 层，其中至少 3 层在 2024 年初不存在
6 层架构：LLM → Tooling → Memory → Orchestration → Evaluation → Deployment
Agent != LLM Stack：Agent 是 think-act-observe 循环，LLM 是推理引擎
典型陷阱：14 个状态图节点 + Redis checkpointer + 失败重试逻辑过度工程化
可信度： 高（The AI Engineer 为 AI Engineer 领域权威 newsletter）
后续行动： 可作为知识库"AI Agent 工程化"主题页的架构参考
引用标签： Agent架构 AI-Engineer 2026-stack

4. ⭐ Agent Frameworks 101: The Complete Guide to Building AI Agents in 2026

作者/专栏： Sid Saladi (sidsaladi.substack.com)
URL： https://sidsaladi.substack.com/p/agent-frameworks-101-the-complete
核心观点：
当前有 30+ Agent 框架，判断是否需要多 Agent：单 Agent 有 15+ 工具且选错工具时 / 任务需要截然不同技能（研究 vs 执行）
少于 10 工具、50K 以内 context、顺序执行 → 坚持单 Agent
MCP 是"Agent 工具的 USB-C"，方向明确
可信度： 中（需全文确认）
引用标签： Agent框架 MCP 多Agent

📋 分类标签汇总

标签	数量
`RAG`	4
`Agent`	4
`MCP`	4
`LangGraph`	3
`DeepSeek`	1
`Qwen3`	3
`vLLM`	1
`KTransformers`	1
`RK3588`	1
`边缘部署`	1
`AI安全`	2
`OWASP`	1
`CVE`	1
`2026-landscape`	3
`微调`	1
`量化`	1

✅ 建议写入路径

实际写入文件： /shared/research-kb/inbox/jay/2026-06-20-csdn-substack-rag-agent-mcp-qwen.md

📋 本次精读/审稿建议

优先级	内容	行动
🔴 紧急	CVE-2025-14930 Transformers 4.57.1 RCE	立即在知识库安全页更新，所有生产 HF 环境排查
🔴 精读	RK3588 Qwen3.5 源码+踩坑 (CSDN)	下载后转储关键步骤
🔴 精读	DeepSeek RAG 微调实战手册	同上
🟡 精读	Qwen3-235B + KTransformers 0.3	MoE 部署参考
🟡 快速	Substack RAG Architecture 对比	补充 RAG 演进知识框架
🟡 快速	OWASP Agents 2026	安全专题整合
🟢 扫读	AI Agents Stack 2026	架构参考

Jay · 2026-06-20 16:20 UTC+8 · CSDN 高频检索 Round