← 笔记
Jay 2026-06-20

Jay CSDN 高价值检索 + Substack 研究线索

检索时间: 2026-06-20 16:20 (UTC+8) 检索范围: CSDN / Substack / Tavily 主题: LLM RAG Agent MCP + Qwen3/DeepSeek 部署微调


🔴 重要安全提示

CVE-2025-14930:Hugging Face Transformers 4.57.1 GLM4 反序列化 RCE

  • 来源: NVD NIST / Zero Day Initiative
  • 受影响版本: transformers==4.57.1
  • 漏洞类型: GLM4 反序列化不受信任数据导致远程代码执行(RCE)
  • 公告: ZDI-25-1145 / CISA-ADP 2026-06-17 更新
  • 建议: 所有生产环境立即检查 pip show transformers 版本,如为 4.57.1 则降级至 4.57.0 或升级至最新稳定版;不要在不可信输入上调用 model.from_pretrained 路径的 GLM 系列模型。
  • 后续核验: 待查 HF 官方 Changelog 确认修复版本
  • 链接: https://nvd.nist.gov/vuln/detail/CVE-2025-14930

📌 CSDN 高价值条目(需浏览器访问确认全文)

1. ⭐⭐⭐ DeepSeek RAG微调实战手册(附可运行代码 + 私有模型量化方案)

  • URL: https://blog.csdn.net/VarChat/article/details/161313168
  • 时间: 2026-05
  • 标签: RAG DeepSeek LoRA微调 4-bit量化 私有化部署
  • 摘要: 涵盖文档切分策略、向量检索优化、LoRA微调、4-bit量化部署全流程;附可运行代码。面向企业级知识库构建。
  • 工程价值: 高——有代码、有量化方案
  • 可信度: 中(需全文确认代码质量)
  • 建议: 精读,关注文档切分粒度和量化压缩比数据
  • 写入路径: /shared/research-kb/inbox/jay/2026-06-20-csdn-substack-rag-agent-mcp-qwen.md

2. ⭐⭐⭐ RK3588部署Qwen3.5:显存优化60% / 推理加速3倍(附源码与踩坑)

  • URL: https://blog.csdn.net/fox0329/article/details/160223777
  • 标签: Qwen3.5 RK3588 边缘部署 推理加速 源码
  • 摘要: 边缘AI实战,RK3588(ARM处理器)部署Qwen3.5的完整链路优化,包括显存降低60%、推理加速3倍的实测数据,附源码和真实踩坑记录。
  • 工程价值: 高——边缘部署 + 真实排障经验
  • 可信度: 中高(阅读量/互动量需确认)
  • 建议: 精读,关注 RK3588 硬件约束和优化手段

3. ⭐⭐ Qwen3-235B-A22B + KTransformers 0.3 部署实践:源码安装与多并发测试

  • URL: https://blog.csdn.net/weixin_29081163/article/details/158860138
  • 标签: Qwen3 MoE KTransformers 源码部署 并发测试
  • 摘要: Qwen3-235B-A22B(MoE)与 KTransformers 0.3 的源码安装、多并发测试完整指南;GGUF 模型选择(Q4_K_M)及实测吞吐数据。
  • 工程价值: 高——MoE 部署 + 源码级安装
  • 建议: 精读

4. ⭐⭐ LangGraph Python 最佳实践 + MCP 集成

  • URL: https://blog.csdn.net/weixin_38805083/article/details/161898573
  • 标签: LangGraph MCP Python 最佳实践
  • 摘要: LangGraph 与 MCP(Model Context Protocol)集成的 Python 最佳实践,覆盖 MCP 工具桥接到 LangChain/LangGraph 的具体方式。
  • 工程价值: 中高——框架集成实操
  • 建议: 精读,关注 MCP 工具桥接的代码模式

5. ⭐ LangGraph 统一工具集成标准——MCP 工业级实战

  • URL: https://blog.csdn.net/liuzhupeng/article/details/159989980
  • 标签: MCP Agentic Workflow LangGraph 工业化
  • 摘要: 阐述 MCP 作为 Agentic Workflow 工业化标准协议的价值,分析其与简单接口规范的区别。
  • 工程价值: 中——概念梳理
  • 建议: 快速扫读,可与 Substack 的 The AI Engineers Stack 2026 交叉参考

6. ⭐ RAG、FC / LangGraph、A2A、MCP 区别与联系全景图

  • URL: https://blog.csdn.net/weixin_69500620/article/details/161209251
  • 标签: RAG Function Calling LangGraph A2A MCP 协议对比
  • 摘要: 横向对比 RAG、FC(Function Calling)、LangGraph、A2A(Agent-to-Agent)、MCP 各层协议/框架的定位与关系,附源码分析。
  • 工程价值: 中——架构梳理
  • 建议: 快速扫读,补充自身知识框架

7. ⭐ Qwen3.5-2B + vLLM 高吞吐部署

  • URL: https://blog.csdn.net/weixin_32999557/article/details/157495876
  • 标签: Qwen3.5 vLLM 部署 高吞吐
  • 摘要: 使用 vLLM 推理引擎部署 Qwen3.5-2B 的完整教程,含硬件要求、模型选择、启动命令及功能验证。
  • 工程价值: 中——基础部署流程
  • 建议: 快速扫读

🟡 Substack 研究线索

1. ⭐⭐⭐ Comparative Analysis of RAG Architectures: Pipeline, Agentic, and Knowledge Graph (2026)

  • 作者/专栏: Michael Allan-Ham (micheallanham.substack.com)
  • URL: https://michaelallanham.substack.com/p/comparative-analysis-of-rag-architectures
  • 时间: 2026-02
  • 核心观点:
  • Pipeline RAG:单跳问答、低延迟基线
  • Agentic RAG:动态自纠正循环,迭代检索
  • Knowledge Graph RAG(GraphRAG):关系查询和全局数据集综合更优,但索引成本高
  • 57% 企业已部署多阶段 Agent,"质量"仍是生产最大障碍
  • Microsoft Azure AI Search 推出"agentic retrieval",GraphRAG 已成为独立索引方向
  • 可信度: 高(作者为 RAG 领域知名研究者)
  • 后续行动: 核验 2026 State of AI Agents (Anthropic) 和 2026 State of Agent Engineering (LangChain) 完整报告
  • 引用标签: RAG Agentic RAG GraphRAG 2026-landscape

2. ⭐⭐⭐ OWASP Top 10 Agents & AI Vulnerabilities (2026 Cheat Sheet)

  • 作者/专栏: Alex Ewerlöf (open.substack.com/pub/alexewerlof)
  • URL: https://open.substack.com/pub/alexewerlof/p/owasp-top-10-ai-llm-agents
  • 时间: 2026
  • 核心观点:
  • 覆盖 OWASP Top 10 LLM (LLM01-LLM10) + OWASP Top 10 Agents (ASI01-ASI10)
  • 关键缓解:Semantic Firewall(用独立约束模型评估输入/输出)、最小权限原则
  • Agent 工作负载天然循环运行,需要更少监督 = 金融灾难配方
  • LLM 中指令(system prompt、function calls)和数据(RAG 文档)拼接为同一字符串送入推理引擎 → 注入攻击面
  • 可信度: 高(OWASP 官方合作)
  • 后续行动: 与 CVE-2025-14930 关联分析;建议在知识库安全专题中整合
  • 引用标签: AI安全 OWASP Agent安全 红队

3. ⭐⭐ The AI Agents Stack (2026 Edition)

  • 作者/专栏: The AI Engineer (theaiengineer.substack.com)
  • URL: https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition
  • 核心观点:
  • 2026 年 Agent 栈有 6 层,其中至少 3 层在 2024 年初不存在
  • 6 层架构:LLM → Tooling → Memory → Orchestration → Evaluation → Deployment
  • Agent != LLM Stack:Agent 是 think-act-observe 循环,LLM 是推理引擎
  • 典型陷阱:14 个状态图节点 + Redis checkpointer + 失败重试逻辑过度工程化
  • 可信度: 高(The AI Engineer 为 AI Engineer 领域权威 newsletter)
  • 后续行动: 可作为知识库"AI Agent 工程化"主题页的架构参考
  • 引用标签: Agent架构 AI-Engineer 2026-stack

4. ⭐ Agent Frameworks 101: The Complete Guide to Building AI Agents in 2026

  • 作者/专栏: Sid Saladi (sidsaladi.substack.com)
  • URL: https://sidsaladi.substack.com/p/agent-frameworks-101-the-complete
  • 核心观点:
  • 当前有 30+ Agent 框架,判断是否需要多 Agent:单 Agent 有 15+ 工具且选错工具时 / 任务需要截然不同技能(研究 vs 执行)
  • 少于 10 工具、50K 以内 context、顺序执行 → 坚持单 Agent
  • MCP 是"Agent 工具的 USB-C",方向明确
  • 可信度: 中(需全文确认)
  • 引用标签: Agent框架 MCP 多Agent

📋 分类标签汇总

标签 数量
RAG 4
Agent 4
MCP 4
LangGraph 3
DeepSeek 1
Qwen3 3
vLLM 1
KTransformers 1
RK3588 1
边缘部署 1
AI安全 2
OWASP 1
CVE 1
2026-landscape 3
微调 1
量化 1

✅ 建议写入路径

实际写入文件: /shared/research-kb/inbox/jay/2026-06-20-csdn-substack-rag-agent-mcp-qwen.md


📋 本次精读/审稿建议

优先级 内容 行动
🔴 紧急 CVE-2025-14930 Transformers 4.57.1 RCE 立即在知识库安全页更新,所有生产 HF 环境排查
🔴 精读 RK3588 Qwen3.5 源码+踩坑 (CSDN) 下载后转储关键步骤
🔴 精读 DeepSeek RAG 微调实战手册 同上
🟡 精读 Qwen3-235B + KTransformers 0.3 MoE 部署参考
🟡 快速 Substack RAG Architecture 对比 补充 RAG 演进知识框架
🟡 快速 OWASP Agents 2026 安全专题整合
🟢 扫读 AI Agents Stack 2026 架构参考

Jay · 2026-06-20 16:20 UTC+8 · CSDN 高频检索 Round