Jay CSDN 高价值检索 + Substack 研究线索
检索时间: 2026-06-20 16:20 (UTC+8) 检索范围: CSDN / Substack / Tavily 主题: LLM RAG Agent MCP + Qwen3/DeepSeek 部署微调
🔴 重要安全提示
CVE-2025-14930:Hugging Face Transformers 4.57.1 GLM4 反序列化 RCE
- 来源: NVD NIST / Zero Day Initiative
- 受影响版本:
transformers==4.57.1 - 漏洞类型: GLM4 反序列化不受信任数据导致远程代码执行(RCE)
- 公告: ZDI-25-1145 / CISA-ADP 2026-06-17 更新
- 建议: 所有生产环境立即检查
pip show transformers版本,如为 4.57.1 则降级至 4.57.0 或升级至最新稳定版;不要在不可信输入上调用model.from_pretrained路径的 GLM 系列模型。 - 后续核验: 待查 HF 官方 Changelog 确认修复版本
- 链接: https://nvd.nist.gov/vuln/detail/CVE-2025-14930
📌 CSDN 高价值条目(需浏览器访问确认全文)
1. ⭐⭐⭐ DeepSeek RAG微调实战手册(附可运行代码 + 私有模型量化方案)
- URL: https://blog.csdn.net/VarChat/article/details/161313168
- 时间: 2026-05
- 标签:
RAGDeepSeekLoRA微调4-bit量化私有化部署 - 摘要: 涵盖文档切分策略、向量检索优化、LoRA微调、4-bit量化部署全流程;附可运行代码。面向企业级知识库构建。
- 工程价值: 高——有代码、有量化方案
- 可信度: 中(需全文确认代码质量)
- 建议: 精读,关注文档切分粒度和量化压缩比数据
- 写入路径:
/shared/research-kb/inbox/jay/2026-06-20-csdn-substack-rag-agent-mcp-qwen.md
2. ⭐⭐⭐ RK3588部署Qwen3.5:显存优化60% / 推理加速3倍(附源码与踩坑)
- URL: https://blog.csdn.net/fox0329/article/details/160223777
- 标签:
Qwen3.5RK3588边缘部署推理加速源码 - 摘要: 边缘AI实战,RK3588(ARM处理器)部署Qwen3.5的完整链路优化,包括显存降低60%、推理加速3倍的实测数据,附源码和真实踩坑记录。
- 工程价值: 高——边缘部署 + 真实排障经验
- 可信度: 中高(阅读量/互动量需确认)
- 建议: 精读,关注 RK3588 硬件约束和优化手段
3. ⭐⭐ Qwen3-235B-A22B + KTransformers 0.3 部署实践:源码安装与多并发测试
- URL: https://blog.csdn.net/weixin_29081163/article/details/158860138
- 标签:
Qwen3MoEKTransformers源码部署并发测试 - 摘要: Qwen3-235B-A22B(MoE)与 KTransformers 0.3 的源码安装、多并发测试完整指南;GGUF 模型选择(Q4_K_M)及实测吞吐数据。
- 工程价值: 高——MoE 部署 + 源码级安装
- 建议: 精读
4. ⭐⭐ LangGraph Python 最佳实践 + MCP 集成
- URL: https://blog.csdn.net/weixin_38805083/article/details/161898573
- 标签:
LangGraphMCPPython最佳实践 - 摘要: LangGraph 与 MCP(Model Context Protocol)集成的 Python 最佳实践,覆盖 MCP 工具桥接到 LangChain/LangGraph 的具体方式。
- 工程价值: 中高——框架集成实操
- 建议: 精读,关注 MCP 工具桥接的代码模式
5. ⭐ LangGraph 统一工具集成标准——MCP 工业级实战
- URL: https://blog.csdn.net/liuzhupeng/article/details/159989980
- 标签:
MCPAgentic WorkflowLangGraph工业化 - 摘要: 阐述 MCP 作为 Agentic Workflow 工业化标准协议的价值,分析其与简单接口规范的区别。
- 工程价值: 中——概念梳理
- 建议: 快速扫读,可与 Substack 的 The AI Engineers Stack 2026 交叉参考
6. ⭐ RAG、FC / LangGraph、A2A、MCP 区别与联系全景图
- URL: https://blog.csdn.net/weixin_69500620/article/details/161209251
- 标签:
RAGFunction CallingLangGraphA2AMCP协议对比 - 摘要: 横向对比 RAG、FC(Function Calling)、LangGraph、A2A(Agent-to-Agent)、MCP 各层协议/框架的定位与关系,附源码分析。
- 工程价值: 中——架构梳理
- 建议: 快速扫读,补充自身知识框架
7. ⭐ Qwen3.5-2B + vLLM 高吞吐部署
- URL: https://blog.csdn.net/weixin_32999557/article/details/157495876
- 标签:
Qwen3.5vLLM部署高吞吐 - 摘要: 使用 vLLM 推理引擎部署 Qwen3.5-2B 的完整教程,含硬件要求、模型选择、启动命令及功能验证。
- 工程价值: 中——基础部署流程
- 建议: 快速扫读
🟡 Substack 研究线索
1. ⭐⭐⭐ Comparative Analysis of RAG Architectures: Pipeline, Agentic, and Knowledge Graph (2026)
- 作者/专栏: Michael Allan-Ham (micheallanham.substack.com)
- URL: https://michaelallanham.substack.com/p/comparative-analysis-of-rag-architectures
- 时间: 2026-02
- 核心观点:
- Pipeline RAG:单跳问答、低延迟基线
- Agentic RAG:动态自纠正循环,迭代检索
- Knowledge Graph RAG(GraphRAG):关系查询和全局数据集综合更优,但索引成本高
- 57% 企业已部署多阶段 Agent,"质量"仍是生产最大障碍
- Microsoft Azure AI Search 推出"agentic retrieval",GraphRAG 已成为独立索引方向
- 可信度: 高(作者为 RAG 领域知名研究者)
- 后续行动: 核验 2026 State of AI Agents (Anthropic) 和 2026 State of Agent Engineering (LangChain) 完整报告
- 引用标签:
RAGAgentic RAGGraphRAG2026-landscape
2. ⭐⭐⭐ OWASP Top 10 Agents & AI Vulnerabilities (2026 Cheat Sheet)
- 作者/专栏: Alex Ewerlöf (open.substack.com/pub/alexewerlof)
- URL: https://open.substack.com/pub/alexewerlof/p/owasp-top-10-ai-llm-agents
- 时间: 2026
- 核心观点:
- 覆盖 OWASP Top 10 LLM (LLM01-LLM10) + OWASP Top 10 Agents (ASI01-ASI10)
- 关键缓解:Semantic Firewall(用独立约束模型评估输入/输出)、最小权限原则
- Agent 工作负载天然循环运行,需要更少监督 = 金融灾难配方
- LLM 中指令(system prompt、function calls)和数据(RAG 文档)拼接为同一字符串送入推理引擎 → 注入攻击面
- 可信度: 高(OWASP 官方合作)
- 后续行动: 与 CVE-2025-14930 关联分析;建议在知识库安全专题中整合
- 引用标签:
AI安全OWASPAgent安全红队
3. ⭐⭐ The AI Agents Stack (2026 Edition)
- 作者/专栏: The AI Engineer (theaiengineer.substack.com)
- URL: https://theaiengineer.substack.com/p/the-ai-agents-stack-2026-edition
- 核心观点:
- 2026 年 Agent 栈有 6 层,其中至少 3 层在 2024 年初不存在
- 6 层架构:LLM → Tooling → Memory → Orchestration → Evaluation → Deployment
- Agent != LLM Stack:Agent 是 think-act-observe 循环,LLM 是推理引擎
- 典型陷阱:14 个状态图节点 + Redis checkpointer + 失败重试逻辑过度工程化
- 可信度: 高(The AI Engineer 为 AI Engineer 领域权威 newsletter)
- 后续行动: 可作为知识库"AI Agent 工程化"主题页的架构参考
- 引用标签:
Agent架构AI-Engineer2026-stack
4. ⭐ Agent Frameworks 101: The Complete Guide to Building AI Agents in 2026
- 作者/专栏: Sid Saladi (sidsaladi.substack.com)
- URL: https://sidsaladi.substack.com/p/agent-frameworks-101-the-complete
- 核心观点:
- 当前有 30+ Agent 框架,判断是否需要多 Agent:单 Agent 有 15+ 工具且选错工具时 / 任务需要截然不同技能(研究 vs 执行)
- 少于 10 工具、50K 以内 context、顺序执行 → 坚持单 Agent
- MCP 是"Agent 工具的 USB-C",方向明确
- 可信度: 中(需全文确认)
- 引用标签:
Agent框架MCP多Agent
📋 分类标签汇总
| 标签 | 数量 |
|---|---|
RAG |
4 |
Agent |
4 |
MCP |
4 |
LangGraph |
3 |
DeepSeek |
1 |
Qwen3 |
3 |
vLLM |
1 |
KTransformers |
1 |
RK3588 |
1 |
边缘部署 |
1 |
AI安全 |
2 |
OWASP |
1 |
CVE |
1 |
2026-landscape |
3 |
微调 |
1 |
量化 |
1 |
✅ 建议写入路径
实际写入文件: /shared/research-kb/inbox/jay/2026-06-20-csdn-substack-rag-agent-mcp-qwen.md
📋 本次精读/审稿建议
| 优先级 | 内容 | 行动 |
|---|---|---|
| 🔴 紧急 | CVE-2025-14930 Transformers 4.57.1 RCE | 立即在知识库安全页更新,所有生产 HF 环境排查 |
| 🔴 精读 | RK3588 Qwen3.5 源码+踩坑 (CSDN) | 下载后转储关键步骤 |
| 🔴 精读 | DeepSeek RAG 微调实战手册 | 同上 |
| 🟡 精读 | Qwen3-235B + KTransformers 0.3 | MoE 部署参考 |
| 🟡 快速 | Substack RAG Architecture 对比 | 补充 RAG 演进知识框架 |
| 🟡 快速 | OWASP Agents 2026 | 安全专题整合 |
| 🟢 扫读 | AI Agents Stack 2026 | 架构参考 |
Jay · 2026-06-20 16:20 UTC+8 · CSDN 高频检索 Round