研究草稿 · Jay · 2026-06-17 早间
本次主题
CSDN 高价值检索 + Substack AI Research 精选(第三次轮询) 范围:RAG 源码实战、PEFT/LoRA/QLoRA 工程、Agentic RAG、Inference-time Compute、多模态部署、2026 Agent 框架选型
🔴 高价值条目(CSDN)
1. RAG 技术:20种方法源码解读与实践
- 来源:CSDN博客
xxue345678,ID146395957 - URL:
https://blog.csdn.net/xxue345678/article/details/146395957 - 内容摘要:检索增强生成20种实现方法的源码级解读,覆盖Chunk优化、多路召回、重排等核心环节。
- 工程价值:⭐⭐⭐⭐⭐ 源码层面,非概念介绍,适合工程落地
- 复现价值:高,提供了多种方法对比
- 涉及版本/框架:LangChain生态
- 可信度:中高,来源CSDN博客,有代码展示
- 建议分类:
RAG源码工程实践
2. Spring AI 检索增强生成(RAG)模块化解法
- 来源:CSDN博客
alyenc,ID146947644 - URL:
https://blog.csdn.net/alyenc/article/details/146947644 - 内容摘要:Spring AI通过模块化架构支持RAG,拆解retriever/generator解耦设计,适合Java系开发者接入LLM。
- 工程价值:⭐⭐⭐⭐ Java生态LLM接入实战
- 复现价值:中,Spring生态SpringBoot项目
- 涉及版本:Spring AI框架
- 可信度:中
- 建议分类:
RAGSpringJava
3. LLM大模型微调:LoRA原理与实战 + QLoRA量化 + LLaMA-Factory
- 来源:智能体开发者社区
突突,adg.csdn.net - URL:
https://adg.csdn.net/696f3892437a6b403369af7c.html - 内容摘要:双量化(Double Quantization)、NF4量化原理推导;QLoRA存储=INT4权重+FP16缩放因子分解;提供LoRA源码配置;LLaMA-Factory工具部署与训练流程;完整from_pretrained加载脚本。
- 工程价值:⭐⭐⭐⭐⭐ 公式+源码+工具链,完整PEFT知识图谱
- 复现价值:极高,有具体命令和代码片段
- 涉及版本:transformers、peft、bitsandbytes
- 可信度:高,量化计算推导严谨
- 建议分类:
Fine-tuningLoRAQLoRA量化LLaMA-Factory
4. AI Agent从概念到落地:2026年每个开发者都该知道的Agent架构
- 来源:CSDN博客
2504_93822763,ID161370393 - URL:
https://blog.csdn.net/2504_93822763/article/details/161370393 - 内容摘要:AI Agent四大组件(LLM/规划/记忆/工具)+ 2026年主流架构演进;公式推导+代码实战+避坑指南。
- 工程价值:⭐⭐⭐⭐ 概念体系+代码实战
- 复现价值:中高
- 可信度:中
- 建议分类:
AI-Agent架构
5. 2026年AI Agent智能体开发实战:从架构设计到生产部署完整指南
- 来源:CSDN博客
shaobingj126,ID161368617 - URL:
https://blog.csdn.net/shaobingj126/article/details/161368617 - 内容摘要:Agent系统架构全景图+多框架横评(LangGraph/Claude Agent SDK/OpenAI Agents SDK)+ 生产部署注意事项。
- 工程价值:⭐⭐⭐⭐ 覆盖完整开发生命周期
- 可信度:中
- 建议分类:
AI-AgentDevOps生产部署
6. Dify 2026多模态集成权威指南
- 来源:CSDN博客
VarLens,ID160792978 - URL:
https://blog.csdn.net/VarLens/article/details/160792978 - 内容摘要:Dify 2026原生多模态协同架构,视觉编码器(ViT-L/14)+统一语义空间对齐;7步落地法。
- 工程价值:⭐⭐⭐⭐ 低代码平台多模态实战
- 可信度:中
- 建议分类:
MultimodalDify低代码
7. 多模态LLM落地实战:从架构选型到推理部署的12个生死关卡
- 来源:CSDN博客
weixin_30172941,ID161298562 - URL:
https://blog.csdn.net/weixin_30172941/article/details/161298562 - 内容摘要:基于Qwen-VL、LLaVA-1.6、Fuyu-8B开源基座定制化改造,从系统日志、监控面板、失败case出发总结12个关卡。
- 工程价值:⭐⭐⭐⭐⭐ 真实部署排障经验,非泛泛而谈
- 复现价值:极高,开源基座+详细失败case
- 可信度:高,工程实战总结
- 建议分类:
Multimodal部署排障Qwen-VLLLaVA
🟡 Substack 高价值条目
1. Four Levels of RAG — Microsoft Research
- 来源:Cobus Greyling Substack(高影响力AI newsletter)
- URL:
https://cobusgreyling.substack.com/p/four-levels-of-rag-research-from - 作者/专栏:Cobus Greyling(知名RAG研究者)
- 发布时间:2026(持续更新)
- 核心观点:微软研究院将RAG分为4个Level——L1: token/向量检索 → L2: 引入reasoning/action(Agentic RAG雏形)→ L3: 可解释和隐式推理依据 → L4: 超越个人助手的系统性RAG。Level 2开始具备Agentic特征,需要同时具备事实知识和领域指南解读能力。
- 可信度判断:⭐⭐⭐⭐⭐ 来自微软研究院,有论文支撑
- 是否需要核验:建议对照微软GraphRAG/MS RAG论文原址
- 后续行动:纳入RAG体系页更新
2. RAG Reimagined: 5 Breakthroughs (Gradient Flow)
- 来源:Gradient Flow Substack
- URL:
https://gradientflow.substack.com/p/rag-reimagined-5-breakthroughs-you - 作者/专栏:Gradient Flow(Ben Lorica主编,MLSys领域权威)
- 核心观点:①推理模型+Inference-time compute将RAG从静态pipeline变为动态自适应系统;②Snowflake AI Research指出即使专用模型也对模糊上下文存在挑战;③LanceDB v2专为AI/ML workload优化,支持向量+多数据类型;④多模态RAG融合视觉编码器。
- 可信度判断:⭐⭐⭐⭐⭐ 主编为ODSC联创,领域深度可信
- 是否需要核验:关注LanceDB v2官方blog和Snowflake论文
- 后续行动:Inference-time compute主题页可引用
3. The "Thinking" Revolution: RLVR & Inference-Time Scaling 2025/2026
- 来源:Interesting Engineering Substack
- URL:
https://interestingengineering.substack.com/p/the-thinking-revolution-how-inference - 核心观点:DeepSeek R1是"推理时计算"的催化剂;2026年AI Lab焦点:①Inference-Time Scaling(o1后各厂跟进);②RLVR(可验证奖励的强化学习);③数学/代码以外领域可能遭遇瓶颈。
- 可信度判断:⭐⭐⭐⭐
- 是否需要核验:对照DeepSeek R1原始论文和Anthropic 2026 State of AI Agents
- 后续行动:AI趋势主题页;注意Eito Substack关于TTC局限性的补充观点
4. The Limitations of Test-Time Compute (Eito Substack)
- 来源:Eito Substack
- URL:
https://eito.substack.com/p/the-limitations-of-test-time-compute - 核心观点:TTC在数学/代码/逻辑领域表现突出,但在开放式创意、自然语言推理等任务上收益边际递减;预训练→TTC的叙事存在"营销包装"嫌疑;AGI进展可能在非数学领域趋于平台期。
- 可信度判断:⭐⭐⭐⭐ 批判性视角,与主流叙事形成对冲
- 后续行动:纳入AI趋势报告对立观点;注意作者在agentic landscape应用层的补充
5. Comparative Analysis of RAG Architectures: Pipeline / Agentic / Knowledge Graph (2026)
- 来源:Michael Allan Ham Substack
- URL:
https://micheallanham.substack.com/p/comparative-analysis-of-rag-architectures - 核心观点:2026 RAG格局已从Pipeline RAG(一跳检索)演进到三足鼎立:Pipeline RAG(低延迟单跳)、Agentic RAG(动态自纠正循环)、Knowledge Graph RAG(实体关系结构化)。微软/Azure AI Search、LangChain均已产品化Agentic RAG。
- 可信度判断:⭐⭐⭐⭐
- 是否需要核验:对照LangChain 2026 State of Agent Engineering报告
- 后续行动:RAG主题页更新;框架对比表
6. To Data & Beyond: LLM Papers Weekly (12-17 Jan 2026)
- 来源:To Data & Beyond Substack(Youssef Hosni)
- URL:
https://todatabeyond.substack.com/p/important-llm-papers-for-the-week-504 - 核心观点:①BABYVISION benchmark揭示当前MLLM存在"能力倒置"——医学考试强但3岁儿童视觉原语弱;②武汉大学+高德"社会语义实体分割"研究填补遥感领域空白;③2026年第1-2周arXiv重要论文速览。
- 可信度判断:⭐⭐⭐⭐ 周更arXiv论文精选,质量稳定
- 后续行动:babysion论文值得关注;遥感语义分割可入计算机视觉主题
分类标签
RAG Agentic-RAG Fine-tuning LoRA QLoRA Multimodal AI-Agent Inference-Time-Compute RLVR LLM GraphRAG Dify Spring-AI LLaMA-Factory Qwen-VL LLaVA
建议写入路径
/shared/research-kb/inbox/jay/2026-06-17-csdn-rag-finetuning-agentic-substack.md
是否需要精读/审稿/主题页更新
| 条目 | 操作 | 优先级 |
|---|---|---|
| CSDN RAG 20种方法源码 | 精读,纳入RAG工程实践页 | P0 |
| LLM微调 LoRA/QLoRA/LLaMA-Factory (adg.csdn.net) | 精读,纳入Fine-tuning主题页 | P0 |
| 多模态LLM 12个生死关卡 (Qwen-VL/LLaVA) | 精读,纳入Multimodal部署页 | P0 |
| Four Levels of RAG (Microsoft) | 纳入RAG主题页,核验原论文 | P1 |
| RAG Reimagined 5 Breakthroughs | 纳入RAG+Inference-time页 | P1 |
| Agentic/GraphRAG Architecture Comparative | 纳入RAG主题页框架对比 | P1 |
| Spring AI RAG | Java系参考,纳入力度低 | P2 |
| AI Agent 2026 架构/框架横评 | 纳入Agent框架选型页 | P2 |
| Dify 2026 多模态 | 纳入手册/平台对比 | P2 |
| RLVR/Inference-Time Compute | 纳入AI趋势报告 | P1 |
| TTC Limitations (Eito) | 纳入AI趋势对立观点 | P2 |
| BABYVISION/遥感语义 | 计算机视觉+遥感方向关注 | P2 |
草稿生成时间:2026-06-17 08:20 CST · Jay · 第3次轮询