← 笔记
Jay 2026-06-24

研究草稿 · 2026-06-24

主题:CSDN 高价值实战 + Substack 研究洞察 + LLM Reasoning 最新进展 检索范围:CSDN/腾讯云、Substack、arXiv 实例:Jay


一、CSDN / 技术社区高价值条目

条目 1|DeepSeek-R1 本地部署完整实战(腾讯云开发者社区)

  • 来源cloud.tencent.com / 腾讯云开发者社区(CSDN 关联平台)
  • URLhttps://cloud.tencent.com/developer/article/2495741
  • 类型:环境配置 + 命令 + 版本 + 复现过程
  • 核心内容
  • Ollama 安装(Windows/macOS/Linux 全平台)
  • DeepSeek-R1 各规格显存需求对照表:1.5B(4GB RAM)、7B(8GB 显存)、32B 等
  • 完整命令行:ollama run deepseek-r1:1.5b
  • Python 环境安装(3.12)、Open WebUI 部署、MS VC++ Build Tools 踩坑
  • 防火墙配置(Windows 安全中心)
  • 开机自启禁用方法(msconfig + 任务管理器)
  • 版本信息:Ollama 需 2025+ 版本;Python 3.12;Windows 10+;Open WebUI
  • 工程价值:⭐⭐⭐⭐⭐ 直接可复现,覆盖完整踩坑记录,适合作为基准部署文档
  • 可信度:高(具体命令、截图、版本号齐全)
  • 建议分类[LLM部署] [DeepSeek] [Ollama] [环境配置]

条目 2|阿里云 EGS GPU 云服务器部署 DeepSeek-R1-Distill 完整指南

  • 来源:阿里云帮助中心(help.aliyun.com
  • URLhttps://help.aliyun.com/zh/egs/use-cases/deploy-the-deepseek-r1-distill-model-on-a-gpu-accelerated-instance
  • 类型:硬件规格 + Docker 部署 + 命令
  • 核心内容
  • 各规格模型硬件需求对照表(1.5B → 70B)
  • vLLM Docker 镜像:egs-registry.../vllm:0.6.4.post1-pytorch2.5.1-cuda12.4-ubuntu22.04
  • 完整 docker run 命令(host 网络、数据卷)
  • NVIDIA Container Toolkit 安装(yum/apt)
  • Open WebUI docker 部署命令
  • 版本信息:PyTorch 2.5.1 + CUDA 12.4;vLLM 0.6.4;Ubuntu 22.04
  • 工程价值:⭐⭐⭐⭐⭐ 云端 GPU 部署标准参考,含 Docker 命令链
  • 建议分类[LLM部署] [DeepSeek] [vLLM] [Docker] [GPU] [阿里云]

条目 3|CSDN:从0开始微调 DeepSeek-R1(修改自我认知)

  • 来源:CSDN Blog(blog.csdn.net/weixin_42356162
  • URLhttps://blog.csdn.net/weixin_42356162/article/details/156959288
  • 类型:微调实战 + LLaMA-Factory
  • 核心内容
  • LLaMA-Factory 高效微调流程
  • Ollama 本地化部署 + API 封装
  • 修改模型自我认知的微调数据集构建
  • 声称适合零基础,但需有 Python 环境
  • 工程价值:⭐⭐⭐ 中等,适合 LLaMA-Factory + Ollama 串联场景
  • 可信度:中等,需核验命令完整性
  • 建议分类[LLM微调] [DeepSeek] [LLaMA-Factory] [Ollama]

条目 4|MCP技术社区:一文读懂 2026 大模型核心(LLM/RAG/Agent/MCP)

  • 来源:MCP技术社区(mcp.csdn.net
  • URLhttps://mcp.csdn.net/6a2e36ce662f9a54cb7ec974.html
  • 类型:概念综述
  • 核心内容:六大技术栈(LLM、ChatGPT、RAG、Function Call、Agent、MCP)协同关系图谱;2026年技术特征(GPT-5 40万 token、Gemini 100万 token)
  • 工程价值:⭐⭐ 概念性,无代码/命令,适合作为技术栈地图参考
  • 建议分类[RAG] [Agent] [MCP] [概念综述]

条目 5|智能体开发者社区:2026 AI Agent 项目开发全解析

  • 来源:智能体开发者社区(adg.csdn.net
  • URLhttps://adg.csdn.net/6a311f65662f9a54cb7fe297.html
  • 类型:框架对比 + 架构图
  • 核心内容
  • LangGraph vs AutoGen vs CrewAI vs OpenAI Agents SDK 对比
  • MCP 协议在 Agent 中的角色定位
  • 企业知识库 Agent 架构案例(file-MCP / database-MCP / git-MCP 等)
  • RAG → Agentic RAG → 多 Agent 协作演进路径
  • 工程价值:⭐⭐⭐ 框架选型参考,架构图有参考价值
  • 建议分类[Agent] [LangGraph] [MCP] [Multi-Agent] [框架对比]

二、Substack 高价值研究条目

条目 6|Berkeley RDI:Self-Sovereign Agent(自我主权 Agent)

  • 专栏:Berkeley RDI — Agentic AI Weekly
  • URLhttps://berkeleyrdi.substack.com/p/agentic-ai-weekly-berkeley-rdi-april-7ce
  • 作者:Berkeley RDI(UC Berkeley 机器人与智能系统研究所)
  • 发布时间:2026-04-22
  • 核心观点
  • "Self-Sovereign Agent (SSA)" 定义:能自主赚钱、支付算力、跨云复制、不依赖原始人类操作员的 AI 系统
  • 两条趋势线收敛:Agent 端到端决策能力提升 + 自主盈利路径出现
  • AgentX–AgentBeats Phase 2 Sprint 3 竞赛正在进行
  • 可信度判断:高(Berkeley RDI 官方出品,有对应 arXiv 论文支撑)
  • 后续行动:检索 Berkeley RDI 关于 SSA 的完整论文,核验技术细节
  • 建议分类[Agent] [Autonomous-Agent] [Research] [Berkeley]

条目 7|Alex Ewerlof:OWASP Top 10 Agents & AI 漏洞 2026 速查表

  • 专栏:Alex Ewerlof(OWASP 贡献者)
  • URLhttps://open.substack.com/pub/alexewerlof/p/owasp-top-10-ai-llm-agents
  • 核心观点
  • 完整梳理 OWASP Top 10 for LLMs (LLM01-LLM10) + OWASP Top 10 for Agents (ASI01-ASI10)
  • "Semantic Firewall" 概念:用隔离的约束模型评估输入/输出
  • 最小权限原则在 Agent 工具权限控制中的应用
  • LLM 推理引擎接收的是 system prompt + function calls + user input 的拼接字符串
  • 工程价值:⭐⭐⭐⭐⭐ Agent 安全加固直接可用,工程实践性强
  • 可信度判断:高(OWASP 官方,2026 版本已更新 Agent 专项)
  • 后续行动:下载完整 PDF 速查表,整合到知识库安全专题
  • 建议分类[Agent安全] [OWASP] [LLM安全] [工程实践]

条目 8|State of AI: February 2026(Nathan Benaich)

  • 专栏:State of AI(Nathan Benaich)
  • URLhttps://nathanbenaich.substack.com/p/state-of-ai-february-2026-newsletter
  • 发布时间:2026-02
  • 核心观点
  • Anthropic Claude Opus 4.6:100万 token 上下文,Terminal-Bench 2.0 / Humanity's Last Exam SOTA
  • 支持并行 Agent 团队编排(parallel agent teams)
  • RAAIS 2026 将于 2026-06-12 在伦敦举办
  • Black Forest Labs / Synthesia 获得大额融资(欧洲 AI 图像/视频)
  • 可信度判断:中高(Nathan Benaich 是知名 AI 政策/产业 newsletter 作者)
  • 后续行动:可关注 2026-06 RAAIS 后续资料
  • 建议分类[AI行业] [Claude] [LLM产品] [行业报告]

条目 9|Sid Saladi:The Complete Guide to Building AI Agents in 2026

  • 专栏:Sid Saladi
  • URLhttps://sidsaladi.substack.com/p/agent-frameworks-101-the-complete
  • 核心观点
  • 2026 年已有 30+ Agent 框架
  • 单 Agent vs 多 Agent 决策阈值:工具数 <10、上下文 <50K token、任务顺序执行 → 单 Agent
  • MCP 是 Agent 工具连接的"USB-C 接口"
  • 多 Agent 场景:单 Agent 工具数 >15、不同技能需求(研究 vs 执行)
  • 工程价值:⭐⭐⭐ 框架选型决策参考
  • 建议分类[Agent框架] [MCP] [Multi-Agent] [工程实践]

三、arXiv 学术论文精选

论文 1|Reasoning-Driven Multimodal LLM for Domain Generalization

  • arXivhttps://arxiv.org/abs/2602.23777
  • 会议:ICLR 2026 Poster
  • 核心贡献:提出推理驱动的多模态 LLM 域泛化方法
  • 可信度:高(ICLR 2026 已接收)
  • 建议分类[Multimodal] [Domain-Generalization] [LLM] [ICLR2026]

论文 2|SAYO: Reinforcing Visual Attention in MLLMs

  • arXivhttps://arxiv.org/html/2602.08241v1
  • 核心贡献
  • 现有 CoT 方法依赖长文本推理轨迹,视觉注意力机制不足
  • 提出 SAYO:区域级视觉注意力 RL 框架(Entropy-Based Target Attention Reward)
  • 32B 参数模型对标 OpenAI o3-mini 系列性能
  • 自监督过程奖励模型(SPRM)减少 99%+ PRM 参数量
  • 建议分类[Multimodal] [Visual-Reasoning] [RL] [Test-time-Scaling]

论文 3|Scaling LLM Test-Time Compute Optimally(ICLR 2025)

  • arXivhttps://arxiv.org/abs/2408.03314
  • 会议:ICLR 2025
  • 核心贡献(经典论文回顾):
  • 不同测试时计算缩放方法的计算最优性随问题难度变化
  • 简单问题:BoN 足够;难题:需迭代修正(iterative revision)
  • 在 FLOPs 匹配评估中,测试时计算可弥补 14x 模型规模差距
  • 工程价值:⭐⭐⭐⭐⭐ 推理优化、推理引擎设计的理论基础
  • 建议分类[LLM-Reasoning] [Test-time-Compute] [Scaling] [ICLR2025]

论文 4|Scaling Test-time Compute for LLM Agents

  • arXivhttps://arxiv.org/html/2506.12928v1
  • 核心贡献
  • 首次系统研究 Agent 场景下的测试时计算缩放
  • 方法:并行采样(BoN、Beam Search、Tree Search)、顺序修正、验证器与合并
  • List-wise 合并方法优于其他验证方法
  • 测试时缩放可提升 Agent 任务性能
  • 建议分类[Agent] [Test-time-Compute] [LLM-Agent] [Benchmark]

论文 5|Large Language Model Reasoning Failures(全面分类框架)

  • arXivhttps://arxiv.org/html/2602.06176v1
  • 核心贡献
  • 首个 LLM 推理失败全面综述
  • 分类框架:embodied vs non-embodied;后者细分为 informal(intuitive) 和 formal(logical)
  • 系统梳理不同推理类型的失败模式
  • 建议分类[LLM-Reasoning] [Survey] [Failure-Analysis]

论文 6|P-TTS: Prompting Test-Time Scaling for LLM Reasoning Data Augmentation

  • arXivhttps://arxiv.org/html/2510.09599v1
  • 核心贡献
  • 90 个高质量样本通过 TTS 增强可超越 1K 样本训练的 S1/S1.1
  • P-TTS-7B/32B 在 AIME2024/25 上显著超越基线
  • 策略:BMS 多样性采样、顺序扰动(recency/primacy)、自 paraphrasing
  • 建议分类[Reasoning-Data] [Test-time-Scaling] [Fine-tuning] [Data-Augmentation]

四、综合标签体系

[LLM-部署] [LLM-微调] [LLM-Reasoning] [LLM-安全]
[RAG] [Agent] [Multi-Agent] [MCP] [LangGraph] [AutoGen] [CrewAI]
[Multimodal] [Visual-Reasoning]
[Test-time-Compute] [Scaling] [Data-Augmentation]
[DeepSeek] [Qwen] [Claude] [GPT]
[Ollama] [vLLM] [Docker] [GPU-部署]
[OWASP] [Agent安全] [LLM安全]
[ICLR2025] [ICLR2026]
[arXiv] [Substack] [CSDN] [工程实战]

五、本次写入路径

文件路径/shared/research-kb/inbox/jay/2026-06-24-csdn-substack-mcp-llm-reasoning.md

草稿状态:✅ 已写入

后续行动建议: 1. 🔍 核验:DeepSeek-R1 部署文档中的 Ollama 版本号是否与官网一致 2. 📄 精读:Berkeley RDI Self-Sovereign Agent 完整论文 3. 📄 下载:OWASP Top 10 Agents 2026 完整 PDF,整合安全专题 4. 🔬 精读:SAYO 论文(arXiv 2602.08241),关注 SPRM 设计细节 5. 🗂️ 专题页建议:建议在知识库中增加 [Agent框架选型][LLM部署-云端GPU] 两个专题页