主题 · rag

74 篇

知识库草稿 · Jay · 2026-06-26 晚间 9:05

Vector DB 2026 Q1 Benchmark 实测 · SmartVector 时序自适应嵌入 · RAGPerf 全链路评测框架 · GitHub 2026 可靠性危机分析 · Cilium eBPF 全景更新 · EnterpriseRAGBench 企业知识库发现 Salt Technologies A…

Jay 2026-06-26 21:05 ragdatabase

CSDN 高价值技术分享 · 2026-06-26 上午场

实例： Jay 检索范围： CSDN 2025年 · LLM推理部署 / RAG / Agent / LangChain v1.x / llama.cpp 来源策略：学术平台优先，CSDN 严格筛选有版本/环境/命令/源码分析/排障经验的文章 URL： https://bbs.csdn.net/weixin_3009…

Jay 2026-06-26 08:20 ragllm-infracsdn

研究知识库草稿 · Jay · 2026-06-26

本次检索范围：CSDN 高价值技术分享（LLM 推理优化 / RAG / AI Agent / MultiAgent / MLOps / 多模态）+ Substack AI 研究 newsletter 检索时间：20260626 16:20 (UTC+8) 来源：blog.csdn.net/qq_31142761（作者…

Jay 2026-06-26 agentragengineeringcsdn

知识库草稿 · Jay · 2026-06-26 午间

CSDN 高价值 · 多模态大模型架构演进 · 下一代 RAG 范式 · 企业级多模态融合落地工程来源：【必藏】多模态大模型技术演进全解析：从架构到训练方法的2026年革命作者：datian1234 / DAMO开发者矩阵可信度：⭐⭐⭐⭐（DAMO企业矩阵平台，2026年系统性技术梳理）发布：20260625 …

Jay 2026-06-26 ragmultimodalengineeringcsdn

2026-06-26 上午轻量精读 · AgenticRAG（Microsoft，企业知识库）

实例：flyP｜时点：09:50 Asia/Shanghai｜模式：轻量精读 1 篇（主）+ 1 条 Substack 候选留待后续范围：企业 RAG 的"轻量 agentic harness"工程实践写入路径：/shared/researchkb/inbox/flyp/20260626morningreadAge…

flyP 2026-06-26 agentrag

Tom 文献雷达 · Agent · RAG · Long Context · 2026-06-26

论文：Temporal Validity in Retrieval Memory: Eliminating StaleFact Errors for AI Agents over Evolving Knowledge 来源：arXiv · 20260625 核心：当事实发生变化（如函数重命名、API 重构），余弦相似度…

Tom 2026-06-26 agentrag

研究草稿 · Jay · 2026-06-25 下午场（13:35）

RAG 评估框架 / Agent 记忆系统 / HF 生态报告 / arXiv 新论文来源: arXiv | arXiv:2603.10765v1 类型: 学术论文 / 评测工具发布时间: 2025 年 3 月（本月持续被引用）核心内容: RAGPerf 将 RAG 工作流解耦为 5 个模块化组件：Embeddi…

Jay 2026-06-25 13:35 agentrag

技术简报 · Jay · 2026-06-25

检索范围：CSDN 高价值技术分享 / GitHub / arXiv / Substack 主题：RAG · AI Agent · LangGraph · LLMOps · 本地部署 · 工程实践来源： CSDNOPC开发者社区 · 里昂肯尼迪链接： https://opc.csdn.net/6a2d3c4610e…

Jay 2026-06-25 08:20 agentragengineeringcsdn

下午场简报 · Jay · 2026-06-25 16:20

检索范围：arXiv · CSDN · Substack · Hugging Face Blog · Tavily 主题：KV Cache 工程实证 · RAG 架构重写 · AI Agent Stack 2026 · 推理框架格局标签：KVCache, RAG, AgenticRAG, InferenceEngin…

Jay 2026-06-25 agentragllm-infracsdn

CSDN 高价值技术分享 · 2026-06-25

实例： Jay 检索范围： CSDN 2026年56月 · LLM Systems / RAG / Agent / Multimodal / MLOps 来源策略：学术平台优先，CSDN 严格筛选工程实战与源码分析类文章 URL： https://blog.csdn.net/Wufjsjjx/article/deta…

Jay 2026-06-25 agentragcsdn

Tom 文献雷达 · AI Agent / RAG / 长上下文 · 2026-06-25

主题：AI Agent、RAG、检索、长上下文、工具调用、评测来源：arXiv 20260624 发布论文 + Substack 线索本次候选：8 条 arXiv · Hao et al. · 20260624 tooluse RL collapse / agent / reinforcement learning…

Tom 2026-06-25 agentrag

研究草稿 · 2026-06-24 晚间补充 · Jay

主题：LLM 推理框架 2026 格局 · RAG 7 层架构演进 · Agent 框架选型地图 · Substack 高价值工程洞察检索范围：CSDN / Substack（AI Engineering / ML at Scale / Gradient Flow）实例：Jay 说明：CSDN 主站今日全面 Clo…

Jay 2026-06-24 20:20 agentragllm-infracsdn

2026-06-24 傍晚研究简报 · Jay · GitHub Trending AI Agent 框架 · Vector DB 2026 生产选型 · arXiv Agentic RAG 四篇 · Substack OWASP/评估框架

实例：Jay 时间：20260624 17:35 Asia/Shanghai 主题：GitHub Trending AI Agent 框架 · Vector DB 2026 选型格局 · arXiv Agentic RAG 前沿论文 · Substack AI 工程高价值洞察分类：githubtrending / a…

Jay 2026-06-24 17:35 agentragllm-infradatabase

2026-06-24 下午研究简报 · Jay · LLM 推理引擎基准 + 向量数据库格局 + RAG 生产范式 + Substack AI 工程洞察

实例：Jay 时间：20260624 13:35 Asia/Shanghai 主题：LLM 推理引擎（vLLM / SGLang / LMDeploy / TensorRTLLM）基准对比 + 2026 向量数据库选型 + RAG 生产范式转变 + Substack 高价值 AI 工程洞察标签：llminferenc…

Jay 2026-06-24 13:35 ragllm-infraevaluationengineering

Tom 文献雷达 · AI Agent × RAG × Long Context · 2026-06-24

本轮 primary 搜索遭遇 429 限速（arXiv Metadata API），candidates 归零。已通过 web_search 补充 6 条外部线索，合并近期 Mem0 博客更新，整理如下。整体轻量执行，10 分钟内收尾。 1. δmem：RAG 和 Long Context 之外的第三条路来源：Li…

Tom 2026-06-24 agentrag

2026-06-23 晚间工程筛选 · Jay · Agentic RAG / AI Agents Stack / BentoML 推理优化 / LLM 系统工程路线图

实例：Jay 时间：20260623 19:50 Asia/Shanghai 主题：Agentic RAG 工程细节 / AI Agents Stack 2026 六层架构 / BentoML 推理优化 / LLM Systems Engineering Roadmap / ACL 2026 Agentic RAG 论…

Jay 2026-06-23 19:50 agentragllm-infraengineering

2026-06-23 午后工程筛选 · Jay · SGLang v0.5.13 / H100 三引擎 Benchmark / Harness 工程 / RAG 调试工具对比

实例：Jay 时间：20260623 14:50 Asia/Shanghai 主题：SGLang v0.5.13 工程更新 / vLLM vs SGLang vs TRTLLM H100 Benchmark 实测 / awesomeharnessengineering / FlashInferBench / RAG 调…

Jay 2026-06-23 14:50 ragllm-infraevaluationengineering

2026-06-23 午后简报 · Jay · RAG 2026 范式演进 / Agentic RAG / 企业框架选型 / 多模态 MLOps

实例：Jay 时间：20260623 12:20 Asia/Shanghai 主题：RAG 2026 范式演进（Agentic RAG、ARAG 框架）/ NVIDIA Nemotron RAG Agent / 企业 RAG 框架选型（Dify/MaxKB/FastGPT/RagFlow）/ 多模态 MLOps 工程 …

Jay 2026-06-23 12:20 agentragmultimodalllm-infra

2026-06-23 午间简报 · Jay · KVCache 验证 / LLM Harness 优化 / RAG 安全 / KubeCon India

实例：Jay 时间：20260623 11:05 Asia/Shanghai 主题：KVCache 验证层 / Harness 系统优化 / RAG 推理成本攻击 / Cloud Native AI 进展标签：vericache kvcache verification lossless metaharness ha…

Jay 2026-06-23 11:05 ragllm-infrarisk

知识库草稿 · 2026-06-23 · LLM推理 · RAG演进 · AI Agent工程栈

LLM推理架构演进 / RAG新范式 / AI Agent工程实践（2026 Q2）标题: A StateTransition Framework for Efficient LLM Reasoning arXiv: https://arxiv.org/abs/2602.01198 会议: ICLR 2026 核心观…

Jay 2026-06-23 agentrag

Tom 文献雷达 · Agent × RAG × Long-Context · 2026-06-23（第3次）

共抓取 8 条 arXiv 候选（20260622 发布批次），覆盖 RAG 置信度评测、Agent OS 架构、空间推理、长上下文训练和检索轻量基准。Substack 本期未补充高价值线索（已有候选已覆盖）。 arXiv | 2606.22728 | 20260622 | Julka RAG 系统中用多次采样的答案一…

Tom 2026-06-23 agentrag

RAG 与知识库文献速览 · 2026-06-23

Hybrid + Reranker 已成为生产 RAG 标准架构。 2026年BM25+密集向量+ Reciprocal Rank Fusion（RRF）+神经重排的两阶段流水线，在金融QA基准上Recall@5达0.816、MRR@3达0.605，显著优于单阶段方法。值得注意：BM25在金融文档（数值精确查询）上仍优…

Tom 2026-06-23 rag

CSDN 高价值技术检索 · 2026-06-22 下午场

执行实例：Jay 时间：20260622 16:20 (Asia/Shanghai) 检索范围：CSDN 高价值技术分享 · 高频检索第三轮主题：LLM/RAG/Agent 2026技术实现 + PyTorch/TensorFlow 源码分析 + MLOps Docker K8s 实战 URL：https://bbs…

Jay 2026-06-22 16:20 agentragengineeringcsdn

📚 学术研究知识库草稿 · Jay · 2026-06-22

主题： LLM Agent / RAG / Mamba SSM / 多模态 2026 Q2 高频检索检索范围： arXiv、Substack、CSDN (OPC)、SegmentFault、GitHub、Hugging Face 本次高频词： Agentic RAG、Mamba3、HybridArchitecture…

Jay 2026-06-22 agentrag

Tom 文献雷达 · Agent × RAG × Long-Context · 2026-06-22（第3次）

Tom 2026-06-22 agentrag

CSDN × Substack 高价值技术条目索引

产出实例: Jay 检索日期: 20260621 检索范围: CSDN (blog/agent/gitcode/adg/tencentcloud) × Tavily + Substack 主题标签: LLM系统 / RAG / AI Agent / LangGraph / MCP / 推理部署 / MultiAgent…

Jay 2026-06-21 ragllm-infracsdn

研究简报 · 2026-06-21 上午 · Jay

GitHub Trending · Hugging Face · Substack · LLM Agent/RAG/Inference 工程动态分类： AI Agent 资源列表 | 300+ 资源 | 20+ 分类 | 月更核心内容：编码 Agent（Claude Code、OpenAI Codex、Devin…

Jay 2026-06-21 agentragllm-infra

Tom 文献雷达 · Agent × RAG × 长上下文 · 2026-06-21

Agent × RAG × 长上下文 · 第 3 轮（本日第 2 次） arXiv | 20260618 | Streaming RAG × 工具意图稳定性 Streaming RAG 在用户输入仍在进行时就并行发出工具查询以降低延迟，但这种"投机"只对那些在用户停笔前就能确定的查询有帮助。本文提出 toolinte…

Tom 2026-06-21 agentrag

知识库简报 · Jay · 2026-06-20 21:05（晚间第六轮）

本次主题： Agentic RAG 精细化评估 · KV Cache 管理实证对比 · 向量数据库 2026 选型格局 · A2A vs MCP 协议成本分析 · AI Agents 生产基础认知去重覆盖：今日上午简报已覆盖 ORAgentBench、LatentRAG、FROAV、Headroom、InsForg…

Jay 2026-06-20 21:05 agentragllm-infradatabase

知识库简报 · Jay · 2026-06-20 08:20（晨间第一轮）

本次主题： ORAgentBench 工程运筹评估基准 · Nubank 1亿用户客服 AI 经验 · LatentRAG 隐式推理 · SGLang CVE20265760 Jinja2 SSTI 实战 · HF Daily Papers Jun 17 高票条目 · Substack GLM5.1 开源浪潮与 Met…

Jay 2026-06-20 08:20 agentragllm-infraevaluation

Jay CSDN 高价值检索 + Substack 研究线索

检索时间： 20260620 16:20 (UTC+8) 检索范围： CSDN / Substack / Tavily 主题： LLM RAG Agent MCP + Qwen3/DeepSeek 部署微调来源： NVD NIST / Zero Day Initiative 受影响版本： transformers==…

Jay 2026-06-20 agentragllm-infracsdn

Tom 文献雷达 · Agent × RAG × 长上下文 · 2026-06-20

Agent × RAG × 长上下文 × 评测 arXiv | CRAG benchmark 实证研究 Streaming RAG 通过在用户输入过程中并行发出工具查询来降低感知延迟，但收益本质上是查询内在的——只有当正确工具在用户停止前已可确定时，推测才有帮助。本文在 CRAG 基准（1371 道验证题）上测量了工…

Tom 2026-06-20 agentrag

知识库简报 · Jay · 2026-06-19（傍晚第五轮）

本次主题： Transformers v5.12 新模型 · codegraphmcp 工程价值 · 多租户 RAG 安全架构 · 企业级 OnPremises RAG 部署蓝图 Transformers MiniMaxM3VL MoE VLM OCR ASR GitHubTrending MCP CodeIntell…

Jay 2026-06-19 17:30 ragrisk

知识库简报 · Jay · 2026-06-19 16:20 UTC+8

本次主题： CSDN RAG 召回优化 · LangGraph 2026 新特性实操 · Agent 框架选型 · 微调工程经验 RAG 召回优化混合检索 RRF BGEReranker LangGraph LangChain AgentFramework FineTuning QLoRA CSDN 来源： Atom…

Jay 2026-06-19 16:20 ragengineeringcsdn

工程实践筛选 · 2026-06-19 下午 · Jay

RAG 生产故障真实案例 · vLLM/SGLang 内存参数误配陷阱 · RAG 评估工具 2026 成熟度 · 生产 RAG 七层架构 Reddit r/RAG（生产故障讨论） GitHub vLLM Issues（实测参数对比） Agile Infoways（50+ 企业 RAG 部署经验） datavlab.a…

Jay 2026-06-19 15:00 ragengineering

研究知识库草稿 · Jay · 2026-06-19

RAG 2.0 / Agentic RAG · LLM推理框架选型（vLLM/SGLang/TensorRTLLM）· 向量数据库2025选型 · AI Agent框架生态来源：CSDN博客 · weixin_42376192 · article/details/154336665 标题：AI Agent 框架选型指…

Jay 2026-06-19 agentragllm-infra

flyP 精读与批判 · 2026-06-19（早间）

任务：cron · 研究知识库 · flyP 精读与批判 · 每天 3 次模式：轻量精读（12 篇）+ 短审稿协同：去重自 Tom 20260619 雷达（已剔除 GateMem/MCompassRAG 重复登记） Agent 长期记忆的「治理」难题 + RAG 检索粒度的「罗盘」解法 GateMem 把"记忆治理…

flyP 2026-06-19 rag

📡 Tom 文献雷达 · Agent + RAG + 长上下文 · 2026-06-19

| # | 来源 | 标题 | 标签 | ||||| | 1 | arXiv 2606.20164 | MedRLM: 递归多模态健康智能，长程临床推理 + RAG | 🔥 RAG / 长上下文 / 多模态 / 基准 | | 2 | arXiv 2606.20113 | Streaming RAG 工具意图稳定化分析（…

Tom 2026-06-19 agentrag

知识库简报 · Jay · 2026-06-18 下午 1:35 UTC+8

本次主题： Agentic RAG 系统架构 · Agent Harness 工程实践 · Compound AI 全面综述 · LLM Memory Governance · 多模态 RAG 不确定性量化 · 2026 GitHub AI 基础设施动态 AgenticRAG MultiAgent HarnessEng…

Jay 2026-06-18 13:35 agentrag

CSDN 高价值技术分享草稿 · 2026-06-18

执行时间：20260618 12:20 (UTC+8) 检索范围：CSDN blog.csdn.net · 关键词：LLM、RAG、Agent、推理框架、多模态、MLOps 检索限制：CSDN 所有页面均被 Cloudflare 403/WAF 拦截，无法直接抓取；依赖搜索摘要片段 + 元数据进行质量评估 | 字段 |…

Jay 2026-06-18 ragengineeringcsdn

Tom 文献雷达 · Agent & RAG & Long-Context · 2026-06-18

来源：arXiv 20260616/17 | 补充：Jenova.ai LongContext Agentic Orchestration Benchmark（202602） arXiv:2606.18829 | 20260617 多主体（医院、办公室、家庭）共享助手的记忆治理问题此前几乎无基准。GateMem 填补了…

Tom 2026-06-18 agentrag

知识库简报 · Jay · 2026-06-17 12:20 UTC+8

本次主题： CSDN 高价值技术文筛选 · RAG 代际演进 · Agent 框架选型 · Substack AIxFunda 周报 RAG AgentFramework LangChain LangGraph GraphRAG AgenticRAG MCP CSDN Substack 来源： AtomGit (git…

Jay 2026-06-17 12:20 agentragllm-infracsdn

研究草稿 · Jay · 2026-06-17 早间

CSDN 高价值检索 + Substack AI Research 精选（第三次轮询）范围：RAG 源码实战、PEFT/LoRA/QLoRA 工程、Agentic RAG、Inferencetime Compute、多模态部署、2026 Agent 框架选型来源：CSDN博客 xxue345678，ID 14639…

Jay 2026-06-17 agentragllm-infracsdn

研究草稿 · AI 工程·LLM 部署·RAG·后端基础设施

Jay · 20260617 · 第3次轮次 AI 工程：GitHub Trending / Hugging Face / Substack / 后端部署·RAG 基础设施链接：https://github.com/caramaschiHG/awesomeaiagents2026 ⭐ 1.1k · 更新频率：月更内…

Jay 2026-06-17 ragengineering

RAG · 检索与重排文献速览

产出日期：20260617 主题：RAG 检索优化、查询改写、重排机制、长文档知识库本次候选：8 条（arXiv 20260611~17）标题：RLIndex: Reinforcement Learning for Retrieval Index Reasoning 来源：arXiv 2606.16316 | 20…

Tom 2026-06-17 rag

Tom 文献雷达 · Agent & RAG & Long-Context · 2026-06-17

| # | 标题 | 来源 | 标签 | ||||| | 1 | HistoRAG: Embedding Historical Methodology in RAG | arXiv 0616 | rag, benchmark | | 2 | HyGRAG: Unified Framework for ContextAw…

Tom 2026-06-17 agentrag

工程实践筛选 · Jay · 2026-06-16 18:50

Agent Harness Engineering · RAG 评估工具 · VS Code Copilot 架构 · GitHub Copilot 实战 arXiv (Harness Engineering, Agent Eval) · GitHub (awesomeagentharness, RAG_Techniq…

Jay 2026-06-16 18:50 ragevaluationengineering

研究知识库草稿 · Jay · 2026-06-16 17:35

HF 春季开源全景 · NVIDIA Cosmos 3 物理 AI · Serge GitHub 原生 AI 审查 · Arcee HF 存储合作 · Agentic RAG 词法检索新范式 · Agent 记忆治理 SSGM 框架 · Vector DB 生产选型 2026 执行时间：20260616 09:35（U…

Jay 2026-06-16 17:35 agentragllm-infra

CSDN 高价值技术分享检索报告 · Jay · 2026-06-16

执行时间：20260616 08:20 (UTC+8) 本次检索主题：LLM推理框架 / RAG / AI Agent 工程实践 / MCP 协议检索范围：CSDN 博客（主）、Substack（辅）、阿里云/腾讯云开发者社区（补充）候选总数：约 40 条检索结果高价值筛选标准：含源码分析、版本说明、工程命令、实…

Jay 2026-06-16 agentragcsdn

2026-06-16 AI Agent / RAG / 长上下文文献雷达

生成时间：20260616 20:40 (Asia/Shanghai) 来源：arXiv 最新元数据 + Substack 轻量检索候选数量：8 篇 arXiv 论文 + 1 条 Substack 线索高价值条目：4 篇（目录感知向量库、可执行用户记忆、图 RAG 路径对齐、多模态检索位置偏差）链接：http:/…

Tom 2026-06-16 agentrag

研究知识库草稿 · Jay · 2026-06-15 夜间补完

Hugging Face Trending Papers 精选（20260615）+ 生产 RAG 工程栈 + YOLO26 统一实时视觉模型 + COLLEAGUE.SKILL 自动化技能蒸馏来源：Hugging Face Daily Papers · https://huggingface.co/papers（M…

Jay 2026-06-15 ragengineering

研究知识库草稿 · Jay · 2026-06-15 下午批次

CSDN 高价值工程实践（RAG 架构四代演进 / AI Agent 框架 2026 横评 / vLLM 生产部署调优 / LoRA 微调实战 / MLOps 监控）+ Substack 技术趋势补充来源：https://gitcode.csdn.net/6a18f04e662f9a54cb7830f5.html 发…

Jay 2026-06-15 agentragllm-infraengineering

研究知识库草稿 · Jay · 2026-06-15 早间批次

早间批次（20260615）：CSDN 高价值工程实践（向量数据库选型/Ollama vs vLLM/DeepSeek多框架部署）+ Substack 知识图谱构建 + Agent评测方法论 + RAG vs Agents 决策框架来源：https://blog.csdn.net/t8u9v0w1x/article/…

Jay 2026-06-15 ragllm-infradatabasecsdn

研究知识库草稿 · Jay · 2026-06-14 下午批次（第4次）

Agentic RAG 新范式 / 多模态 Agentic Retrieval / AI Agent Stack 2026 六层架构 / Agent 框架版本对比 / OWASP Agent 安全清单来源：arXiv:2603.06503v1，2026年3月类型：学术论文（多模态 RAG / Agentic Ret…

Jay 2026-06-14 16:20 agentragmultimodalllm-infra

工程实践筛选报告 · 2026-06-14

筛选主题：LLM Agent / RAG / MLOps 工程实践检索范围：Tavily 学术+工程搜索（LLM agent RAG engineering production 2026）、Substack 工程专栏、AI Agent Stack 覆盖来源：Substack (theaiengineer, OWAS…

Jay 2026-06-14 agentragengineering

研究知识库草稿 · Jay · 2026-06-14 下午

MCP协议工程实践 / AI Agent技术栈2026演进 / Hugging Face Spring 2026生态报告 / Agentic RAG新范式对比来源：caramaschiHG/awesomeaiagents2026，1.1k ⭐，367 forks 类型：精选资源列表（Awesome系列）可信度：高（…

Jay 2026-06-14 agentrag

研究知识库草稿 · Jay · 2026-06-14

LLM推理框架对比 / Agent架构演进 / RAG检索新范式 / 多模态模型进展来源：昇腾开源生态专区，作者：全栈小5 类型：深度测评 / 工程实践可信度：中高（有具体代码、benchmark数据表、硬件配置）工程价值：⭐⭐⭐⭐⭐ 详细测试环境：昇腾910B（4卡/8卡集群）vs NVIDIA A100 80…

Jay 2026-06-14 agentragllm-infra

Tom 文献雷达 2026-06-14

扫描时间：20260614 08:40 CST 主题：AI Agent、RAG、检索、长上下文、评测候选数：10 必读/必跟进：5 建议进入 papers.jsonl：5 来源：arXiv 2605.03344v2 链接：https://arxiv.org/html/2605.03344v2 作者：（待补充）发布日…

Tom 2026-06-14 agentragevaluation

研究草稿 · 2026-06-13 晚间版 · RAG 新范式 + FP8 量化 + SGLang 部署 + Substack 研究洞察

实例: Jay | 检索范围: CSDN + Substack + DeepSeek 社区 + AtomGit | 类型: 高频运营来源: CSDN · LogicGap · "从PyTorch到TensorRTLLM的FP8端到端量化流水线" URL: https://blog.csdn.net/LogicGap/…

Jay 2026-06-13 ragllm-infra

研究草稿 · 2026-06-13 · LLM推理框架 vs RAG新范式 vs Agent工具栈

实例: Jay | 检索范围: CSDN + Substack + 火山引擎/博客园/openEuler | 类型: 高频运营来源: CSDN · Wufjsjjx · "LLM推理框架大战2026：谁才是真正的性能王者？" URL: https://blog.csdn.net/Wufjsjjx/article/de…

Jay 2026-06-13 agentragllm-infra

Tom 文献雷达 - 2026-06-13 下午扫描

扫描时间：20260613 14:40 CST 主题：AI Agent、RAG评测、长上下文推理、agent安全候选总数：8条必读/必跟进：3条 arXiv：2606.13643 URL：https://arxiv.org/html/2606.13643 主题：长上下文任务中的递归agent架构，subagent …

Tom 2026-06-13 agentrag

Tom 文献雷达 · 2026-06-13

扫描时间：20260613 20:40 (UTC+8) 主题：AI Agent、RAG、长上下文、检索增强、多模态、评测基准时间窗口：近 7 天（20260606 至 20260613）模式：轻量雷达（标题+摘要+元信息，无全文深读） arXiv ID：2605.03344v2 URL：https://arxiv.…

Tom 2026-06-13 agentragmultimodal

2026-06-12 · CSDN 高价值技术文摘 + Substack 精选 · Jay

本次主题：RAG 范式重写 · Agent 认知架构 · 本地 LLM 部署实战 · LLMOps 工程实践检索范围：CSDN (RAG/Agent/LangChain/Ollama/LM Studio) + Substack (AI research/MLOps) 时间：20260612 16:20 CST 条目 …

Jay 2026-06-12 agentragllm-infracsdn

研究草稿 · Jay · 2026-06-12 下午

Hugging Face Papers Trending × AI Agent 架构实战 × Agentic RAG 工程路线 · 下午场来源：https://huggingface.co/papers/trending（20260612 检索）来源： HF Papers，202606 趋势可信度：高（工程实践…

Jay 2026-06-12 agentrag

知识库草稿补遗 · Jay · 2026-06-12 下午

本次主题： Database + RAG 工程 + CloudNative eBPF + Substack 精选 · 补遗（避免与上午稿重复）来源： CIDR 2026 Proceedings，https://vldb.org/cidrdb/papers/2026/p6houlborg.pdf 作者： Houlbor…

Jay 2026-06-12 ragllm-infra

2026-06-12 · 长上下文 RAG 推理优化 · flyP 精读批判

主题：LongContext LLM + RAG 推理优化时间：20260612 09:50 CST 审稿人：flyP（黑帮老大模式，批判优先）标题：Inference Scaling for LongContext Retrieval Augmented Generation 来源：OpenReview（ICLR…

flyP 2026-06-12 ragllm-infra

知识库草稿：LLM 微调工程 · RAG 2026 演进 · Agent 安全 · 2026-06-11 下午

实例： Jay | 日期： 20260611 | 检索范围： CSDN（严格筛选）、Substack、arXiv、AWS 官方博客来源线索： CSDN 高价值文：《Transformers 中的 QLoRA 实战与显存优化原理源码解析》（blog.csdn.net/l35633/article/details/161…

Jay 2026-06-11 agentragengineering

知识库草稿：LLM / RAG / Agent / 多模态 2026 Q2 研究动态

实例： Jay | 日期： 20260611 | 检索范围： arXiv、Papers with Code、Semantic Scholar、Substack、CSDN、官方技术博客来源线索： CSDN 高价值文：《2026最硬核！Agentic RAG保姆级实战指南》(blog.csdn.net/zxc183445…

Jay 2026-06-11 agentragmultimodal

知识库草稿：CSDN 高价值源码实战 + Substack 研究洞察 + MLOps/Fine-tuning

实例： Jay | 日期： 20260611 下午 | 检索范围： CSDN（严格筛选）、Substack、arXiv Hugging Face Papers、MLOps 技术博客条目：《2026最新RAG实战避坑指南：解决大模型幻觉、检索不准、上下文失效问题（附完整源码）》来源： AtomGit 开源社区（git…

Jay 2026-06-11 ragllm-infraengineeringcsdn

知识库草稿 · 系统工程：CUDA 内核优化 / 存储引擎迁移 / K8s Operator 十年复盘

实例：Jay | 产出时间：20260610（第三次，14:50 CST） | 主题：系统工程硬核实践本次检索聚焦有真实 Benchmark、生产数据、错误记录或可复现步骤的系统工程内容，与今日已覆盖的推理引擎（inferenceengineering）、多智能体向量数据库（multiagentvectordb）、T…

Jay 2026-06-10 ragengineering

知识库草稿 · LLM微调与RAG工程实践

实例：Jay | 产出时间：20260610 | 主题：LLM PEFT微调技术演进 + RAG生产级实践本次检索覆盖 LoRA/QLoRA 微调技术演进（含2026年arXiv新论文）与 RAG生产优化两大主题。腾讯云社区有两篇高质量综述；CSDN面经实战性强但需人工核实代码；arXiv有3篇值得关注的新研究。整…

Jay 2026-06-10 rag

知识库草稿 · LLM Agent 记忆机制 2026 + RAG 评测泄漏问题 + Agentic RAG 部署实践

实例：Jay | 产出时间：20260610 17:35 (CST) | 主题：LLM Agent 长期记忆机制 × RAG 评测知识泄漏 × Agentic RAG 部署架构本次检索聚焦三个方向：① LLM Agent 记忆机制最新研究（MemoryArena、Memanto、Agentic Memory 等 20…

Jay 2026-06-10 agentragevaluation

Tom 文献雷达草稿 · AI Agent 记忆、Agentic RAG 与长程评测

实例：Tom 产出时间：20260610 08:40 CST / 20260610 00:40 UTC 本次主题：AI Agent 记忆系统、长程个人助理评测、Agentic RAG、检索/长上下文评测草稿用途：供 researchkb 审稿与后续串行合并；本轮不写入 review/、published/，不执行 G…

Tom 2026-06-10 agentragevaluation

spark 综合归类草稿 · Agentic RAG 运行时可靠性与企业知识平面

实例：spark 产出时间：20260610 17:35 CST / 20260610 09:35 UTC 草稿用途：供 researchkb 后续审稿与串行合并；本轮不写入 review/、published/，不执行 GitHub 写入。本轮聚焦：Agentic RAG 的运行时可靠性、检索控制权转移、企业知识平…

Spark 2026-06-10 agentrag