Jay · 研究知识库简报 · 2026-06-17

检索范围：arXiv、Semantic Scholar、Tavily Web、Substack、技术博客输出时间：2026-06-17 21:05 (CST) 本实例：Jay · 草稿目录

📦 database

1. RAG in 2026: How Retrieval-Augmented Generation Works for Enterprise AI

来源：Techment Blog（2026）
可信度：中高
核心观点：2026 年 RAG 生产系统标配混合检索（语义+关键词），向量数据库（Milvus/Pinecone/Weaviate）仍是检索层骨干，但瓶颈已从生成侧转移到检索侧。多阶段检索、cross-encoder 重排、上下文过滤成为高精度 RAG 的标准栈。
评价：企业级 RAG 实施路线图，实用但缺代码细节，适合作为工程 checklist 参考。
行动：可纳入 RAG 主题页，作为 2026 best practice 条目引用来源。

2. All You Need to Know About RAG (in 2026) — Substack

来源：AI researcher newsletter by Aishwarya Srinivasan · Substack
可信度：高（明确标注作者身份和研究背景）
核心观点：
语义分块（Semantic Chunking）替代固定长度分块，基于 cosine distance 判断主题切换点；
"Small-to-Big"（Parent-Document）策略：小块精检索 → 回溯父文档供 LLM 生成；
混合搜索 + RRF（Reciprocal Rank Fusion）融合语义与 BM25 结果；
2026 年检索瓶颈：GPT-5.4/Claude 4.6 等强模型下，失配代价更高。
评价：高价值。语义分块 + Small-to-Big 策略是当前 RAG 优化方向的核心，RRF 公式有具体描述，值得精读。
行动：建议纳入 RAG 主题页方法论区块；可追踪作者后续更新。

3. Best Vector Databases 2026: 6 Top Picks Compared & Tested — iternal.ai

来源：iternal.ai（2026）
可信度：中
核心观点：向量数据库横向对比，Pinecone（托管企业级）、Milvus/Weaviate（开源）、Chroma（本地开发）仍是主流选型。指出 80% RAG 精度问题根源在数据质量而非向量库本身。Blockify 数据优化方案声称 78x RAG 精度提升（需独立核验）。
评价：选型参考价值高，但 Blockify 数据需核实。
行动：可作为向量库选型页参考，不直接引用 Blockify 数字。

4. Revisiting B+-tree vs. LSM-tree — USENIX FAST

来源：USENIX Conference on File and Storage Technologies (FAST)
可信度：高（学术会议论文，2022年）
核心观点：在现代内置透明压缩的存储硬件上，LSM-tree 相比 B+-tree 的写放大和存储空间优势是否依然成立？研究结论：透明压缩显著缩小了差距，但 LSM-tree 在写放大指标上仍有优势。
评价：存储引擎对比经典参考文献，B+-tree vs LSM-tree 权衡框架至今仍有效。
行动：建议纳入数据库存储引擎主题页引用来源。

5. LSM-Trees and B-Trees: The Best of Both Worlds — TIB AV

来源：TIB AV-Portal（学术演讲/会议）
可信度：中高
核心观点：提出 LSM-tree 和 B-tree 动态在线切换方法，KV store 可根据 workload 自主选择最优数据结构。
评价：前沿研究方向，尚未在主流数据库中落地，但概念值得关注。
行动：纳入"数据库前沿研究"列表，后续可追踪是否有工程实现。

6. TiKV Deep Dive: B-Tree vs LSM-Tree

来源：TiKV 官方深度文档
可信度：高（工程团队官方文档，定量分析）
核心观点：Level-based LSM-tree 写放大为 Θ(k log_k N/B)，B-tree 写放大为 B；详细推导了 write/read/space amplification 数学框架。
评价：高价值。存储引擎理论分析最清晰的工程文档之一，适合作为 benchmark 对比框架。
行动：纳入数据库存储引擎主题页作为定量分析引用。

7. PostgreSQL vs MySQL 2026 Benchmark — tech-insider.org

来源：tech-insider.org（2026-04-02）
可信度：中
核心观点：
PostgreSQL 17（2025年底）原生 JSON table functions，并行查询性能+35%；
MySQL 9.x 新增向量搜索，但 pgvector 仍是 AI/ML 工作负载首选；
新项目 3:1 选择 PostgreSQL；
JSONB @> containment operator + GIN 索引性能可超过专用文档库 5-10 倍。
评价：PostgreSQL 2026 优势叙事清晰，数据具体，适合工程选型参考。
行动：纳入 backend 主题页数据库选型参考。

🖥️ backend

8. The AI Agents Stack: LLM to Production (2026 Edition) — Substack

来源：The AI Engineer · Paolo Perrone · Substack（高质量工程 newsletter）
可信度：高（工程视角，一线实践经验）
核心观点：
Memory 架构演进：2024 年 memory = vector DB；2026 年 memory 是分层架构原语（多 tier）；
Context Engineering 替代 prompt engineering 成为核心学科；
Memory blocks：agent 可读写、覆盖的命名结构化字段；
Agent guardrails 独立于 LLM guardrails，工具执行层授权优先；
OWASP MCP Top 10（beta）发布，工具连接型 agent 首个安全 checklist；
自优化 agent 实践：nightshift planning + dayshift execution + feedback loops，瓶颈在人而非基础设施。
评价：高价值精读。Memory 分层设计、guardrails 执行时机、MCP 安全标准都是 2026 agent 架构关键问题。
行动：建议纳入 AI Agent 主题页核心引用；追踪 Substack 原文更新。

9. LLM predictions for 2026 — Simon Willison Substack

来源：Simon Willison（知名 AI 技术博主，61k+ 订阅）
可信度：中高
核心观点：2026 LLM 预测，Gemini 月活数据引用，OpenAI 800 万周活用户来源分析（OpenAI DevDay 2025数据），对"活跃用户"定义提出质疑。
评价：Simon Willison 是 AI 领域高可信度独立研究者，但本文侧重预测而非技术深度。
行动：可纳入 AI 行业动态/周报引用。

10. LLM Research Papers: The 2026 List (Jan-May) — Sebastian Raschka

来源：Sebastian Raschka（独立 AI 研究者，《Build a Large Language Model from Scratch》作者）· Substack
可信度：高
核心观点：2026 年 1-5 月 LLM 论文精选，覆盖 10 个方向： 1. Architecture：混合 Mamba-Transformer（Nemotron 3）、Gated DeltaNet-2、Delta Attention Residuals 2. Efficient Training and Scaling 3. Inference Efficiency & KV Cache 4. Sparse Attention & Long Context 5. Reasoning & Test-Time Compute 6. RL & RLVR 7. Agent Systems & Tool Use 8. Coding Agents & Software Engineering 9. Diffusion Language Models 10. Model Evaluation & Benchmarks
评价：高价值。混合架构（Mamba + Transformer）是 2026 年重要方向；Agent Systems 单独成类说明该方向成熟度提升。
行动：建议纳入 AI/LLM 研究年度回顾引用；按月追踪后续列表。

☁️ cloud-native

11. 2026 Kubernetes Playbook: AI at Scale, Self-Healing Clusters, & Growth — Fairwinds

来源：Fairwinds（Kubernetes 治理平台厂商）
可信度：中
核心观点：
Kubernetes 已是 AI backbone：MLOps 平台（批处理训练 + 实时推理服务）统一调度；
2026 年 AI on K8s 趋势：66% 托管生成式 AI 的组织用 K8s 做部分推理；
多集群 + 边缘扩展：平台团队标准化 cluster blueprints，active-active 跨区域架构；
2026 年 Kubernetes 平台团队角色从"运维"升级为"AI 基础设施定义者"。
评价：CNCF 调研数据支撑，平台工程视角，适合管理层和技术负责人参考。
行动：纳入 cloud-native 主题页趋势部分引用。

12. The great migration: Why every AI platform is converging on Kubernetes — CNCF Blog

来源：CNCF 官方博客（2026-03-05），AWS 工程师 Vara Bonthu 撰写
可信度：高（CNCF 官方 + 行业数据）
核心观点：
CNCF 2026 年初调研：82% 容器用户在生产环境运行 Kubernetes，66% 托管生成式 AI 的组织用 K8s 做推理；
Kubernetes 不再只跑无状态微服务，已成为 end-to-end AI 系统构建平台；
SIG projects + CNCF 项目（Kubeflow 等）正在将 K8s 打造成 AI 平台标准层。
评价：CNCF 官方背书，K8s as AI OS 叙事定性清晰，数据来源可查。
行动：纳入 cloud-native 主题页核心引用；建议列入 AI 基础设施趋势页。

13. Kubernetes for AI Inference: Vultr + Baseten — Vultr Blog

来源：Vultr 工程博客（2026-03-24）
可信度：中（厂商博客，有工程细节）
核心观点：生产 AI 推理服务需要编排自动化、可扩展计算来高效管理 GPU 密集型工作负载；Vultr + Baseten 案例展示 K8s 推理部署架构。
评价：工程实践参考，有具体部署模式但缺深度技术细节。
行动：纳入 cloud-native 推理部署案例参考。

14. Top 5 Tech Trends 2026: AI Inference & Kubernetes — Portworx

来源：Portworx（PX 存储母公司）
可信度：中
核心观点：
Trend 1: Inference 是 GenAI 主战场（Nvidia $20B 收购 Groq 佐证）；
Trend 4: Edge 重回焦点（5G/6G + GenAI 本地推理需求驱动）；
Trend 5: 垂直领域 AI Agent 渗透企业基础设施（DevSecOps/SRE/平台工程师增强）；
90%+ 团队预期 K8s AI 工作负载增长。
评价：行业趋势叙事，数据有出处但非一手研究；Edge + Inference 是本文亮点。
行动：纳入 cloud-native 趋势 + AI 基础设施双主题页引用。

15. A Busy Developer's Guide to Database Storage Engines — YugabyteDB Blog

来源：YugabyteDB 官方博客
可信度：中高
核心观点：B-tree（InnoDB/PostgreSQL/Oracle/SQL Server）与 LSM-tree（BigTable/Cassandra/RocksDB）对比入门；LSM-tree 历史背景（1996 年学术论文）；Cassandra/HBase/LevelDB/RocksDB 为代表的 LSM 生态。
评价：入门级但工程准确，适合作为 B-tree vs LSM-tree 对比基础文档入口。
行动：纳入 database 存储引擎入门参考链接。

🔍 csdn（CSDN 筛选）

本次检索未发现 CSDN 高价值文章（CSDN 近期内容以搬运、摘要为主，缺乏版本/命令/源码/复现细节）。本次 csdn 分类条目为空，建议降低 CSDN 检索频率或转向知乎/掘金替代。

🔬 reproduction（可复现研究条目）

16. arxiv:2004.05074 — Paxos vs Raft: Have we reached consensus on distributed consensus?

来源：arXiv（PaPoC 2020 Workshop）
可信度：高（学术同行评审工作坊论文）
核心观点：Paxos 与 Raft 等价性证明，Raft 分解为相对独立子问题（leader election、log replication、safety）使其更易理解；提供了 Raft 实现的教学框架。
评价：分布式一致性领域经典论文，关于"Paxos 难理解"的讨论对工程教学有长期影响。
行动：纳入 backend 分布式系统主题页引用。

17. arxiv:2404.18048 — Interactive Safety Verification of Distributed Protocols by Inductive Reasoning (PDF)

来源：arXiv（2024）
可信度：高（形式化验证方向）
核心观点：归纳推理交互式验证分布式协议安全性，应用到工业级 Raft 协议规范验证。
评价：形式化验证前沿，对 Raft 正确性有新的验证思路，适合高级分布式系统研究。
行动：纳入分布式系统形式化验证参考文献。

18. LSM Tree: Data structure powering write heavy storage engines — Distributed Computing Musings (2026-06-12)

来源：Distributed Computing Musings 博客（2026-06-12，非常近期）
可信度：中
核心观点：LSM tree 写入流程（MemTable → SSTable → Level 合并）；读放大问题；Cassandra/HBase/LevelDB/RocksDB 为主流实现。
评价：2026 年中更新的 LSM tree 工程入门，格式规范，适合作为 LSM 基础复习材料。
行动：纳入 database 存储引擎入门参考。

📋 分类标签

database   | #向量数据库 #RAG #LSM-tree #B-tree #PostgreSQL #MySQL #存储引擎
backend    | #AI-Agent #LLM-Architecture #Memory-Architecture #Guardrails #MCP
cloud-native| #Kubernetes #AI-Inference #MLOps #Edge-Computing #CNCF
csdn       | (本次无高价值条目)
reproduction| #分布式一致性 #Paxos #Raft #形式化验证

💡 高价值条目优先级排序

优先级	条目	原因
⭐ 精读	#2 Substack RAG语义分块+Small-to-Big	RAG 2026 核心方法论，有具体公式
⭐ 精读	#8 AI Agents Stack 2026 (Substack)	Agent 架构 Memory分层+Guardrails+MCP安全
⭐ 精读	#10 Sebastian Raschka 2026 LLM Papers	混合架构/Agent 系统年度论文地图
⚡ 快读	#12 CNCF K8s as AI OS	官方数据背书，K8s AI 平台定位
⚡ 快读	#6 TiKV B-tree vs LSM 定量分析	存储引擎 benchmark 框架
⚡ 快读	#1/#3/#7 PostgreSQL/MySQL 2026	工程选型参考

📁 建议写入路径

主草稿：/shared/research-kb/inbox/jay/2026-06-17-research-brief.md ✅（本文件）
主题页更新建议：
RAG 主题页 → 更新 #2 语义分块 + Small-to-Big 方法论
AI Agent 主题页 → 更新 #8 Memory 分层 + Guardrails + MCP
LLM Research 主题页 → 更新 #10 混合架构论文列表
AI 基础设施趋势页 → 更新 #12 CNCF 数据引用
数据库存储引擎页 → 更新 #4/#6/#15/#18 LSM vs B-tree 引用

🔎 后续行动建议

精读追踪：订阅 #2（Substack）和 #8（The AI Engineer）原文，提取中文可引用的精读笔记
论文核验：#10 中 Nemotron 3 混合架构是否有开源代码/官方实现？
CSDN 替代源：考虑用掘金（juejin.cn）或知乎替代 CSDN 检索中文技术内容
Substack 来源扩展：本周可新增检索 "The Pragmatic Engineer"（Gergely Orosz）、"ByteByteGo"（Alex Xu）两个高质量 Substack

本简报由 Jay 实例自动生成 · 2026-06-17 · 请勿直接写入 /shared/research-kb/review/ 或 /shared/research-kb/published/