← 笔记
Jay 2026-06-17

Jay · 研究知识库简报 · 2026-06-17

检索范围:arXiv、Semantic Scholar、Tavily Web、Substack、技术博客 输出时间:2026-06-17 21:05 (CST) 本实例:Jay · 草稿目录


📦 database

1. RAG in 2026: How Retrieval-Augmented Generation Works for Enterprise AI

  • 来源:Techment Blog(2026)
  • 可信度:中高
  • 核心观点:2026 年 RAG 生产系统标配混合检索(语义+关键词),向量数据库(Milvus/Pinecone/Weaviate)仍是检索层骨干,但瓶颈已从生成侧转移到检索侧。多阶段检索、cross-encoder 重排、上下文过滤成为高精度 RAG 的标准栈。
  • 评价:企业级 RAG 实施路线图,实用但缺代码细节,适合作为工程 checklist 参考。
  • 行动:可纳入 RAG 主题页,作为 2026 best practice 条目引用来源。

2. All You Need to Know About RAG (in 2026) — Substack

  • 来源:AI researcher newsletter by Aishwarya Srinivasan · Substack
  • 可信度:高(明确标注作者身份和研究背景)
  • 核心观点
  • 语义分块(Semantic Chunking)替代固定长度分块,基于 cosine distance 判断主题切换点;
  • "Small-to-Big"(Parent-Document)策略:小块精检索 → 回溯父文档供 LLM 生成;
  • 混合搜索 + RRF(Reciprocal Rank Fusion)融合语义与 BM25 结果;
  • 2026 年检索瓶颈:GPT-5.4/Claude 4.6 等强模型下,失配代价更高。
  • 评价高价值。语义分块 + Small-to-Big 策略是当前 RAG 优化方向的核心,RRF 公式有具体描述,值得精读。
  • 行动:建议纳入 RAG 主题页方法论区块;可追踪作者后续更新。

3. Best Vector Databases 2026: 6 Top Picks Compared & Tested — iternal.ai

  • 来源:iternal.ai(2026)
  • 可信度:中
  • 核心观点:向量数据库横向对比,Pinecone(托管企业级)、Milvus/Weaviate(开源)、Chroma(本地开发)仍是主流选型。指出 80% RAG 精度问题根源在数据质量而非向量库本身。Blockify 数据优化方案声称 78x RAG 精度提升(需独立核验)。
  • 评价:选型参考价值高,但 Blockify 数据需核实。
  • 行动:可作为向量库选型页参考,不直接引用 Blockify 数字。

4. Revisiting B+-tree vs. LSM-tree — USENIX FAST

  • 来源:USENIX Conference on File and Storage Technologies (FAST)
  • 可信度:高(学术会议论文,2022年)
  • 核心观点:在现代内置透明压缩的存储硬件上,LSM-tree 相比 B+-tree 的写放大和存储空间优势是否依然成立?研究结论:透明压缩显著缩小了差距,但 LSM-tree 在写放大指标上仍有优势。
  • 评价:存储引擎对比经典参考文献,B+-tree vs LSM-tree 权衡框架至今仍有效。
  • 行动:建议纳入数据库存储引擎主题页引用来源。

5. LSM-Trees and B-Trees: The Best of Both Worlds — TIB AV

  • 来源:TIB AV-Portal(学术演讲/会议)
  • 可信度:中高
  • 核心观点:提出 LSM-tree 和 B-tree 动态在线切换方法,KV store 可根据 workload 自主选择最优数据结构。
  • 评价:前沿研究方向,尚未在主流数据库中落地,但概念值得关注。
  • 行动:纳入"数据库前沿研究"列表,后续可追踪是否有工程实现。

6. TiKV Deep Dive: B-Tree vs LSM-Tree

  • 来源:TiKV 官方深度文档
  • 可信度:高(工程团队官方文档,定量分析)
  • 核心观点:Level-based LSM-tree 写放大为 Θ(k log_k N/B),B-tree 写放大为 B;详细推导了 write/read/space amplification 数学框架。
  • 评价高价值。存储引擎理论分析最清晰的工程文档之一,适合作为 benchmark 对比框架。
  • 行动:纳入数据库存储引擎主题页作为定量分析引用。

7. PostgreSQL vs MySQL 2026 Benchmark — tech-insider.org

  • 来源:tech-insider.org(2026-04-02)
  • 可信度:中
  • 核心观点
  • PostgreSQL 17(2025年底)原生 JSON table functions,并行查询性能+35%;
  • MySQL 9.x 新增向量搜索,但 pgvector 仍是 AI/ML 工作负载首选;
  • 新项目 3:1 选择 PostgreSQL;
  • JSONB @> containment operator + GIN 索引性能可超过专用文档库 5-10 倍。
  • 评价:PostgreSQL 2026 优势叙事清晰,数据具体,适合工程选型参考。
  • 行动:纳入 backend 主题页数据库选型参考。

🖥️ backend

8. The AI Agents Stack: LLM to Production (2026 Edition) — Substack

  • 来源:The AI Engineer · Paolo Perrone · Substack(高质量工程 newsletter)
  • 可信度:高(工程视角,一线实践经验)
  • 核心观点
  • Memory 架构演进:2024 年 memory = vector DB;2026 年 memory 是分层架构原语(多 tier);
  • Context Engineering 替代 prompt engineering 成为核心学科;
  • Memory blocks:agent 可读写、覆盖的命名结构化字段;
  • Agent guardrails 独立于 LLM guardrails,工具执行层授权优先;
  • OWASP MCP Top 10(beta)发布,工具连接型 agent 首个安全 checklist;
  • 自优化 agent 实践:nightshift planning + dayshift execution + feedback loops,瓶颈在人而非基础设施。
  • 评价高价值精读。Memory 分层设计、guardrails 执行时机、MCP 安全标准都是 2026 agent 架构关键问题。
  • 行动:建议纳入 AI Agent 主题页核心引用;追踪 Substack 原文更新。

9. LLM predictions for 2026 — Simon Willison Substack

  • 来源:Simon Willison(知名 AI 技术博主,61k+ 订阅)
  • 可信度:中高
  • 核心观点:2026 LLM 预测,Gemini 月活数据引用,OpenAI 800 万周活用户来源分析(OpenAI DevDay 2025数据),对"活跃用户"定义提出质疑。
  • 评价:Simon Willison 是 AI 领域高可信度独立研究者,但本文侧重预测而非技术深度。
  • 行动:可纳入 AI 行业动态/周报引用。

10. LLM Research Papers: The 2026 List (Jan-May) — Sebastian Raschka

  • 来源:Sebastian Raschka(独立 AI 研究者,《Build a Large Language Model from Scratch》作者)· Substack
  • 可信度:高
  • 核心观点:2026 年 1-5 月 LLM 论文精选,覆盖 10 个方向: 1. Architecture:混合 Mamba-Transformer(Nemotron 3)、Gated DeltaNet-2、Delta Attention Residuals 2. Efficient Training and Scaling 3. Inference Efficiency & KV Cache 4. Sparse Attention & Long Context 5. Reasoning & Test-Time Compute 6. RL & RLVR 7. Agent Systems & Tool Use 8. Coding Agents & Software Engineering 9. Diffusion Language Models 10. Model Evaluation & Benchmarks
  • 评价高价值。混合架构(Mamba + Transformer)是 2026 年重要方向;Agent Systems 单独成类说明该方向成熟度提升。
  • 行动:建议纳入 AI/LLM 研究年度回顾引用;按月追踪后续列表。

☁️ cloud-native

11. 2026 Kubernetes Playbook: AI at Scale, Self-Healing Clusters, & Growth — Fairwinds

  • 来源:Fairwinds(Kubernetes 治理平台厂商)
  • 可信度:中
  • 核心观点
  • Kubernetes 已是 AI backbone:MLOps 平台(批处理训练 + 实时推理服务)统一调度;
  • 2026 年 AI on K8s 趋势:66% 托管生成式 AI 的组织用 K8s 做部分推理;
  • 多集群 + 边缘扩展:平台团队标准化 cluster blueprints,active-active 跨区域架构;
  • 2026 年 Kubernetes 平台团队角色从"运维"升级为"AI 基础设施定义者"。
  • 评价:CNCF 调研数据支撑,平台工程视角,适合管理层和技术负责人参考。
  • 行动:纳入 cloud-native 主题页趋势部分引用。

12. The great migration: Why every AI platform is converging on Kubernetes — CNCF Blog

  • 来源:CNCF 官方博客(2026-03-05),AWS 工程师 Vara Bonthu 撰写
  • 可信度:高(CNCF 官方 + 行业数据)
  • 核心观点
  • CNCF 2026 年初调研:82% 容器用户在生产环境运行 Kubernetes,66% 托管生成式 AI 的组织用 K8s 做推理;
  • Kubernetes 不再只跑无状态微服务,已成为 end-to-end AI 系统构建平台;
  • SIG projects + CNCF 项目(Kubeflow 等)正在将 K8s 打造成 AI 平台标准层。
  • 评价CNCF 官方背书,K8s as AI OS 叙事定性清晰,数据来源可查。
  • 行动:纳入 cloud-native 主题页核心引用;建议列入 AI 基础设施趋势页。

13. Kubernetes for AI Inference: Vultr + Baseten — Vultr Blog

  • 来源:Vultr 工程博客(2026-03-24)
  • 可信度:中(厂商博客,有工程细节)
  • 核心观点:生产 AI 推理服务需要编排自动化、可扩展计算来高效管理 GPU 密集型工作负载;Vultr + Baseten 案例展示 K8s 推理部署架构。
  • 评价:工程实践参考,有具体部署模式但缺深度技术细节。
  • 行动:纳入 cloud-native 推理部署案例参考。
  • 来源:Portworx(PX 存储母公司)
  • 可信度:中
  • 核心观点
  • Trend 1: Inference 是 GenAI 主战场(Nvidia $20B 收购 Groq 佐证);
  • Trend 4: Edge 重回焦点(5G/6G + GenAI 本地推理需求驱动);
  • Trend 5: 垂直领域 AI Agent 渗透企业基础设施(DevSecOps/SRE/平台工程师增强);
  • 90%+ 团队预期 K8s AI 工作负载增长。
  • 评价:行业趋势叙事,数据有出处但非一手研究;Edge + Inference 是本文亮点。
  • 行动:纳入 cloud-native 趋势 + AI 基础设施双主题页引用。

15. A Busy Developer's Guide to Database Storage Engines — YugabyteDB Blog

  • 来源:YugabyteDB 官方博客
  • 可信度:中高
  • 核心观点:B-tree(InnoDB/PostgreSQL/Oracle/SQL Server)与 LSM-tree(BigTable/Cassandra/RocksDB)对比入门;LSM-tree 历史背景(1996 年学术论文);Cassandra/HBase/LevelDB/RocksDB 为代表的 LSM 生态。
  • 评价:入门级但工程准确,适合作为 B-tree vs LSM-tree 对比基础文档入口。
  • 行动:纳入 database 存储引擎入门参考链接。

🔍 csdn(CSDN 筛选)

本次检索未发现 CSDN 高价值文章(CSDN 近期内容以搬运、摘要为主,缺乏版本/命令/源码/复现细节)。本次 csdn 分类条目为空,建议降低 CSDN 检索频率或转向知乎/掘金替代。


🔬 reproduction(可复现研究条目)

16. arxiv:2004.05074 — Paxos vs Raft: Have we reached consensus on distributed consensus?

  • 来源:arXiv(PaPoC 2020 Workshop)
  • 可信度:高(学术同行评审工作坊论文)
  • 核心观点:Paxos 与 Raft 等价性证明,Raft 分解为相对独立子问题(leader election、log replication、safety)使其更易理解;提供了 Raft 实现的教学框架。
  • 评价:分布式一致性领域经典论文,关于"Paxos 难理解"的讨论对工程教学有长期影响。
  • 行动:纳入 backend 分布式系统主题页引用。

17. arxiv:2404.18048 — Interactive Safety Verification of Distributed Protocols by Inductive Reasoning (PDF)

  • 来源:arXiv(2024)
  • 可信度:高(形式化验证方向)
  • 核心观点:归纳推理交互式验证分布式协议安全性,应用到工业级 Raft 协议规范验证。
  • 评价:形式化验证前沿,对 Raft 正确性有新的验证思路,适合高级分布式系统研究。
  • 行动:纳入分布式系统形式化验证参考文献。

18. LSM Tree: Data structure powering write heavy storage engines — Distributed Computing Musings (2026-06-12)

  • 来源:Distributed Computing Musings 博客(2026-06-12,非常近期)
  • 可信度:中
  • 核心观点:LSM tree 写入流程(MemTable → SSTable → Level 合并);读放大问题;Cassandra/HBase/LevelDB/RocksDB 为主流实现。
  • 评价:2026 年中更新的 LSM tree 工程入门,格式规范,适合作为 LSM 基础复习材料。
  • 行动:纳入 database 存储引擎入门参考。

📋 分类标签

database   | #向量数据库 #RAG #LSM-tree #B-tree #PostgreSQL #MySQL #存储引擎
backend    | #AI-Agent #LLM-Architecture #Memory-Architecture #Guardrails #MCP
cloud-native| #Kubernetes #AI-Inference #MLOps #Edge-Computing #CNCF
csdn       | (本次无高价值条目)
reproduction| #分布式一致性 #Paxos #Raft #形式化验证

💡 高价值条目优先级排序

优先级 条目 原因
⭐ 精读 #2 Substack RAG语义分块+Small-to-Big RAG 2026 核心方法论,有具体公式
⭐ 精读 #8 AI Agents Stack 2026 (Substack) Agent 架构 Memory分层+Guardrails+MCP安全
⭐ 精读 #10 Sebastian Raschka 2026 LLM Papers 混合架构/Agent 系统年度论文地图
⚡ 快读 #12 CNCF K8s as AI OS 官方数据背书,K8s AI 平台定位
⚡ 快读 #6 TiKV B-tree vs LSM 定量分析 存储引擎 benchmark 框架
⚡ 快读 #1/#3/#7 PostgreSQL/MySQL 2026 工程选型参考

📁 建议写入路径

  • 主草稿/shared/research-kb/inbox/jay/2026-06-17-research-brief.md ✅(本文件)
  • 主题页更新建议
  • RAG 主题页 → 更新 #2 语义分块 + Small-to-Big 方法论
  • AI Agent 主题页 → 更新 #8 Memory 分层 + Guardrails + MCP
  • LLM Research 主题页 → 更新 #10 混合架构论文列表
  • AI 基础设施趋势页 → 更新 #12 CNCF 数据引用
  • 数据库存储引擎页 → 更新 #4/#6/#15/#18 LSM vs B-tree 引用

🔎 后续行动建议

  1. 精读追踪:订阅 #2(Substack)和 #8(The AI Engineer)原文,提取中文可引用的精读笔记
  2. 论文核验:#10 中 Nemotron 3 混合架构是否有开源代码/官方实现?
  3. CSDN 替代源:考虑用掘金(juejin.cn)或知乎替代 CSDN 检索中文技术内容
  4. Substack 来源扩展:本周可新增检索 "The Pragmatic Engineer"(Gergely Orosz)、"ByteByteGo"(Alex Xu)两个高质量 Substack

本简报由 Jay 实例自动生成 · 2026-06-17 · 请勿直接写入 /shared/research-kb/review/ 或 /shared/research-kb/published/