知识库草稿补遗 · Jay · 2026-06-12 下午
本次主题: Database + RAG 工程 + Cloud-Native eBPF + Substack 精选 · 补遗(避免与上午稿重复)
一、Database 系统新动态
1. xNVMe + DuckDB:NVMe 直通存储与数据库引擎协同设计
- 来源: CIDR 2026 Proceedings,
https://vldb.org/cidrdb/papers/2026/p6-houlborg.pdf - 作者: Houlborg, Tietgen et al.
- 可信度: 高(CIDR 2026 论文,Viktor Leis 合作)
- 核心发现:
- 现代 NVMe SSD 理论性能远超数据库实际利用水平(IO 路径中存在协议开销)
- xNVMe 是跳过操作系统 Page Cache、直接与 NVMe 硬件交互的用户态 IO 库
- 将 xNVMe 集成进 DuckDB:在 scan、append、checkpoint 等关键路径实测显著提速
- 论文还引用了 LeanStore(Leis, VLDB 2024)的 NVMe 利用方法,形成延续性研究线
- 工程意义: 对想最大化 NVMe 吞吐量的 OLAP 数据库调优有直接参考价值
- 标签:
nvmeduckdbstorage-engineCIDRperformanceio-optimization
2. SIGMOD 2026 Bengaluru · 关键会议信息
- 时间: 2026 年 5 月 31 日 – 6 月 5 日,印度班加罗尔
- 重要更新(对比往年):
- 新设 Submission and Review Ethics Committee: 2026 年专门成立委员会审查论文提交道德问题(COI 滥用、抄袭),体现数据库顶会对此问题的重视
- Author Revision Plan + Feedback 机制: 作者可在收到意见后提交 Revision Plan,评审委员会会考虑该计划再给最终决定;这是投稿体验的重大变化
- Interactive Discussion Phase: 评审可直接匿名向作者提问澄清,降低误判率
- 所有论文均有 poster: 长文 + 短文 + poster 全部展示,不再区分传统"通知但不做报告"
- SIGMOD 2027 投稿预警: 论文提交截止日期通常在 8-9 月,建议提前 6 个月启动写作
- 标签:
SIGMODconferenceacademiccall-for-papersdeadline
3. VLDB 2026 Boston · 会议概览
- 时间: 2026 年 8 月 31 日 – 9 月 4 日,美国波士顿
- 会议规模: 每年 1000+ 参会者,PVLDB 是唯一接收渠道(按月审稿)
- Volume 19 截止线: 2026 年 6 月 15 日前接受的论文自动进入 VLDB 2026 Research Track;之后顺延至 VLDB 2027
- SIGMOD vs VLDB 对比: SIGMOD 偏重理论/系统设计,VLDB 偏重实际系统和大数据规模验证;投稿策略上可交叉参考
- 标签:
VLDBconferenceacademicBostondeadline
4. Graph Transformers for Query Plan Representation(VLDB 2026)
- 来源:
https://github.com/LumingSun/ML4DB-paper-list(ML4DB 综合列表) - 论文方向: 用图神经网络(GNN/Graph Transformer)将 SQL 查询计划编码为向量表示,用于 learned query optimizer 的 plan representation
- 关联工作: 与 Neptune(VLDB 2025)、LEON+(VLDB 2026)等形成 learned optimizer 体系
- 建议分类:
learned-optimizerquery-optimizationgraph-NNVLDB
二、RAG 工程精选
5. 生产级 RAG 架构深度解析(Manifold AI Learning,2026-01)
- YouTube:
https://www.youtube.com/watch?v=Mbe2Tw57QFE(发布于 2026-01-11) - 可信度: 中高(资深 AI 工程教育者,面向 senior backend/platform engineer)
- 核心内容(RAG 生产失败常见原因):
- 成本架构盲区: 盲目 rerank 10k 候选文档 vs 用 hybrid search 控制候选集规模,成本差 10 倍
- Embedding 模型选型: 盲目使用 OpenAI ada-002,忽视 BGE-large-zh(中文场景)和 GTE-large(多语言)
- Chunk 策略的深层问题: 固定 chunk size 忽略文档语义结构;RecursiveCharacterTextSplitter 优于 Naive splitter
- Permission Filtering: RAG 检索结果必须经过权限过滤(语义检索结果 ≠ 有权访问结果)
- Observability 缺失: 没有 tracing(哪些 chunk 被检索、LLM 用到多少、最终答案置信度)就无法迭代改进
- Bootcamp 信息: 2026 年 2 月 15 日开课,周六 8–11 AM IST,高阶工程师专项
- 标签:
RAGproductionarchitecturecost-optimizationobservabilityengineering
6. Agentic RAG 系统化指南(EITT Academy,2026)
- 链接:
https://eitt.academy/knowledge-base/ai-agents-2026-guide-from-llm-to-multi-agent-systems - 可信度: 中(教育平台,综合 2026 年最新 agentic RAG 范式)
- 核心分类框架:
- Classic RAG: chunk → embed → vector search → top-k → generate(缺陷:精度低、上下文丢失、chunk 间关系断裂)
- Contextual Retrieval(Anthropic 2024): embedding 前先用 LLM 生成 chunk 的文档上下文描述,precision ↑35–50%
- Agentic RAG: Agent 自己决定何时检索、检索什么Query、是否需要多轮迭代(更灵活但调用成本更高)
- Memory Architecture 2026(重要):
- Working Memory → Context Window(50–500k tokens)
- Episodic Memory → Vector DB + Structured DB(跨 session 历史)
- Semantic Memory → Vector DB(企业知识库/政策文档)
- Procedural Memory → Decision trees / BPMN / markdown playbooks
- 评价: 这是 2026 年 agentic RAG 体系最系统的中文友好梳理;Memory Architecture 四层模型与 Context Pyramid 可互为补充
- 标签:
agentic-RAGmemory-architecturecontextual-retrievalenterprise-RAGframework
三、Cloud-Native & eBPF 工程
7. Isovalent · 2026 年 eBPF 和 Kubernetes 网络预测
- 链接:
https://isovalent.com/blog/post/networking-and-ebpf-predictions-for-2026 - 作者: Nico Vibert(Isovalent,Cilium 核心维护者)
- 可信度: 高(eBPF/Cilium 领域最权威的声音之一,2026-01-22 发布)
- 预测要点(8 条):
- VM on Kubernetes 现实检验: 2026 年采用加速但伴随更诚实的挫折感(性能、网络、运维成熟度);KubeVirt 适合迁移而非全新部署
- 多云开始真正落地: DORA 法规压力迫使组织认真做 exit planning,多云不再是口号
- Gateway API 全面替代 Ingress: 多集群、流量管理、安全策略的统一控制面
- eBPF 安全:被动到主动: 从"收集日志/告警"到"可执行的智能安全策略";eBPF 实现了内核级实时阻断
- eBPF 生态碎片化治理需求: 各工具 eBPF 实现不一致,需要 guardrails 和 shared practices
- Cilium 持续扩张: 作为 Kubernetes CNI + Service Mesh + Network Policy 的统一层
- AI GPU 互联网络: eBPF 可见性延伸到 GPUDirect RDMA 网络路径
- eBPF 可编程性的民主化: 未来不需写 C/Go,通过高级语言或 YAML 配置 eBPF 程序
- 与上午稿(Kubernetes 2026 五大变化)的差异点: 上午稿侧重 K8s 生态趋势,本条侧重 eBPF 网络和安全的技术深度
- 标签:
eBPFciliumkubernetesnetworkingisovalentcloud-native
四、Substack 精选(下午补遗)
8. Ahead of AI · Sebastian Raschka · 2026 Q1–Q2 LLM 论文精选(1月–5月)
- 链接:
https://magazine.sebastianraschka.com/p/llm-research-papers-2026-part1 - 作者: Sebastian Raschka(PhD ML researcher,Lightning AI,2024-2026 持续追踪)
- 可信度: ⭐⭐⭐⭐⭐(学术品味高,评价客观,不做标题党)
- 核心论文时间线(2026年):
| 日期 | 论文/模型 | 关键信息 |
|---|---|---|
| 1月30日 | LatentLens | 可解释视觉 token,LLM 内部表征分析 |
| 2月4日 | ERNIE 5.0 Tech Report | 百度大模型更新 |
| 2月8日 | ViT-5 | 新一代 Vision Transformer 设计 |
| 2月11日 | Step 3.5 Flash | 11B active params,前沿级智能 |
| 2月12日 | Nanbeige4.1-3B | 3B 参数推理小模型,对标 Qwen2.5-3B |
| 2月16日 | Symmetry in Language Statistics | 表征几何性质研究(理论) |
| 2月17日 | GLM-5: From Vibe Coding to Agentic Engineering | 智谱更新,Agentic 编程定位 |
| 2月18日 | Arcee Trinity | 混合架构(attention + Mamba2 SSM) |
| 3月4日 | Spike, Sparse and Sink | 大规模激活和 attention sink 的实证解剖 |
| ... | Nemotron-3 | NVIDIA Mamba2 混合架构 |
| ... | GLM-5 | 智谱 Agentic Engineering |
- 关键趋势提炼(Raschka 评注):
- 混合架构(Hybrid Architecture)成为主流: Nemotron-3、Arcee Trinity 均采用 attention + SSM 混合设计;在长上下文效率上优于纯 transformer
- Long-context efficiency 是 2026 年核心工程问题: 模型接入 Agentic loops 需要更长上下文,SSM 架构是对此的直接响应
- Architecture beyond scale: 2026 年不再只是"把 transformer 做大",混合、稀疏、可解释成为新的研究维度
- 使用说明: Raschka newsletter 是高质量学术线索源;建议只记录论文名、链接、核心洞察,不复制原文
- 标签:
LLM-researchpaper-listsebastian-raschkahybrid-architectureSSMlong-context
9. RAG 2026 完整指南(Prompt Engineering Guide)
- 链接:
https://www.promptingguide.ai/research/rag(最后更新 2026-02-01) - 可信度: 高(O'Reilly 关联,学术 + 工程双视角)
- 2026 年 RAG 关键研究方向(与上午稿互补):
- Multimodal RAG: 扩展到图像、音频、视频、代码多模态检索
- Context Length 适应: 长上下文窗口对 RAG 召回策略的影响(超长上下文 → 哪些 chunk 仍然关键?)
- Robustness: 对抗性/反事实信息对 RAG 质量的影响
- Hybrid RAG + Fine-tune: 理解何时用 RAG、何时微调、何时两者结合
- Scaling Laws for RAG: LLM scaling laws 如何迁移到 RAG 系统设计
- 标签:
RAGmultimodalresearchscalingrobustness
五、本次新增分类标签
nvme duckdb CIDR SIGMOD-2026 VLDB-2026 conference deadline learned-optimizer graph-NN RAG-production cost-optimization agentic-RAG contextual-retrieval memory-architecture eBPF cilium isovalent llm-research hybrid-architecture SSM sebastian-raschka
六、本次高价值条目(晚间补遗 TOP 5)
| 优先级 | 条目 | 来源 | 建议分类 |
|---|---|---|---|
| 🔴 精读 | Sebastian Raschka 2026 Q1-Q2 LLM 论文精选 | Substack | LLM-research hybrid-architecture |
| 🔴 精读 | 生产级 RAG 架构深度解析(成本 + 可观测性) | YouTube | RAG production cost-optimization |
| 🟡 精读 | Agentic RAG + Memory Architecture 四层模型 | EITT Academy | agentic-RAG memory |
| 🟡 精读 | Isovalent eBPF 2026 预测(技术深度) | Substack | eBPF cilium networking |
| 🟢 归档 | xNVMe + DuckDB CIDR 2026 论文 | CIDR 2026 | nvme duckdb io-optimization |
七、与上午稿的差异化定位
| 维度 | 上午稿 | 本次补遗 |
|---|---|---|
| RAG | Substack 来源 + 评估工具 | 生产架构成本 + 可观测性 + agentic RAG 系统化 |
| Cloud-Native | K8s 2026 生态趋势 | eBPF 技术深度(Cilium + 网络) |
| Database | arXiv cs.DB 新论文 | SIGMOD/VLDB 会议信息 + CIDR xNVMe 论文 |
| LLM Research | Substack newsletter | Sebastian Raschka 学术论文精选(混合架构、SSM) |
Jay · 2026-06-12 下午 · 研究知识库高频检索补遗