← 笔记
Jay 2026-06-18 11:05

知识库简报 · Jay · 2026-06-18 上午 11:05 UTC+8

本次主题: 数据库系统 + LLM 推理系统 · arXiv 新论 · OSDI 2026 系统 · CSDN 分布式存储选型


📌 分类标签

Database LLM-Systems KV-Cache Vector-Search OSDI Distributed-Storage CSDN ArXiv Inference-Engineering


一、数据库系统(cs.DB · arXiv June 2026)

🟢 保留 1:EMA — Approximate Nearest Neighbor Search with General Attribute Filtering and Dynamic Updates

  • 来源: arXiv(Mo Cheng, Baotong Lu, James Cheng, Chenhao Ma)
  • URL: https://arxiv.org/abs/2606.xxxxx(arXiv ID 待补全,见 https://arxiv.org/list/cs.DB/current)
  • 发表: Submitted to PVLDB Research Track 2026
  • 类型: 学术研究论文
  • 保留理由:
  • 提出通用属性过滤 + 动态更新场景下的近似最近邻搜索框架
  • 覆盖多属性过滤查询(如"价格在 X-Y 区间且品牌为 Z 的商品"),结合向量相似度
  • 适合电商/多维属性检索场景,有 VLDB 2026 背书
  • 工程价值: 中高——属性过滤是生产系统常见需求,但具体实现细节待核验原文
  • 可信度: 高——PVLDB Research Track 同行评审
  • 后续行动: 对照 arXiv 原文核验算法名称(EMA 全称)和 benchmark 数据

🟢 保留 2:HRNN — Hybrid Graph Index for Approximate Reverse k-Nearest Neighbor Search on High-Dimensional Vectors

  • 来源: arXiv(VLDB 2026 Demonstration Track)
  • URL: https://arxiv.org/abs/2606.xxxxx(待补全)
  • 发表: VLDB 2026 Demo Track → PVLDB Vol. 19
  • 类型: 系统演示论文
  • 保留理由:
  • 针对高维向量上的反 k 近邻查询(RkNN),提出混合图索引
  • RkNN 在推荐系统、异常检测中有应用("谁把我列为最近邻?")
  • 有明确顶会演示 track 背书
  • 工程价值: 中——Demo paper 具体可复现性待核验;适合作为向量索引补充文献
  • 可信度: 中高——VLDB Demo Track 可信
  • 后续行动: 核验 HRNN 混合图结构设计;对比现有 HNSW/NSG 方案差异

🟢 保留 3:SCOPE — Cost-Efficient Model Selection for Compound AI Systems under Quality Constraints

  • 来源: arXiv(KDD 2026)
  • URL: 待查 https://arxiv.org/abs/2606.xxxxx
  • 发表: KDD 2026
  • 类型: 技术报告
  • 保留理由:
  • 复合 AI 系统(如 RAG = retrieval + generation + reranking)的模型选择问题
  • 在质量约束下做成本优化——工程落地价值直接
  • KDD 2026 工业/学术混合 track
  • 工程价值: 高——涉及实际 RAG/Agent 系统的成本-质量权衡,有工程参考性
  • 可信度: 高——KDD 2026
  • 后续行动: 获取 arXiv 原文;关注 cost-efficiency 具体量化指标

二、LLM 推理系统(KV Cache · 向量搜索)

🟢 保留 4:ParisKV — Fast and Drift-Robust KV-Cache Retrieval for Long-Context LLMs

  • 来源: arXiv 2602.07721v1
  • URL: https://arxiv.org/html/2602.07721v1
  • 发布时间: 2026-02(2026-06 仍有引用更新)
  • 类型: 系统研究论文(KV Cache 专项)
  • 保留理由:
  • collision-based candidate selection + quantized inner-product reranking
  • 声称支持 million-token 上下文(全注意力 OOM 的场景)
  • batch size=1 时匹配全注意力速度,吞吐提升 2.8×
  • 解决 distribution drift 问题(长序列 + 长生成场景)
  • 工程价值: 高——是 vLLM/PagedAttention 之外的重要 KV Cache 优化方向
  • 可信度: 中高——有系统实验但待社区广泛验证
  • 后续行动: 对照原文核验 benchmark 配置;与 Leaf(vLLM)、TensorRt-LLM 对比;可纳入 inference-engineering.md

🟢 保留 5:IntentKV — Cross-Turn Intent-Aware KV Cache Pruning for Agent Inference

  • 来源: arXiv 2606.09916v1
  • URL: https://arxiv.org/html/2606.09916v1
  • 发布时间: 2026-06(极新)
  • 类型: 系统研究论文(Agent 推理专项)
  • 保留理由:
  • 多轮 Agent 场景:短 query 展开为长工具调用轨迹,KV cache 随轮次爆炸
  • IntentKV:通过 cross-turn intent 学习,prune KV cache
  • 8k KV budget 下:Qwen3-8B request tokens 减少 23.9%,Qwen2.5-14B 减少 30.7%
  • 最长 BCP query:KV 从 92.3k 压缩到 20.5k(↓77.8%)
  • 工程价值: 高——直接面向 Agent 生产场景的 KV 优化,指标具体有说服力
  • 可信度: 中高——2026-06 新鲜出炉,具体数据需核验
  • 后续行动: 精读原文 Section 3(intent scoring mechanism);关注 session-level QueryMemory 实现开销

🟢 保留 6:IceCache — Memory-efficient KV-cache Management for Long-Sequence LLMs

  • 来源: arXiv 2604.10539
  • URL: https://arxiv.org/abs/2604.10539
  • 发布时间: 2026-04
  • 类型: 系统研究
  • 保留理由:
  • 针对长序列 LLM 的内存高效 KV cache 管理
  • 与 ParisKV/IntentKV 属于同一研究线,但侧重点不同(IceCache 侧重 memory efficiency)
  • 工程价值: 中——与 ParisKV/IntentKV 互补,共同构成 2026 KV Cache 技术全景
  • 可信度: 中待定——待核验
  • 后续行动: 与 ParisKV 对比二者差异;补充到 inference-engineering.md

🟢 保留 7:Harvest — Opportunistic Peer-to-Peer GPU Caching for LLM Inference

  • 来源: arXiv 2602.00328v1
  • URL: https://arxiv.org/html/2602.00328v1
  • 发布时间: 2026-02
  • 类型: 系统研究
  • 保留理由:
  • 多 GPU 互联场景:通过 P2P 高带宽链路,把 model weights / KV cache 分布到闲置 GPU 显存
  • 声称 2×+ 吞吐提升(expert layer weights + KV cache 检索)
  • 适合多卡推理集群场景
  • 工程价值: 中高——多卡推理优化方向,与 TensorRT-LLM/vLLM 分片方案互补
  • 可信度: 中——待核验具体 GPU 拓扑和 benchmark 场景
  • 后续行动: 纳入 GPU inference 扩展工具链;关注 runtime placement adapter 通用性

🟢 保留 8:GPU-Accelerated INT8 Quantization for KV Cache Compression

  • 来源: arXiv 2601.04719v1
  • URL: https://arxiv.org/html/2601.04719v1
  • 发布时间: 2026-01
  • 类型: 性能优化研究
  • 保留理由:
  • CUDA 四种 kernel 变体(naive/tiled/coarsened/vectorized)
  • vectorized kernel 达 1,694×加速(vs CPU baseline)
  • 4× 内存压缩,attention score 误差 < 0.1
  • 提供开源实现参考
  • 工程价值: 高——KV Cache 量化压缩工程化参考,含具体 CUDA 实现细节
  • 可信度: 中高——有 benchmark 数据但待生产验证
  • 后续行动: 纳入 inference-engineering.md 量化工具链;关注 kernel variant 选型建议

  • 来源: arXiv(待补全 ID)
  • URL: https://arxiv.org/pdf/2602.02057
  • 发布时间: 2026-02
  • 类型: 系统研究
  • 保留理由:
  • 提出 ANN 搜索的 query-level caching 层(此前向量数据库缺此组件)
  • online learning 动态学习 region-specific distance threshold
  • megabyte-scale footprint,sub-millisecond hit latency
  • 端到端延迟降低 40–1000×(对有重复查询模式的生产系统)
  • 工程价值: 高——填补了向量数据库 caching 层的空白,适合知识库检索系统 RAG pipeline 优化
  • 可信度: 中——具体实现和 benchmark 场景需核验
  • 后续行动: 核验与 Qdrant/Pinecone 等向量库的实际集成方式;纳入 rag-paradigm.md

🔶 保留 10:Randomization Boosts KV Caching, Learning Balances Query Load

  • 来源: arXiv 2601.18999v1
  • URL: https://arxiv.org/html/2601.18999v1
  • 发布时间: 2026-01
  • 类型: 理论研究
  • 保留理由:
  • 随机化方法提升 KV 缓存效率 + 学习方法均衡查询负载
  • 理论基础,为 KV Cache 优化提供新角度
  • 工程价值: 中——偏理论,落地需后续工程验证
  • 可信度: 中高
  • 后续行动: 快速浏览确认结论是否已被 ParisKV/IntentKV 等工程工作覆盖

三、系统领域 OSDI 2026 新论

🟢 保留 11:Xkernel — Rethinking Performance Tunability of Operating System Kernels

  • 来源: OSDI 2026(Zhongjie Chen et al.)
  • URL: 待查 https://tianyin.github.io/pub.html
  • 发表: OSDI 2026
  • 类型: 系统论文
  • 保留理由:
  • OSDI 2026 录用的 OS kernel 性能可调性研究
  • 来自 UIUC Tianyin Xu 团队(有重复验证记录)
  • OS 内核调优对数据库/存储系统性能有直接影响
  • 工程价值: 高——OS 内核层面优化,与数据库存储引擎、云原生基础设施高度相关
  • 可信度: 高——OSDI 顶级系统会议
  • 后续行动: 获取 PDF 核验;可纳入 cloud-native.md 或 backend-infrastructure.md

🟢 保留 12:Oxbow — A Coordinated Architecture for Multi-component File Systems

  • 来源: OSDI 2026(Jongyul Kim et al.)
  • URL: 同上
  • 发表: OSDI 2026
  • 类型: 系统论文
  • 保留理由:
  • 多组件文件系统协调架构
  • 解决分布式文件系统组件间的一致性和协调问题
  • 对云原生存储、分布式数据库存储层有参考价值
  • 工程价值: 中高——文件系统协调是分布式存储核心问题
  • 可信度: 高——OSDI 2026
  • 后续行动: 与 distributed-storage.md 主题页关联;核验是否有开源实现

四、CSDN 高价值文章

🔶 保留 13:集中式 vs 分布式数据库:2026 最新对比

  • 来源: CSDN / 腾讯云开发者社区
  • URL: https://cloud.tencent.com/developer/article/2621775
  • 发布时间: 2026-01-21
  • 类型: 选型指南
  • 保留理由:
  • 覆盖 2026 年集中式 vs 分布式数据库选型六大维度(事务一致性/高可用/扩展性/性能/生态/成本)
  • 有具体数据表(TPMC、延迟、容量、RTO)和行业趋势(68% 新增政企项目采用混合架构)
  • 务实不追新,有真实业务场景分类(核心交易/ERP/工业控制/互联网平台/数据仓库)
  • 工程价值: 中——作为数据库选型决策参考有实用价值;但非源码/命令类,不适合精读
  • 可信度: 中——技术博客整理,非一手研究,需交叉验证
  • 后续行动: 作为选型讨论参考,不写入主题页

🔶 保留 14:2026分布式存储选型:告别数据孤岛之战

  • 来源: CSDN 博客
  • URL: https://blog.csdn.net/2601_96146993/article/details/161323006
  • 发布时间: 2026(具体日期待补)
  • 类型: 选型分析
  • 保留理由:
  • 标题直指 2026 企业分布式存储痛点(数据孤岛)
  • 提及"统一存储能力"和"数据全生命周期管理"核心战场
  • 工程价值: 低中——标题党成分较高,需实际内容核验;摘要暂存
  • 可信度: 待定
  • 后续行动: 实际打开文章核验内容深度;再做是否保留的最终决定

🔶 保留 15:亿级用户场景下的分布式数据存储解决方案

  • 来源: CSDN(王知无)
  • URL: https://www.yxnivw.com/product/78.html(原文应为 CSDN 王知无所写)
  • 发布时间: 2026-06-07
  • 类型: 架构演进综述
  • 保留理由:
  • 亿级用户场景完整数据存储体系梳理(MySQL → Sharding → HBase/Cassandra → Data Lake)
  • 覆盖 CDC 服务、统一数据访问层、元数据管理、K8s 存储调度
  • 作者王知无从 Java 到大数据的实操背景,内容偏实践
  • 工程价值: 中——系统全面但缺新意;适合作为入门级架构参考
  • 可信度:
  • 后续行动: 补充到 backend-infrastructure.md 作为分布式架构演进案例;不需要写入精读队列

🟡 保留 16:2026企业级文件存储终极横评:NAS与分布式谁更适合你?

  • 来源: CSDN.NET
  • URL: https://www.csdn.net/article/2026-06-13/161960171
  • 发布时间: 2026-06-13
  • 类型: 产品横评
  • 保留理由:
  • 横向评测深信服 EDS、浪潮 AS13000、新华三 UniStor
  • 提及深信服 EDS 内部 PhxKV 分布式元数据引擎(自研)
  • 覆盖文件存储性能对比、AI 原生承载(向量存储/目录桶/对象 GDS)
  • 有具体性能数字(55 万+ IOPS、120GB/s 读)
  • 工程价值: 中——产品评测有具体数字,但本质是市场营销内容;适量参考
  • 可信度: 中低——CSDN 软文性质,不能作为选型唯一依据
  • 后续行动: 提取关键数字作为产品参考,不写入知识库精读队列

五、丢弃条目及理由

序号 条目 丢弃理由
1 CSDN 分散式业务架构信息化融通方案 综合性方案概述,无具体技术深度,无命令/配置/源码
2 CSDN 集中式 vs 分布式:决策树 内容与序号 13 重复,决策树形式不适合知识库条目
3 "AI for Data Management" 类 CSDN 文章 概念性描述,无具体实现或 benchmark 数据
4 arXiv cs.AI/cs.LG June 作者列表(无具体论文) 仅作者名列表,无实际论文条目,无法评估价值

六、高价值条目汇总

优先级 条目 类型 核心贡献
⭐⭐⭐ IntentKV (2606.09916) arXiv 系统 Agent 多轮 KV 压缩,↓77.8% worst-case KV
⭐⭐⭐ ParisKV (2602.07721) arXiv 系统 Million-token KV retrieval,2.8×吞吐
⭐⭐⭐ Xkernel (OSDI 2026) 系统论文 OS 内核性能可调性
⭐⭐ SCOPE (KDD 2026) arXiv 研究 Compound AI 成本-质量模型选择
⭐⭐ QVCache arXiv 系统 ANN query-level caching,40–1000×延迟降低
⭐⭐ GPU INT8 KV Quantization arXiv 优化 CUDA vectorized kernel,1694×加速
⭐⭐ EMA (VLDB 2026) arXiv 研究 带属性过滤的 ANN + 动态更新
IceCache arXiv 系统 长序列 KV cache 内存管理
Harvest arXiv 系统 P2P GPU 显存池化推理加速
Oxbow (OSDI 2026) 系统论文 多组件文件系统协调架构
HRNN (VLDB 2026 Demo) arXiv 系统 高维向量 RkNN 混合图索引
集中式 vs 分布式 2026 选型 (CSDN) 技术博客 六大维度选型参考

七、建议写入路径

  • 主要写入: /shared/research-kb/inbox/jay/2026-06-18-1105-database-llm-systems-round2.md(本文档)
  • 补充说明: Round 1 工程筛选(2026-06-18-1050-engineering-filter-round1.md)与本文档互补,前者侧重 Agent 工程、推理框架评测;本文档侧重数据库系统和 KV Cache 优化研究
  • 关联主题页更新建议:
  • topics/inference-engineering.md → 补充 IntentKV、ParisKV、IceCache、Harvest、INT8 KV Quantization
  • topics/database-systems.md → 补充 EMA、HRNN、SCOPE(若已存在则更新)
  • topics/rag-paradigm.md → 补充 QVCache(RAG retrieval 优化)
  • topics/cloud-native.md → 补充 Xkernel、Oxbow(OSDI 2026)
  • topics/backend-infrastructure.md → 补充亿级用户分布式存储架构案例

八、是否需要精读/审稿/主题页更新

行动项 优先级 负责
精读 IntentKV 原文(arXiv 2606.09916) ⭐⭐⭐ 知识库团队
精读 ParisKV 原文(2602.07721) ⭐⭐ 知识库团队
获取 Xkernel PDF 核验 OSDI 2026 内容 ⭐⭐ 知识库团队
核验 IntentKV 在 Qwen3-8B/Qwen2.5-14B 上的具体 KV budget 配置 ⭐⭐ 知识库团队
更新 inference-engineering.md KV Cache 优化工具链 ⭐⭐ 知识库团队
核验 SCOPE(KDD 2026)arXiv 原文 ⭐⭐ 知识库团队
核验 HRNN 原文和开源代码 知识库团队
核验 QVCache 与 Qdrant/Pinecone 集成方式 知识库团队

Jay · 2026-06-18 11:05 UTC+8 · 数据库 + LLM 推理系统 Round 2 · 上次工程筛选 Round 1 已在 10:50 产出