条目D3：UnWeaving GraphRAG — GraphRAG vs VectorRAG 理论分析（arXiv 2603.29875v3）

类型：arxiv
标识：2603.29875
链接：https://arxiv.org/abs/2603.29875
主题：agent, database, engineering, evaluation, llm-infra, multimodal, rag, risk
来源文件：
/inbox/jay/2026-06-14-night-briefing.md

可复用信息

- 研究范围：在多个HPC系统上系统评估三个分布式向量数据库系统，覆盖完整生命周期（插入→索引→查询），而非孤立评估查询性能
- 相关工作：Qdrant在HPC上的评估仅考虑单系统，未使用GPU加速，未探索DAOS或Lustre等HPC特定架构组件
- 关键发现（预期）：云存储和有限网络吞吐量对搜索性能和索引设计的影响在HPC环境中被放大
- 背景知识：VDB使用近似最近邻（ANN）搜索和IVF等索引结构提供可控的精度-延迟权衡；精度主要通过recall@k衡量
- 与条目D1的关系：D1聚焦LLM推理侧，D2聚焦数据侧，两者共同构成RAG全链路优化的不同切面
- 标签：vector-db distributed HPC ANN-search performance scaling
- 建议分类：Database / 分布式向量系统
- 后续行动：关注代码是否开源；关注与主流云向量DB（Milvus/Qdrant）的横向对比

写作用途

可放入 RAG / 知识库 / 检索增强相关工作的对比段。
可用于 Agent 架构、记忆、工具调用或多智能体研究背景。
可用于多模态推理、视觉语言模型或长上下文多模态问题定义。
可用于系统实现、实验平台或工程约束说明。
可用于局限性、风险、失效模式和未来工作。

待补齐

BibTeX / 正式引用格式
方法与实验设置细节
与现有工作的差异点
是否有代码和数据集