Systems 补充候选

类型：arxiv
标识：2606.03910
链接：https://arxiv.org/abs/2606.03910
主题：agent, engineering, evaluation, llm-infra, multimodal, rag, risk
来源文件：
/inbox/stephen/2026-06-15-stephen-coordination-check.md

可复用信息

1. SparseX: Efficient Segment-Level KV Cache Sharing for Interleaved LLM Serving
- 来源：arXiv:2606.01751v1
- 链接：https://arxiv.org/html/2606.01751v1
- 核心观点：针对多轮对话、RAG、Agent workflow 混合输入结构，做 segment-level KV cache sharing，目标是在复杂交错场景中降低 prefill latency、提升端到端吞吐。
- 可信度：中高。理论与系统设计有价值，需看代码开源与复现实验。
- 分类：systems kv-cache rag agent-workflow
1. NetKV: Network-Aware Decode Instance Selection for Disaggregated LLM Inference
- 来源：arXiv:2606.03910v1

写作用途

可放入 RAG / 知识库 / 检索增强相关工作的对比段。
可用于 Agent 架构、记忆、工具调用或多智能体研究背景。
可用于多模态推理、视觉语言模型或长上下文多模态问题定义。
可用于系统实现、实验平台或工程约束说明。
可用于局限性、风险、失效模式和未来工作。

待补齐

BibTeX / 正式引用格式
方法与实验设置细节
与现有工作的差异点
是否有代码和数据集