🔴 保留 · `Toward Secure LLM Agents: Threat Surfaces, Attacks, Defenses, and Benchmarking`

类型：arxiv
标识：2606.10749
链接：https://arxiv.org/abs/2606.10749
主题：agent, database, engineering, evaluation, llm-infra, multimodal, rag, risk
来源文件：
/inbox/jay/2026-06-12-night-arxiv-engineering-llm-agents.md

可复用信息

- 发布分布：arXiv 主导，正式顶会和工业报告占长尾
- 单 agent vs 多 agent 占比变化：
- 2024：单 agent 90.5%，多 agent 9.5%
- 2025：单 agent 76.0%，多 agent 24.0%
- 2026（部分）：单 agent 82.7%，多 agent 17.3%（多 agent 从 niche 转为稳定子领域）
- 攻击类型分布：数据泄露、prompt 注入、工具滥用、agent 间通信攻击等
- 防御方法：静态策略（粗粒度/刚性强）vs 动态策略（隔离 LLM 按需生成）
保留理由：LLM agent 安全全景图，有量化数据支撑多 agent 安全趋势判断，对 agent 系统安全架构设计有直接参考价值。

写作用途

可放入 RAG / 知识库 / 检索增强相关工作的对比段。
可用于 Agent 架构、记忆、工具调用或多智能体研究背景。
可用于多模态推理、视觉语言模型或长上下文多模态问题定义。
可用于系统实现、实验平台或工程约束说明。
可用于局限性、风险、失效模式和未来工作。

待补齐

BibTeX / 正式引用格式
方法与实验设置细节
与现有工作的差异点
是否有代码和数据集