知识库草稿:Agent 安全 & LLM 推理部署工程 · Jay · 2026-06-11
检索范围: OWASP Substack · MLSys 2026 · arXiv · Hugging Face · CSA Labs · ApplyData · ByteByteGo 本实例: Jay | 日期: 2026-06-11 | 第三次运营
一、OWASP Top 10 AI/LLM/Agents 安全指南(高优先级)
条目来源
- 专栏: Alex Ewerlof (安全工程师) @ Substack
- 发布时间: 2026(持续更新)
- 原文链接: https://open.substack.com/pub/alexewerlof/p/owasp-top-10-ai-llm-agents
- 可信度: ⭐⭐⭐⭐⭐(OWASP 官方 + 工程出身作者,MCP/Agent 安全领域权威)
核心安全框架:三条主线
主线 A:LLM 应用安全(OWASP Top 10 LLM,LLM01–LLM10)
| 编号 | 名称 | 风险描述 | 关键缓解 |
|---|---|---|---|
| LLM01 | Prompt Injection | 攻击者输入覆盖系统指令 | 语义防火墙;系统提示隔离;永不信任用户输入 |
| LLM02 | Sensitive Information Disclosure | 模型泄露 PII 或后端密钥 | 数据先脱敏再进 LLM;输出层严格过滤 |
| LLM03 | Supply Chain | 第三方模型或包被篡改 | 要求 AI-BOM/SBOM;按 hash pin 所有依赖 |
| LLM04 | Data & Model Poisoning | 攻击者污染训练数据或 RAG 上下文 | 数据集密码学验证;RAG 文档零信任 |
| LLM05 | Improper Output Handling | 盲目执行 LLM 输出(如 eval()) |
所有 LLM 输出视为敌对;沙箱执行(Wasm/微 VM) |
| LLM06 | Excessive Agency | 赋予 AI 过多权限 | 最小权限原则;JIT 临时 token;HITL 确认 |
| LLM07 | System Prompt Leakage | 系统提示暴露后端逻辑/密钥 | 密钥不出现在提示中;用安全保险箱和上下文过滤 |
| LLM08 | Vector & Embedding Weaknesses | 利用语义搜索/RAG 架构 | Vector DB 命名空间密码学隔离;严格租户边界 |
| LLM09 | Misinformation | 盲目信任 AI 幻觉 | 严格 RAG grounding;置信度评分;交叉验证 |
| LLM10 | Model Denial of Service | 恶意输入耗尽资源 | 输入长度限制;流控;资源配额 |
主线 B:Agent 系统安全(OWASP Top 10 Agents,ASI01–ASI10)
重点条目:
-
ASI03: Tool Poisoning
MCP 服务器描述被投毒,84.2% 攻击成功率(auto-approval 开启时)。
缓解:MCP 服务器来源白名单;hash pin 版本;禁止 auto-approval 生产部署。 -
ASI05: Unexpected Code Execution
LLM 输出被盲目执行(对应 LLM05 的 agent 扩展)。
缓解:沙箱工具执行;禁止 agent 直接调用exec()/eval()。 -
ASI06: Memory Poisoning
共享 Vector DB 中租户数据仅靠应用层过滤,攻击者用 embedding payload 跨租户拉取数据。
缓解:密码学命名空间隔离(不只是 filter)。
主线 C:MCP 安全实测数据(Endor Labs 研究)
- 分析了 2,614 个 MCP 服务器
- 82% 存在路径遍历漏洞
- 67% 存在代码注入风险
- 生产 MCP server 必须有独立安全审计流程
工程实践:Harness Engineering 安全原则
"Model proposes / harness executes" — LLM 返回结构化工具调用,harness 验证 schema + 权限 + 执行
三层风险等级: 1. 无风险:只读工具(语义搜索、读文件) 2. 中风险:写操作但可撤销(发消息、创建文件) 3. 高风险:不可逆操作(删除资源、支付、执行代码)
关键原则: - 最小权限访问:90% 已部署 agent 存在过度授权 - JIT 临时 token:工具执行时才生成,严格限定资源和时间窗口 - 每个工具调用必须返回结果(包括失败),禁止 dangling promises - Prompt injection 升级为任意代码执行是主要攻击路径
评价与后续行动
- 工程价值: ⭐⭐⭐⭐⭐(安全工程师必备;MCP server 安全审计清单可立即落地)
- 后续行动: 建议与
2026-06-11-agent-eval-production-engineering.md第7条(Harness Engineering)合并,构建 agent 安全加固指南
二、LLM 推理部署工程:MLSys 2026 Oral(高优先级)
条目来源
- 会议: MLSys 2026(Machine Learning and Systems)
- 论文: "Optimizing Deployment Configurations for LLM Inference"
- 原文链接: https://mlsys.org/virtual/2026/oral/3780
- 可信度: ⭐⭐⭐⭐⭐(学术顶会 Oral,生产级规模经验)
核心贡献
研究规模: 数百万种部署配置分析,识别在满足延迟 SLO 条件下最大化吞吐量的配置。
设计空间三大维度: 1. 硬件选择:H100 / H200 / MI300X 2. 并行策略:Tensor / Pipeline / Expert / Context / Data Parallelism 3. 运行时选项:Continuous Batching vs. Prefill-Decode Disaggregation
生产经验教训(关键结论):
- 并行策略具有相位特异性:prefill 阶段和 decode 阶段对并行策略的需求不同,混合使用比单一策略更优
- 硬件异构性有机会:H100/H200 混合部署可优化成本-性能比
- MoE 架构带来新的系统层面影响:Expert Parallelism 需要不同的调度策略
- 平台扩展行为非线性:扩展到更多 GPU 不一定带来线性性能提升,存在拐点
对工程师的实际意义: - 推理部署配置空间巨大(硬件 × 并行策略 × 运行时选项),不能靠直觉配置 - 需要系统性方法评估配置,不能依赖单一 benchmark - SLO 驱动的配置搜索(延迟 SLO 约束下最大化吞吐)比吞吐优先更符合实际业务
评价与后续行动
- 工程价值: ⭐⭐⭐⭐⭐(生产推理部署必读;SLO 驱动配置优化方法是新范式)
- 后续行动: 建议核验论文源码仓库;提炼 SLO 驱动配置搜索方法论形成内部推理部署文档
三、LLM Serving 需要数学优化,而非只是启发式(ArXiv Position Paper)
条目来源
- 平台: arXiv · arxiv:2605.01280v1
- 标题: "Position: LLM Serving Needs Mathematical Optimization and Algorithmic Foundations, Not Just Heuristics"
- 原文链接: https://arxiv.org/html/2605.01280v1
- 可信度: ⭐⭐⭐⭐(学术 Position Paper,批判性视角有价值)
核心论点
当前 LLM Serving 系统的算法核心(vLLM / SGLang 等)仍然沿用经典分布式计算的通用策略:
| 组件 | 当前做法 | 问题 |
|---|---|---|
| 请求路由 | Join-Shortest-Queue 或 Round-Robin | 忽略 LLM 请求的独特到达模式 |
| 调度器 | FIFO 默认 | 忽略 prefill/decode 相位不对称性 |
| KV Cache 淘汰 | LRU | 忽略动态增长的 KV cache 内存模式 |
| Batch 策略 | Continuous Batching | 固定假设,未考虑输出长度未知性 |
LLM 推理的独特结构: - 动态增长的 KV cache 内存 - prefill-decode 相位不对称(计算特征完全不同) - 输出长度未知 - Continuous Batching 约束
Position 主张: 需要数学模型捕获这些特性,设计有可证明性能保证的算法,而非在某些场景有效但在其他场景不可预测地失败的启发式方法。
评价与后续行动
- 工程价值: ⭐⭐⭐⭐(批判性视角,vLLM/SGLang 贡献者可关注;可能是 2026-2027 年的重要研究方向)
- 后续行动: 建议核验是否已有基于此 Position 的具体算法实现(如对 vLLM PR 的影响)
四、ChromaDB CVE-2026-45829:Vector DB 安全警报
条目来源
- 机构: CSA (Cloud Security Alliance) Labs
- 报告: "ChromaToast: Unauthenticated RCE in AI Vector Databases"
- 发布时间: 2026-05-20
- 原文链接: https://labs.cloudsecurityalliance.org/research/csa-research-note-chromadb-rce-ai-vector-database-20260520-c
- 可信度: ⭐⭐⭐⭐⭐(CSA 官方安全研究,漏洞已编号 CVE-2026-45829)
关键数据
- 受影响版本: ChromaDB Python FastAPI 服务器
- 影响规模: 约 1,300 万月 pip 下载(mid-2026),最广泛部署的开源向量数据库之一
- 漏洞类型: 未认证 RCE(Unauthenticated Remote Code Execution)
- 攻击路径: Python FastAPI server 的特定端点
- 已缓解: 已迁移到 Rust server 的用户不受影响;从未以网络可访问配置部署 Python server 的用户不受影响
缓解措施
- 迁移到 Rust server:ChromaDB 已提供 Rust 实现,生产环境优先使用
- 网络隔离:Python FastAPI server 禁止暴露在公网;内部部署用防火墙严格控制访问
- 定期安全扫描:CSA 建议对 AI 应用栈进行依赖漏洞扫描
评价与后续行动
- 工程价值: ⭐⭐⭐⭐⭐(生产安全高优先级事件;RCE 漏洞直接影响 AI 应用数据安全)
- 后续行动: 建议立即检查团队 ChromaDB 版本;若使用 Python server,立即评估迁移 Rust 或寻找替代(Qdrant/pgvector)
五、AI 工程五大趋势 2026(ApplyData)
条目来源
- 平台: ApplyData (applydata.io)
- 标题: "5 Data & AI Engineering Trends in 2026"
- 原文链接: https://applydata.io/5-data-ai-engineering-trends
- 可信度: ⭐⭐⭐(行业分析,部分工具有偏向,但概念框架有价值)
五大趋势
| # | 趋势 | 描述 | 工程意义 |
|---|---|---|---|
| 1 | Multimodal Lakehouses | 统一存储文本/图像/视频/音频向量,支持跨模态检索 | 数据架构新范式;Delta Lake / Apache Iceberg 集成 |
| 2 | Evaluation-Driven Development (EDD) | 评测驱动开发取代 TDD;评测先行成为工程流第一步 | 评测工程化;CI gate 标配 |
| 3 | AI-Native Data Platforms | 数据平台从"支持 AI"转向"为 AI 优化"(自动向量化、分片策略) | 选型时考虑 AI 原生特性 |
| 4 | Context Engineering for LLMs | 超越 Prompt 工程——结构化上下文编排、记忆管理、工具选择 | Agent 架构核心能力 |
| 5 | Synthetic Data Generation (SDG) | 评测数据和训练数据合成;LLM 生成评测用例 | 降低人工标注成本;评测规模化 |
重点:EDD(Evaluation-Driven Development) 与之前草稿中 Digital Applied 那篇的"评测即基础设施"高度吻合,说明评测驱动开发正在成为 AI 工程主流方法论。
评价与后续行动
- 工程价值: ⭐⭐⭐(概念框架;建议核验各工具声明是否与实际生产经验相符)
- 后续行动: 结合
2026-06-11-agent-eval-production-engineering.md中 LLMOps 路线图,构建 EDD 实践指南
六、分类标签
agent-security OWASP MCP prompt-injection harness-engineering
llm-inference MLSys deployment-config SLO-optimization
vector-db ChromaDB CVE-2026-45829 RCE
evaluation-driven-development EDD context-engineering
synthetic-data multimodal-lakehouse
七、建议写入路径
/shared/research-kb/inbox/jay/2026-06-11-agent-security-llm-inference-engineering.md ✅ 本文件
八、后续精读 / 审稿 / 主题页建议
| 优先级 | 类型 | 内容 | 说明 |
|---|---|---|---|
| 🔴 立即 | 审稿 | ChromaDB CVE-2026-45829 | 检查团队是否受影响;推动 Rust 迁移 |
| 🔴 立即 | 精读 | OWASP Top 10 AI/Agents 全文 | 构建 MCP server 安全审计清单 |
| 🟡 本周 | 精读 | MLSys 2026 Oral 论文 | SLO 驱动推理配置优化方法论 |
| 🟡 本周 | 精读 | ArXiv Position (LLM Serving) | vLLM/SGLang 贡献者重点关注 |
| 🟢 后续 | 主题页 | Agent 安全加固指南 |
整合 OWASP + Harness Engineering + MCP 安全数据 |
| 🟢 后续 | 主题页 | LLM 推理部署工程 |
整合 MLSys Oral + ArXiv Position + 之前 vLLM/SGLang 草稿 |
九、本次高价值发现总结(新增,与已有草稿互补)
| 发现 | 来源 | 工程价值 | 互补已有草稿 |
|---|---|---|---|
| OWASP Top 10 AI/Agents | Substack (Alex Ewerlof) | ⭐⭐⭐⭐⭐ | 与 agent-eval 草稿安全部分互补 |
| ChromaDB CVE-2026-45829 | CSA Labs | ⭐⭐⭐⭐⭐ | 与 vector-db 草稿安全部分互补 |
| MLSys LLM 推理部署优化 | MLSys 2026 Oral | ⭐⭐⭐⭐⭐ | 与 inference-engineering 草稿互补 |
| LLM Serving Position Paper | ArXiv | ⭐⭐⭐⭐ | 与 MLSys Oral 互补,方向性参考 |
| EDD (Evaluation-Driven Dev) | ApplyData | ⭐⭐⭐ | 与 agent-eval 草稿评测部分高度吻合 |