Agent runtime / security / harness 补充候选

可复用信息

1. Agent Harness Engineering: A Survey
- 来源：OpenReview PDF
- 链接：https://openreview.net/pdf/f358711a95aaaf61fdeffd4ef3fc60fba9b8da57.pdf
- 核心观点：Agent 长任务可靠性越来越取决于 execution harness：上下文构造、工具接口、middleware、反馈注入、约束、验证与 sandbox。
- 可信度：中高；需核验具体 benchmark 引用（Terminal-Bench、Sandbox-EscapeBench 等）。
- 分类：agent harness-engineering security runtime
- 建议：强烈建议补位。今日 Agent 覆盖多，但对 harness / runtime security 的严肃审稿不足。
1. Natural-Language Agent Harnesses（arXiv:2603.25723）