序：写给构建 Agent 的人

如果你正在构建一个 AI Agent——或者正在认真考虑——这个系列是为你写的。

过去几个月我从零开始构建了一个 Agent 运行时基础设施。撞了很多墙，做了一些事后看来还算对的选择，也留下了一堆至今没解决的问题。这个系列就是把这些东西摊开来聊。没有推销，就是设计笔记。

起点是一道算术题。一个 30 步的 Agent，每步 90% 成功率，端到端只有 4.2%。这个数字逼着我去面对一个事实：Agent 挂掉，大多数时候不是模型不够聪明，而是围绕模型的那层基础设施撑不住。

然后我发现，我遇到的问题——资源有限怎么管、输入不可信怎么防、多个任务怎么协调、出了故障怎么恢复——五十年前的操作系统设计者全都处理过。

十余篇文章，一条线索：

为什么 → 上下文 → 安全 → 工具 → 架构 → 治理 → 长任务 → 会话 → 可观测 → 产品 → 协作 → 前沿

每篇都能独立看懂，不必从头读到尾。但按顺序读完会拼出一张相对完整的图——关于 Agent 从 demo 走向生产，中间到底隔着什么。

每篇我都写了还没解决的问题，有些甚至还没想清楚方向。这个领域每三个月就换一轮范式，我没有装作什么都想明白了的底气。

第一篇：《为什么 Agent 需要一个操作系统》

序：写给构建 Agent 的人 ​