序:写给构建 Agent 的人
如果你正在构建一个 AI Agent——或者正在认真考虑——这个系列是为你写的。
过去几个月我从零开始构建了一个 Agent 运行时基础设施。撞了很多墙,做了一些事后看来还算对的选择,也留下了一堆至今没解决的问题。这个系列就是把这些东西摊开来聊。没有推销,就是设计笔记。
起点是一道算术题。一个 30 步的 Agent,每步 90% 成功率,端到端只有 4.2%。这个数字逼着我去面对一个事实:Agent 挂掉,大多数时候不是模型不够聪明,而是围绕模型的那层基础设施撑不住。
然后我发现,我遇到的问题——资源有限怎么管、输入不可信怎么防、多个任务怎么协调、出了故障怎么恢复——五十年前的操作系统设计者全都处理过。
十余篇文章,一条线索:
为什么 → 上下文 → 安全 → 工具 → 架构 → 治理 → 长任务 → 会话 → 可观测 → 产品 → 协作 → 前沿
每篇都能独立看懂,不必从头读到尾。但按顺序读完会拼出一张相对完整的图——关于 Agent 从 demo 走向生产,中间到底隔着什么。
每篇我都写了还没解决的问题,有些甚至还没想清楚方向。这个领域每三个月就换一轮范式,我没有装作什么都想明白了的底气。
第一篇:《为什么 Agent 需要一个操作系统》