Skip to content

序:写给构建 Agent 的人

如果你正在构建一个 AI Agent——或者正在认真考虑——这个系列是为你写的。

过去几个月我从零开始构建了一个 Agent 运行时基础设施。撞了很多墙,做了一些事后看来还算对的选择,也留下了一堆至今没解决的问题。这个系列就是把这些东西摊开来聊。没有推销,就是设计笔记。

起点是一道算术题。一个 30 步的 Agent,每步 90% 成功率,端到端只有 4.2%。这个数字逼着我去面对一个事实:Agent 挂掉,大多数时候不是模型不够聪明,而是围绕模型的那层基础设施撑不住。

然后我发现,我遇到的问题——资源有限怎么管、输入不可信怎么防、多个任务怎么协调、出了故障怎么恢复——五十年前的操作系统设计者全都处理过。

十余篇文章,一条线索:

为什么上下文安全工具架构治理长任务会话可观测产品协作前沿

每篇都能独立看懂,不必从头读到尾。但按顺序读完会拼出一张相对完整的图——关于 Agent 从 demo 走向生产,中间到底隔着什么。

每篇我都写了还没解决的问题,有些甚至还没想清楚方向。这个领域每三个月就换一轮范式,我没有装作什么都想明白了的底气。

第一篇:《为什么 Agent 需要一个操作系统》