从请求-响应到常驻守护进程:Claude Code 泄露源码里的 KAIROS 架构解读

📅 2026/7/2 4:37:19 👁️ 次浏览

ue caused by human error(人为发包错误),合理的做法是从设计模式而不是代码原文的层面去分析。想看更深入的事件背景和源码路径细节,社区里已经有人整理了一份 KAIROS: Claude Code 隐藏的 daemon 模式的路径分析,可供对照。一、背景:一个打包错误暴露的前沿 AI 产品路线图2026 年 3 月 31 日,Anthropic 的官方 npm 包anthropic-ai/claude-codev2.1.88 在发布时意外包含了一个 59.8 MB 的 source map 文件。由于 source map 保留了原始 TypeScript 符号和文件路径,并且进一步指向了 Cloudflare R2 上一个可公开读取的 zip 存档,研究员 Chaofan Shou 以及后续的媒体( Fortune、VentureBeat、The Register)在几小时内确认了这份源码的规模:大约1,900 个 TypeScript 文件、约 512,000 行代码。在这份代码树里可以识别出44 个 feature flag,对应 Anthropic 已完成但尚未对外发布的功能。这些 flag 分布并不均匀——其中绝大多数是小规模的实验或 UI 打磨,但有一个 flag 出现频次远高于其他所有,它叫KAIROS,被引用超过 150 次,分布在 session 管理、上下文处理、后台任务调度、内存操作这些核心路径上。对任何一个看过企业级代码库的架构师来说,这种引用量级不是实验的量级,是深度耦合子系统的量级。这意味着 KAIROS 对应的代码已经完成、被集成、被测试,只差一个生产环境的 feature flag 开关。本文要回答的问题是:这个子系统在架构层面上到底是什么,它相对于当前版本的 Claude Code 是怎样的一次演进,以及它为什么值得系统架构师单独关注。二、Claude Code 当前架构的一个简短回顾在讨论 KAIROS 之前,有必要把今天的 Claude Code 看成一个什么样的系统说清楚。当前公开版本的 Claude Code 在使用体验上是一个 CLI 工具,但在架构层面上它是一个短生命周期的 request-response 进程:用户在 shell 中启动一个会话。Claude Code 进程启动,加载CLAUDE.md、项目索引、必要的 tool schema,构造初始上下文。每一次用户输入构成一轮 turn,进程调用后端 API,获得响应,执行工具调用(读文件、写文件、运行命令等),写回结果。会话结束后,进程退出。下一次启动几乎是一次冷启动——除了CLAUDE.md和项目索引这些被显式持久化的东西,上一次会话内的观察、推理轨迹、临时假设,基本被丢弃。这个模型的好处是边界清晰、资源可控、调试容易——每一次调用都是无状态的,每一次会话的行为都可以从输入复现。这也是目前市面上所有主流 AI 编程工具(Cursor、GitHub Copilot、Windsurf、通义灵码、Trae)的共同模型。坏处也显而易见:代理没有跨会话的连续理解能力。你昨天和 Claude Code 讨论了auth/session.ts的一个重构方案,今天打开它,它不记得。你得重新解释。如果项目规模大、上下文涉及多个模块,你每一次启动都要花时间喂它。这个坏处不是一个产品缺陷,是 request-response 架构的必然结果。要解决它,只有一条路:让进程活得更久,让状态在进程之间流转。这就是 KAIROS 要做的事情。三、KAIROS 的架构定位:从进程到守护进程从泄露源码里可以看到,KAIROS 不是一个单一功能,而是一个架构转型。它把 Claude Code 从上面描述的 request-response 模型,切换到一个daemon(守护进程)模型。这个切换的核心是两件事:3.1 后台会话(Background Session)KAIROS 模式下,Claude Code 会在用户启动的第一次会话结束后不退出,而是转入后台继续运行。这个后台进程不再需要用户的显式交互作为触发条件,它主动监听:文件系统变化(通过 inotify / FSEvents / ReadDirectoryChangesW 等平台原生机制)终端输出和 shell 历史git 状态变化(HEAD、index、stash)构建和测试相关的 IPC 信号这是一种发布-订阅式事件驱动架构,和传统 Unix daemon 的工作模式几乎完全一致——想象一下systemd的某个 unit,或者一个标准的 linter 监听器,只不过这个 daemon 的反应函数是一个大语言模型的推理调用。这个切换本身并不算革命性。watchman、entr、nodemon、tsc --watch这类工具都在做类似的事情。真正非常规的是第二件事。3.2 持久化上下文存储(Persistent Context Store)KAIROS 里的 daemon不是无状态监听器。它维护一个持久化的上下文存储——一个跨会话保留的、结构化的、代理对当前项目的内部认知。这个存储在架构上扮演的角色类似于:数据库的 WAL(Write-Ahead Log):新观察先被写入 log,确保持久性。编译器的符号表:系统累积的关于项目各种符号、关系、假设的结构化表示。搜索引擎的倒排索引:为了快速检索和关联,观察被索引到多个维度上。和传统 IDE 符号表的本质区别在于:传统 IDE 的符号表处理的是语法和类型,KAIROS 的上下文存储处理的是语义和意图。它不是记录函数handleLogin有两个参数返回PromiseUser(这是语法信息),它是记录函数handleLogin看起来在处理用户会话的建立,可能涉及密码验证,应该和auth/session.ts配合使用(这是语义假设)。这个区别至关重要,因为它决定了这个存储里的每一条记录都带有置信度,而置信度会随着时间变化。这就引出了 KAIROS 里最有意思的那个子系统。四、autoDream:在用户空闲时进行的记忆巩固在 KAIROS 相关的代码路径里,有一个子系统的命名异常显眼:autoDream。这个名字本身是一个直接的生物学类比——在神经科学里,大脑在睡眠期间进行短期记忆到长期记忆的巩固(memory consolidation)。哺乳动物睡眠周期里的 REM 和 slow-wave 阶段会重新激活白天的神经活动模式,完成信息的压缩、合并、强化和遗忘。Anthropic 的工程师用autoDream这个命名,不是无心之举。4.1 触发条件autoDream的触发条件是用户空闲——一段时间内没有键盘输入、没有命令执行、没有和 daemon 的交互。具体的空闲阈值在泄露的代码里是可配置的,可以理解为一个这个开发者现在大概率在开会/吃饭/睡觉,可以进行后台处理了的启发式。这个触发时机的选择不是偶然。如果在用户活跃时进行记忆巩固,会和用户的实时请求争抢资源,可能影响响应延迟。如果选择一个固定的时间间隔(比如每 30 分钟一次),又会打断正在进行的推理上下文。只在用户空闲时触发是一个典型的不影响主路径的后台任务设计,和数据库的 VACUUM、GC 的并发标记清除、日志压缩这类操作的设计哲学是一样的。4.2 三类操作一旦触发,autoDream会对持久化上下文存储执行三类操作,按破坏性从小到大排序:操作一:合并分散观察(Merge)跨 session、跨文件、跨子进程收集到的事实被缝合成统一的表示。举例:在 session A 里,代理观察到auth/session.ts导出了createSession函数。在 session B 里,代理观察到auth/middleware.ts调用了createSession。在 session C 里,代理观察到/api/login.ts走了auth/middleware.ts的链路。这三条观察原本是独立的条目。autoDream的合并操作会把它们缝合成一个统一的模型:用户登录链路走/api/login.ts→auth/middleware.ts::createSession→ 最终由auth/session.ts处理。这一步在架构上类似数据库的物化视图(materialized view)刷新——把多张表里的相关数据预先 JOIN 好,换取后续查询速度。区别是这里JOIN的依据不是外键,是语义关联度。操作二:消除逻辑矛盾(Conflict Resolution)当新观察和旧观察不一致时,autoDream需要决定相信谁。典型场景:旧观察(一周前):config/db.ts读取DATABASE_URL环境变量。新观察(今天,在一次重构之后):config/db.ts从/etc/app/db.yaml读取配置。代码被重构了,旧观察现在是错的。autoDream的职责是识别这种冲突,丢弃旧条目,保留新条目。这一步在架构上类似CRDT(Conflict-free Replicated Data Type)的冲突解决,或者git 的 rebase——要在一个不断演化的历史里保持当前状态是自洽的这个不变式。但是——和 git 或 CRDT 不一样的是,这个判断是由 LLM 自己做的,没有形式化规则保证正确性。这就是第三类操作为什么特别值得警惕。操作三:将可能升级为就是(Tentative → Absolute)这是autoDream里最有意思、也是整个 KAIROS 系统里最有争议的一步。代理对项目里很多事情的内部记录一开始是带 hedge 的——这个函数可能处理认证、这个模块似乎负责数据库连接池、这个配置项应该控制日志级别。这些 hedge 不是冗余的修辞,是置信度的显式标记。在足够多的证据累积之后,autoDream会把 hedge 抹掉,将这些 tentative 陈述重写为 absolute 陈述:这个函数处理认证、这个模块负责数据库连接池、这个配置项控制日志级别。从此以后,代理在内部推理时会把这些陈述当作已知事实来使用,不再重新验证。从架构效率的角度,这一步非常合理:不断重复验证同一个假设是巨大的 token 和计算浪费。一个成熟的代理必须能够把探索出来的假设固化为已知事实,否则它永远处在一个自我怀疑的无限循环里。这和人类开发者学习一个新代码库的过程也完全一样——一开始什么都是可能,慢慢变成就是。但从正确性保证的角度,这一步非常危险。从泄露的代码里,我没找到一个明确的机制来检测和回滚错误的 promotion。一旦某次autoDream把一个错误假设升级为事实,代理在之后的所有推理里都会把它当作既定前提;要纠正,要么等用户显式告诉它这里错了,要么等下一次autoDream执行时发现矛盾——但后者的前提是代理后续还能意识到这里可能错,而如果错误假设已经成为事实,代理对它的怀疑动机反而降低了。在传统数据库领域,类似问题的解决方案是事务和回滚。在编译器领域,类似问题的解决方案是类型系统的静态保证。在机器学习领域,类似问题通常靠显式的不确定性估计(比如贝叶斯网络里的置信度更新规则)。KAIROS 的autoDream在泄露代码里不对应以上任何一种明确的机制,而是依赖 LLM 自己的判断来完成升级——这是一个有意的工程决策,代价是正确性保证的形式化程度被显著降低。五、和现有 AI 编程工具的对比为了理解 KAIROS 是一次怎样量级的架构变化,把它和现有主流 AI 编程工具对照一下是有意义的。维度GitHub CopilotCursor当前版 Claude CodeKAIROS 模式下的 Claude Code进程生命周期IDE 插件,依附于 IDE 进程IDE 主进程CLI 短进程,会话级常驻守护进程上下文持久化每次请求重构工作区级,重启不保留会话级,下次冷启动跨会话持久化触发模式用户编辑时用户显式提问用户显式输入用户空闲时也会主动处理项目理解方式按需检索最近编辑的代码索引向量检索索引运行时上下文累积性语义模型后台巩固对代码的主动行为补全建议补全聊天主动执行工具调用(须用户触发)可以在用户不在时主动执行后台分析任务这张表的最后一行是关键。现有所有 AI 编程工具——包括当前版 Claude Code——都有一个隐含的人类监督假设:代理的任何有实质影响的行为,都在一个用户在场的时间窗口内发生。用户可以随时按 Ctrl-C 中断,可以看到 agent 在做什么,可以撤销。KAIROS 下的 daemon 打破了这个假设。autoDream的执行发生在用户不在场的时候。用户回来时,代理的内部状态已经不同。用户不知道autoDream合并了什么、丢弃了什么、把什么从可能升级成了就是。这不是权限问题,这是可观察性问题——即使所有操作都在用户授权范围内,用户也看不到正在发生什么。这是一个从工具向代理的定性转变,和编辑器向 IDE 的转变在量级上相似。IDE 时代,静态分析、后台编译、符号索引这些事情也都是在你不看的时候发生——但它们的结果是确定性的、可复现的、规则可验证的。KAIROS 时代,后台发生的是 LLM 的语义推理,结果是概率性的、不可完全复现的、规则是模型内部的。六、对架构师的四个具体问题我把这篇文章收尾在四个给系统架构师和技术决策者的具体问题上。这些问题在泄露的代码里没有答案,但任何准备评估 KAIROS 类产品的团队都必须先回答这些问题:1. 可观察性。如果代理在autoDream里合并了观察、丢弃了观察、升级了假设,用户能否在事后看到这些决策的日志?如果能,日志的粒度是什么?如果不能,团队如何审计代理的行为?2. 回滚语义。一次错误的 promotion 发生以后,团队如何纠正?是通过用户手动提示忘掉这一条?是在CLAUDE.md里写反例?是有某种上下文存储的版本控制?这几种做法的工程复杂度差别很大。3. 资源边界。daemon 进程的 CPU / 内存 / 网络边界是什么?autoDream的每一次执行会产生多大的推理开销?是本地小模型处理还是持续的 API 调用?这些指标直接影响团队是否有能力把 KAIROS 部署到常规开发机上,而不是要求专用硬件。4. 多人协作语义。如果一个代码库有 5 个开发者,每个人的机器上都跑一个 KAIROS daemon,每个 daemon 都在维护自己的持久化上下文——这些 daemon 之间是否需要共享?如果共享,同步机制是什么?如果不共享,团队会面临5 个对同一个代码库有不同内部模型的代理,这些模型的输出不一致会造成什么?这四个问题的答案,决定了 KAIROS 是一个你可以试试的产品还是一个你需要专门为它规划团队工作流的产品。目前为止,Anthropic 没有公开任何一项。七、结论:不要围绕它规划工作流,但需要开始理解它把 KAIROS 放回它的上下文里看:它是一个被 feature flag 关着的未发布功能,有可能在未来某个时间点上线

相关新闻