№ 07·0307 · AI Agent 系统2 分钟 · 第 3 / 5 篇

7.3 Agent 生命周期

注册、授权、运行、监控、升级、暂停、退出;对齐模型治理、审计与第三方尽调常见问题清单。

更新于
7.3 · 生命周期

Agent 必须可识别、可约束、可升级、可吊销。

Agent 像员工账号与模型版本一样需要生命周期:谁能创建、谁能授权、运行中如何监控、出事故如何暂停、淘汰后数据如何处理。没有状态机就没有可信执行层,也无法向审计方解释「当时系统里到底有什么在跑」。

这页作用状态机 + 治理动作 + 审计应答
核心主题从 Registered 到 Retired 的全链路
阅读重点授权边界、暂停触发、升级管控

关键状态

Registered已在目录登记(名称、类型、默认模型、所有者节点、用途说明)。尚未接业务数据,相当于「账号已建、未开通权限」。
Authorized完成权限评审:数据域、工具白名单、每日调用上限、是否允许写外部系统。对应企业 IAM 中的 role binding。
Active在授权范围内执行任务并持续写结构化日志(输入摘要、输出哈希、工具调用、审批结果)。
Paused / Suspended触发条件示例:异常越权尝试、输出质量抽检连续失败、安全事件、合规禁令。暂停应可一键切断工具与外部回调。
Upgraded模型版本、prompt、工具或限额变更;须记录变更单号、审批人、生效时间与回滚包。对标 MLOps 与变更管理(如 ITIL)。
Retired业务下线或不达标淘汰;保留只读日志留存期,删除或匿名化训练用敏感字段(按政策)。

生命周期路径

注册 → 风险评估与授权 → 上线(Active)→ 持续监控与抽检 → 事件驱动暂停 → 变更升级(带审批)→ 退役与留存策略

准入
明确业务场景、数据分级、是否处理 PII/机密条款;禁止「先接进来再想办法」。
授权
最小权限:按 Agent 类型拆 API scope;敏感操作双人规则或人类在环(HITL)。
运行
SLA:延迟、错误率、幻觉类客诉标签;与 LangSmith 等可观测性工具同类指标,但结果要进 WCN 任务系统。
复核
定期抽检:同一输入多版本模型对比、红队提示样本、工具调用是否越界。
退出
退役 Agent 不得再出现在派发列表;历史输出仍可被 Proof 引用但标注模型版本。
生命周期设计目标:任何时刻都能回答——哪些 Agent 在跑、用什么模型、能访问什么、上次变更谁批的。

治理与风险管理框架(浓缩)

维度要点
所有权每个 Agent 有 owning 节点或平台责权人;运行事故先找 owner
变更生产变更走变更窗口与回滚;重大模型切换可要求并行灰度
数据训练/日志留存与跨境传输符合节点所在地与合同
安全密钥与工具凭据托管;禁止 Agent 持久持有用户明文密码
审计日志保留期 ≥ 业务争议追溯需求;支持导出给第三方尽调

没有暂停与退役能力,等于默许「僵尸 Agent」长期持有过期权限——这是数据泄露与合规处罚的常见来源。

与 AutoGPT 式「常开循环」的根本区别

自主循环默认无明确终点;WCN 生命周期把每次运行绑在任务与授权时效上。任务结束或授权到期 → Agent 调用应拒绝或进入只读,而非在后台继续「思考」。

向审计或 LP 解释时一句话:我们的 Agent 像受控批处理作业,不像不知疲倦的自动员工。