AI 智能体如何从失败中学习与提升

失败即信息

当 AI 智能体尝试完成任务并失败时,失败本身蕴含有价值的信息。API 返回 429(限流),提示智能体应放慢节奏;模型生成了无效 JSON,提示应增加格式校验;预期路径上未找到文件,提示应在操作前先验证路径。

把失败当作可丢弃事件的智能体,会反复犯同样的错;能捕获并从失败中学习的智能体,可靠性会逐步提升。区别在于,失败是否被记录到智能体日后可参照之处。

并非所有失败等价,智能体的回应应取决于失败类型。瞬时失败(网络超时、限流、临时服务中断)应触发带退避的重试;永久失败(凭据无效、权限缺失、不支持的操作)应触发换路径或上报;逻辑失败(智能体的计划本身错了,而非执行错)应触发重新规划。

分类至关重要,因为对失败的错误回应只会让事情变糟。对永久失败重试是浪费时间;在瞬时失败后重新规划会浪费一份本可继续执行的好计划;对瞬时失败上报又会无谓地打扰人类。

最有效的范式是把失败以可检索的形式存下:尝试了什么、出了什么问题、根因是什么、最终是什么方案奏效。在着手任务前,智能体先在该知识库中检索类似过往失败,据此调整自己的方法。

"上次以超过 1MB 的负载调用此 API 时超时,解决办法是分批切小再请求。"——若这条经验已存在于智能体的记忆系统中,它便能在面对大负载时主动分批,而不必再次失败后才摸索出绕行方法。

来自人类对智能体失败的反馈尤为珍贵,因为它能给出智能体自己难以查明的"为什么"。"这次失败是因为我们的预发环境需要 VPN 接入"——这是智能体仅靠试错无从发现的上下文。把这类反馈采集下来,提供给智能体用于未来任务,便能闭合学习回路。

部分智能体框架内置了反馈机制,允许用户对失败任务进行批注。这些批注会成为智能体长期记忆的一部分,改善其未来在类似情形下的处理。

智能体也可能从失败中学到错误的教训。如果某次 API 调用因临时问题失败,智能体不应永久回避该 API。失败知识需要带有效期或置信度。"这个 API 三个月前不太稳定"的相关性,远低于"这个 API 五分钟前刚失败"。