从聊天机器人到执行系统
普通聊天机器人只负责生成答案,Agent 则会影响真实系统:查询数据库、创建工单、修改配置、发送邮件、提交代码。能力越强,风险也越高。一个“自动完成任务”的功能,如果没有权限分级和执行审计,很快会变成没人敢授权的黑盒。
生产级 Agent 必须把任务拆成可观察的步骤:计划是什么,调用了哪个工具,参数从哪里来,返回了什么,是否重试,是否需要人工确认。否则,一旦结果不符合预期,团队只能从最终输出倒推原因,排查成本非常高。
责任边界怎么设计
读写分离
读操作可以更自动,写入、删除、发布、付款等动作必须显式确认。
工具白名单
模型只能调用后端暴露的有限工具,参数由后端校验和补全。
失败可恢复
长任务要支持暂停、重试、回滚和人工接管,避免一步错步步错。
Agent 的护城河是系统工程
很多团队低估了 Agent 的工程量。提示词只是上层界面,真正复杂的是工具协议、状态机、权限、日志、队列、幂等、告警和用户体验。能稳定执行 100 次,比演示时成功 1 次更有价值。
清风笔记的判断:Agent 不会消失,但会从“万能自动化”回到“受控任务系统”。谁能把边界、日志和审批做扎实,谁才更接近生产价值。