Skip to content

企业 Agent 设计检查表

这张表用来评审一个企业 Agent 方案是否具备上线基础。

它不检查“模型够不够聪明”,而检查系统边界是否清楚。

1. 任务边界

检查项通过标准
是否定义了目标用户能说清楚是员工、主管、HR、财务还是其他角色
是否定义了核心任务能列出最常见的 5-10 个用户任务
是否区分问答、查询、引导、自动化不把所有需求都塞进一个聊天入口
是否定义不做什么高风险或无权限场景有明确拒绝策略

2. 权限与数据

检查项通过标准
用户身份是否来自可信上下文不依赖模型理解“我是谁”
数据查询是否强制带用户或组织范围查询层必须注入过滤条件
数据库是否有二次保护RLS 或等价机制限制行级可见性
知识库是否有元数据权限文档 chunk 带角色、地区、部门、版本
是否控制回答粒度不同角色看到不同明细程度

3. 知识库与引用

检查项通过标准
文档是否按业务语义切分不只按固定长度切 chunk
是否处理版本和生效时间过期制度不会参与回答
检索是否在权限过滤后发生无权内容不会进入 LLM 上下文
答案是否带引用能追到文档、章节、版本和 chunk
引用是否经过校验引用必须来自本次允许候选集

4. 工具与流程

检查项通过标准
工具是否分风险等级只读、草稿、写入分开处理
写操作是否必须确认提交、撤回、审批前进入 Human-in-the-Loop(HITL)
确认票据是否冻结参数用户确认的内容不能被悄悄修改
是否有幂等键重试不会重复创建业务流程
是否定义补偿策略知道哪些动作可撤回、可补偿、不可逆

5. 规划与状态

检查项通过标准
Planner 是否输出结构化步骤每步有输入、输出、依赖和失败处理
缺字段是否进入澄清不让模型猜日期、金额、对象等关键字段
澄清后是否能恢复任务用户补充信息后继续原计划
流程状态是否持久化能知道任务在草稿、确认、提交还是失败状态

6. 生产化

检查项通过标准
是否有 trace_id / session_id能串起完整执行链路
是否记录检索和引用能解释答案依据
是否记录工具调用和确认能追踪真实副作用
是否有模型路由策略不同任务用不同模型
是否有降级策略模型或工具失败时能安全停止或降级

最小上线线

如果只能选最关键的上线前检查,至少要过这六条:

  1. 用户身份来自可信登录态;
  2. 检索和 SQL 查询都在执行前做权限过滤;
  3. 高风险写操作必须 Human-in-the-Loop(HITL);
  4. 所有工具调用都有审计记录;
  5. 流程写入有幂等键;
  6. 答案能追溯到数据源或明确说明无法确定。

少任何一条,都不建议把 Agent 接到真实企业系统。

下一步可用模板

如果检查表发现项目边界还不清楚,可以继续使用这三份材料: