为什么只看调用量,会让 AI 项目越做越焦虑
AI 项目刚上线时,最容易拿到的数据就是调用次数、活跃用户、token 消耗。它们很直观,也很方便汇报。但问题是,这些数字只说明系统被触发了,不说明用户真的解决了问题。
很多团队在“调用量增长”里获得了安全感,三个月后却发现转化没提升、工单没下降、交付速度也没改善。不是模型没能力,而是 KPI 从一开始就没有对准业务价值。
先把 AI 指标拆成三层
第一层:使用层(系统有没有被用)
看调用量、DAU、会话时长、重试率。它回答的是“大家有没有在用”。
第二层:结果层(输出有没有被采纳)
看采纳率、二次编辑率、人工回退率、一次通过率。它回答的是“AI 结果有没有真的帮上忙”。
第三层:业务层(组织有没有变好)
看工单处理时长、线索转化率、内容产能、客户满意度。它回答的是“这件事值不值得继续投”。
一张能在两周内搭起来的 AI 看板
- 左侧放使用层:调用量、活跃用户、错误率。
- 中间放结果层:采纳率、人工重写比例、版本回退次数。
- 右侧放业务层:时间节省、收入贡献、投诉变化。
- 每个指标都写清责任人和更新频率。
- 每周评审只回答一个问题:哪些指标提升了,为什么。
真正该追的不是“更忙”,而是“更有效”
AI 指标体系最容易犯的错,是把系统繁忙度当成业务成果。你真正要追的,不是“这周调了多少次”,而是“这周少返工了多少、少等待了多少、客户多满意了多少”。
能证明 AI 被使用,只是开始。能证明 AI 让业务变好,才是项目成立的证据。