复杂系统引入 AI 的工程治理：分级、成本与回退策略

wuwenzen@outlook.com (wuwj) — Mon, 10 Nov 2025 00:00:00 +0000

背景

复杂系统引入 AI 的最大风险并非“效果不够好”，而是：

输出不稳定导致体验波动
依赖链拉长导致线上不确定性上升
成本不可控（调用量与 token 消耗）
缺乏回退机制导致事故扩大

因此需要把 AI 当成一种“工程能力模块”，纳入治理体系。

1. 能力分级：先决定“用不用、用在哪”

建议按风险把场景分三档：

低风险：内容摘要、帮助说明、检索辅助
中风险：规则解释、提示文案优化（基于结构化事实）
高风险：核心决策、资金/权限相关结论（原则上禁用）

分级不是文档，而是要落到开关与权限策略上：不同页面/角色可启用不同能力。

2. 统一接入层：把不确定性收敛到一个地方

建议统一封装 AI 调用：

超时控制（避免卡住主流程）
限流与预算（按用户/模块/时间窗）
缓存（相同输入复用输出）
降级（失败回退到规则/模板）
日志（输入与输出脱敏存档）

统一接入层的目标：即使换模型/换供应商，业务层也不需要大改。

3. 输出约束：从“自由生成”到“受限生成”

工程可控的关键：让 AI 输出处在可验证范围内。常用手段：

结构化输入：只给事实与允许的选项
格式约束：JSON/固定段落结构
词库治理：术语表、短语库、禁用词
校验失败回退：不通过就不展示 AI 结果

4. 成本治理：把 AI 当成一种资源

建议建立三层成本控制：

业务层：只在“确实节省成本/提升体验”的场景使用
工程层：缓存、去重、减少重复调用
策略层：按模块预算、按角色限额、按时间窗限流

成本控制做得好，AI 才能长期运行，而不是“试点一阵就下线”。

5. 回退策略：可用性比智能更重要

回退策略建议至少包含：

单次失败回退：本次调用失败 -> 使用模板/规则结果
全局开关回退：线上异常 -> 一键关闭 AI 能力
体验回退：低置信度 -> 优先展示引用与原始结果

原则：AI 只能增强，不得成为唯一依赖。

总结

复杂系统引入 AI 的正确打开方式是“工程化治理”：

复杂系统引入 AI 的工程治理：分级、成本与回退策略

wuwenzen@outlook.com (wuwj) — Mon, 10 Nov 2025 00:00:00 +0000

一句话

AI 可以当“外挂”，别当“方向盘”。
治理的目标：让 AI 更像安全带，而不是赌运气。

1）先分级：3 档够用

低风险：摘要/帮助/检索
→ 可用，但要能降级
中风险：规则解释/提示润色（基于结构化事实）
→ 只能做表达，不能做判断
高风险：资金/权限/核心决策
→ 原则上禁用（或强隔离+强审核）

2）统一接入层：把“不确定性”关进盒子

统一入口做五件事：

超时（别卡主流程）
限流/预算（别一夜烧钱）
缓存（同样问题别反复问）
降级（失败走模板/规则）
日志（脱敏记录，能追溯）

3）受限生成：别让 AI 自由作文

让输出可检查：

固定格式（JSON/固定段落）
必填字段（必须包含关键名词）
禁用词（保证/承诺/一定）
事实来源（规则码/文档 id）

校验不过：直接不用 AI 结果。

4）成本治理：AI 也是资源

最实用三条：

只在“真有收益”的场景用
缓存 + 去重（省钱又稳定）
按模块设预算（超了就降级）

5）回退：永远要 Plan B

单次回退：这次失败 -> 模板
全局回退：异常 -> 一键关开关
体验回退：置信度低 -> 少说话，多给引用

结尾：上生产前检查表

分级清楚
统一入口
受限输出 + 校验
一键回退
样例评测集

成本控制 on Saiga

复杂系统引入 AI 的工程治理：分级、成本与回退策略

背景

1. 能力分级：先决定“用不用、用在哪”

2. 统一接入层：把不确定性收敛到一个地方

3. 输出约束：从“自由生成”到“受限生成”

4. 成本治理：把 AI 当成一种资源

5. 回退策略：可用性比智能更重要

总结

复杂系统引入 AI 的工程治理：分级、成本与回退策略

一句话

1）先分级：3 档够用

2）统一接入层：把“不确定性”关进盒子

3）受限生成：别让 AI 自由作文

4）成本治理：AI 也是资源

5）回退：永远要 Plan B

结尾：上生产前检查表