<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>成本控制 on Saiga</title>
    <link>http://localhost:1313/tags/%E6%88%90%E6%9C%AC%E6%8E%A7%E5%88%B6/</link>
    <description>Recent content in 成本控制 on Saiga</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <managingEditor>wuwenzen@outlook.com (wuwj)</managingEditor>
    <webMaster>wuwenzen@outlook.com (wuwj)</webMaster>
    <lastBuildDate>Mon, 10 Nov 2025 00:00:00 +0000</lastBuildDate>
    <atom:link href="http://localhost:1313/tags/%E6%88%90%E6%9C%AC%E6%8E%A7%E5%88%B6/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>复杂系统引入 AI 的工程治理：分级、成本与回退策略</title>
      <link>http://localhost:1313/posts/2025-11-10-ai-governance-in-complex-systems-1/</link>
      <pubDate>Mon, 10 Nov 2025 00:00:00 +0000</pubDate><author>wuwenzen@outlook.com (wuwj)</author>
      <guid>http://localhost:1313/posts/2025-11-10-ai-governance-in-complex-systems-1/</guid>
      <description>&lt;h2 id=&#34;背景&#34;&gt;背景&lt;/h2&gt;&#xA;&lt;p&gt;复杂系统引入 AI 的最大风险并非“效果不够好”，而是：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;输出不稳定导致体验波动&lt;/li&gt;&#xA;&lt;li&gt;依赖链拉长导致线上不确定性上升&lt;/li&gt;&#xA;&lt;li&gt;成本不可控（调用量与 token 消耗）&lt;/li&gt;&#xA;&lt;li&gt;缺乏回退机制导致事故扩大&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;因此需要把 AI 当成一种“工程能力模块”，纳入治理体系。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1-能力分级先决定用不用用在哪&#34;&gt;1. 能力分级：先决定“用不用、用在哪”&lt;/h2&gt;&#xA;&lt;p&gt;建议按风险把场景分三档：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;低风险：内容摘要、帮助说明、检索辅助&lt;/li&gt;&#xA;&lt;li&gt;中风险：规则解释、提示文案优化（基于结构化事实）&lt;/li&gt;&#xA;&lt;li&gt;高风险：核心决策、资金/权限相关结论（原则上禁用）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;分级不是文档，而是要落到开关与权限策略上：不同页面/角色可启用不同能力。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;2-统一接入层把不确定性收敛到一个地方&#34;&gt;2. 统一接入层：把不确定性收敛到一个地方&lt;/h2&gt;&#xA;&lt;p&gt;建议统一封装 AI 调用：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;超时控制（避免卡住主流程）&lt;/li&gt;&#xA;&lt;li&gt;限流与预算（按用户/模块/时间窗）&lt;/li&gt;&#xA;&lt;li&gt;缓存（相同输入复用输出）&lt;/li&gt;&#xA;&lt;li&gt;降级（失败回退到规则/模板）&lt;/li&gt;&#xA;&lt;li&gt;日志（输入与输出脱敏存档）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;统一接入层的目标：即使换模型/换供应商，业务层也不需要大改。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;3-输出约束从自由生成到受限生成&#34;&gt;3. 输出约束：从“自由生成”到“受限生成”&lt;/h2&gt;&#xA;&lt;p&gt;工程可控的关键：让 AI 输出处在可验证范围内。常用手段：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;结构化输入：只给事实与允许的选项&lt;/li&gt;&#xA;&lt;li&gt;格式约束：JSON/固定段落结构&lt;/li&gt;&#xA;&lt;li&gt;词库治理：术语表、短语库、禁用词&lt;/li&gt;&#xA;&lt;li&gt;校验失败回退：不通过就不展示 AI 结果&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;4-成本治理把-ai-当成一种资源&#34;&gt;4. 成本治理：把 AI 当成一种资源&lt;/h2&gt;&#xA;&lt;p&gt;建议建立三层成本控制：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;业务层：只在“确实节省成本/提升体验”的场景使用&lt;/li&gt;&#xA;&lt;li&gt;工程层：缓存、去重、减少重复调用&lt;/li&gt;&#xA;&lt;li&gt;策略层：按模块预算、按角色限额、按时间窗限流&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;成本控制做得好，AI 才能长期运行，而不是“试点一阵就下线”。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;5-回退策略可用性比智能更重要&#34;&gt;5. 回退策略：可用性比智能更重要&lt;/h2&gt;&#xA;&lt;p&gt;回退策略建议至少包含：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;单次失败回退：本次调用失败 -&amp;gt; 使用模板/规则结果&lt;/li&gt;&#xA;&lt;li&gt;全局开关回退：线上异常 -&amp;gt; 一键关闭 AI 能力&lt;/li&gt;&#xA;&lt;li&gt;体验回退：低置信度 -&amp;gt; 优先展示引用与原始结果&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;原则：AI 只能增强，不得成为唯一依赖。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;总结&#34;&gt;总结&lt;/h2&gt;&#xA;&lt;p&gt;复杂系统引入 AI 的正确打开方式是“工程化治理”：&lt;/p&gt;</description>
    </item>
    <item>
      <title>复杂系统引入 AI 的工程治理：分级、成本与回退策略</title>
      <link>http://localhost:1313/posts/2025-11-10-ai-governance-in-complex-systems/</link>
      <pubDate>Mon, 10 Nov 2025 00:00:00 +0000</pubDate><author>wuwenzen@outlook.com (wuwj)</author>
      <guid>http://localhost:1313/posts/2025-11-10-ai-governance-in-complex-systems/</guid>
      <description>&lt;h2 id=&#34;一句话&#34;&gt;一句话&lt;/h2&gt;&#xA;&lt;p&gt;AI 可以当“外挂”，别当“方向盘”。&lt;br&gt;&#xA;治理的目标：&lt;strong&gt;让 AI 更像安全带，而不是赌运气。&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;1先分级3-档够用&#34;&gt;1）先分级：3 档够用&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;低风险：摘要/帮助/检索&lt;br&gt;&#xA;→ 可用，但要能降级&lt;/li&gt;&#xA;&lt;li&gt;中风险：规则解释/提示润色（基于结构化事实）&lt;br&gt;&#xA;→ 只能做表达，不能做判断&lt;/li&gt;&#xA;&lt;li&gt;高风险：资金/权限/核心决策&lt;br&gt;&#xA;→ 原则上禁用（或强隔离+强审核）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;2统一接入层把不确定性关进盒子&#34;&gt;2）统一接入层：把“不确定性”关进盒子&lt;/h2&gt;&#xA;&lt;p&gt;统一入口做五件事：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;超时（别卡主流程）&lt;/li&gt;&#xA;&lt;li&gt;限流/预算（别一夜烧钱）&lt;/li&gt;&#xA;&lt;li&gt;缓存（同样问题别反复问）&lt;/li&gt;&#xA;&lt;li&gt;降级（失败走模板/规则）&lt;/li&gt;&#xA;&lt;li&gt;日志（脱敏记录，能追溯）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;3受限生成别让-ai-自由作文&#34;&gt;3）受限生成：别让 AI 自由作文&lt;/h2&gt;&#xA;&lt;p&gt;让输出可检查：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;固定格式（JSON/固定段落）&lt;/li&gt;&#xA;&lt;li&gt;必填字段（必须包含关键名词）&lt;/li&gt;&#xA;&lt;li&gt;禁用词（保证/承诺/一定）&lt;/li&gt;&#xA;&lt;li&gt;事实来源（规则码/文档 id）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;校验不过：&lt;strong&gt;直接不用 AI 结果&lt;/strong&gt;。&lt;/p&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;4成本治理ai-也是资源&#34;&gt;4）成本治理：AI 也是资源&lt;/h2&gt;&#xA;&lt;p&gt;最实用三条：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;只在“真有收益”的场景用&lt;/li&gt;&#xA;&lt;li&gt;缓存 + 去重（省钱又稳定）&lt;/li&gt;&#xA;&lt;li&gt;按模块设预算（超了就降级）&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;5回退永远要-plan-b&#34;&gt;5）回退：永远要 Plan B&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;单次回退：这次失败 -&amp;gt; 模板&lt;/li&gt;&#xA;&lt;li&gt;全局回退：异常 -&amp;gt; 一键关开关&lt;/li&gt;&#xA;&lt;li&gt;体验回退：置信度低 -&amp;gt; 少说话，多给引用&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;hr&gt;&#xA;&lt;h2 id=&#34;结尾上生产前检查表&#34;&gt;结尾：上生产前检查表&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;input disabled=&#34;&#34; type=&#34;checkbox&#34;&gt; 分级清楚&lt;/li&gt;&#xA;&lt;li&gt;&lt;input disabled=&#34;&#34; type=&#34;checkbox&#34;&gt; 统一入口&lt;/li&gt;&#xA;&lt;li&gt;&lt;input disabled=&#34;&#34; type=&#34;checkbox&#34;&gt; 受限输出 + 校验&lt;/li&gt;&#xA;&lt;li&gt;&lt;input disabled=&#34;&#34; type=&#34;checkbox&#34;&gt; 一键回退&lt;/li&gt;&#xA;&lt;li&gt;&lt;input disabled=&#34;&#34; type=&#34;checkbox&#34;&gt; 样例评测集&lt;/li&gt;&#xA;&lt;/ul&gt;</description>
    </item>
  </channel>
</rss>
