

我們上個月接到一個客戶的緊急諮詢——他半年前花 80 萬導入了一套 AI 客服 SaaS,前 3 個月所有 KPI 都漂亮,CSAT 從 78 升到 86、首次解決率從 41% 升到 67%。第 4 個月開始所有指標悄悄回落、客訴提升、退款率多了 1.2%——但這些變化都在「正常波動」範圍裡,當下沒人警覺。第 6 個月 CFO 看月報才發現:「等等,這套 AI 客服好像越來越笨?」這就是經典的模型 drift——AI 客服上線那一刻效果最好,之後因為現實世界資料分佈、客戶問題分佈、語言用法都在變,模型表現會慢慢退化。
過去半年我們陪不同客戶評估 AI 客服 SaaS 的維運合約,發現八成以上的中小企業老闆對「drift」這件事零認知——以為「上線完就結案」、合約裡也沒寫 drift 監控與治理條款。AI 客服跟傳統客服軟體最大的差別就是——傳統軟體裝完就不會自己變笨、AI 客服會。這不是廠商品質問題,是 AI 系統的物理特性。沒有監控與治理框架,等到第 6 個月發現變笨,已經錯失最佳介入時機 4-5 個月。
這篇要把 AI 客服模型 drift 這件事講清楚——3 種主流 drift 類型(data drift、concept drift、prompt drift)、5 個你必須裝的監控指標、4 條跟 AI 客服供應商必須寫進合約的 SLA 條款,給中小企業老闆一張 AI 客服維運的完整避坑手冊。先給結論:Stanford HAI 2025 AI Index Report揭露的數據是——客服場景 AI 模型在上線後 6 個月平均效能會下降 12-18%,但只有 23% 的企業有監控機制能在前 60 天偵測到。換句話說,77% 的企業是「上線後就變笨還不知道」的狀態。
先把 drift 名詞講清楚:data / concept / prompt 三種類型不能混淆
「AI 變笨了」是現象,背後機制不只一種——把三種 drift 混在一起治理會錯方向。我們的判斷是:中小企業 AI 客服場景最常見的是 prompt drift 跟 data drift,concept drift 通常要到平台級規模才嚴重。三者治理手法完全不一樣,混淆會浪費維運預算。
Drift 類型 | 發生原因 | 典型徵兆 | 治理手法 |
|---|---|---|---|
Data drift | 客戶問題的語言、用詞、長度分佈在變 | 某類問題答非所問頻率上升 | 重新採樣 + retraining 或 RAG 知識庫更新 |
Concept drift | 商業邏輯本身在變(產品改版、條款改版) | AI 回覆的「規則」變成過時資訊 | 更新訓練資料 + 強化檢索層 + 真實世界對齊 |
Prompt drift | 人為改了 system prompt 之後沒回歸測試 | 特定場景突然崩、其他場景沒事 | Prompt version control + canary deploy + 回歸測試集 |
實務上中小企業最常踩的是 prompt drift——維運同仁為了修一個客訴去動 system prompt,沒做 A/B 對照、沒做回歸測試,當下修好了一個場景、把另外三個場景搞壞。這也是為什麼我們做 AI 客服維運接案會強制要求 prompt 走 git + canary 部署的流程。

5 個必裝監控指標:要在客戶感受到之前先偵測
AI 客服 drift 的核心治理原則是「在客戶感受到之前先偵測」——客戶用 CSAT 跟客訴回報是最後的訊號,前面有 4 條更早的訊號要看。以下五個指標是我們建議中小企業 AI 客服維運的最低監控盤:
- 指標 1:嵌入向量分佈漂移(embedding drift)。每週對近 1000 條客戶問題做 embedding、跟基準週對比 distribution distance(KL divergence 或 PSI)。超過閾值代表問題類型在變——比 CSAT 早 4-8 週。
- 指標 2:拒答率(abstention rate)。AI 回覆「我不確定 / 請聯繫人工」的比例。突然上升代表新類型問題進來、知識庫缺東西——是 data drift 最直接訊號。
- 指標 3:人工介入轉接率。從 AI 對話轉接到人工的比例。上升代表 AI 對某類問題開始失能。
- 指標 4:回覆長度與一致性。同類問題回覆長度標準差突然擴大、或同問題 24 小時內被問兩次給出矛盾答案——是 prompt drift 訊號。
- 指標 5:金牌測試集(golden test set)週評分。固定一份 200 題基準問題,每週讓 AI 跑一次、人工評分(或用 LLM-as-judge)。週評分掉 5% 以上要回頭查 prompt + 知識庫變更。
ℹ️我們自己內部 20+ 個 AI 流程都裝這 5 個監控
恆遠內部目前有 20+ 個 AI 工作流在跑(每日文章審計、PR code review、報價系統客服 bot、客戶問答 RAG),這 5 個監控指標是我們自己跑出來的最低標——其中金牌測試集是我們建議所有客戶必裝的第一個。我們客製化 AI 客服接案也都會把這套監控配套交付,可以看 /portfolio/sas-tradetalk 的 AI 整合案例。沒有監控的 AI 客服就像沒有溫度計的醫院。

4 條跟 AI 客服 SaaS 廠商必寫的合約 SLA 條款
中小企業老闆採購 AI 客服 SaaS 時最容易忽略的是「上線之後」的合約條款——大部分廠商的標準合約只規範「服務可用率 99.9%」這種傳統 IT 條款,沒寫任何模型品質相關 SLA。以下四條是我們建議寫進合約的最低標:
SLA 條款 | 約定內容 | 違反處置 |
|---|---|---|
月度品質報告 | 廠商每月提供 5 大指標 + 趨勢圖 + 風險警示 | 缺月扣月費 10-15% |
模型更新通知 + 回歸 | 廠商升級底層模型前 14 天書面通知 + 提供 sandbox 回歸 | 未通知扣月費 + 退費 + 客戶有權暫停 |
Drift 介入回應時間 | 指標跌幅超過 10% 後廠商 5 個工作日內提供分析 + 14 天內改善 | 超期啟動退費 / 解約權 |
資料與 prompt 可移植 | 解約時廠商交付對話歷史 / 知識庫 / prompt config(30 天內) | 未交付啟動 escrow 條款 / 索賠 |
這 4 條目前業界(特別是台灣本地 AI 客服 SaaS)幾乎沒人主動寫進合約——通常要客戶在合約談判時主動要求補。我們的判斷是:廠商願不願意接受這 4 條 SLA,是篩選成熟廠商與快速堆量 startup 的最佳分水嶺。願意簽的廠商通常有完整 MLOps 流程;不肯簽的廠商代表他們內部根本也不知道模型表現變化。
AI 客服維運不是上線完就交差——是新的客服長期合約
中小企業老闆導入 AI 客服最容易掉的心態坑是「上線完就交差」——這套思維在傳統客服軟體年代成立、但 AI 客服年代不成立。AI 客服上線那一刻你買的不是一套軟體、是一個會持續變化的同事。沒有 5 大指標監控 + 4 條 SLA 合約,第 6 個月之後就會變成隱性流血。這跟 我們先前寫過的 AI 客服自動化導入完整指南 是同一條軸——前者教你怎麼導入、這篇教你導入後怎麼維運。
想要我們幫你做 AI 客服維運合約審查、或建立內部監控指標儀表板,可以從 AI 導入諮詢服務頁 預約半小時,我們會帶你把現有 AI 客服合約的 SLA 漏洞列出來、給你一張 90 天監控配套建議。
ℹ️我們怎麼看:AI 客服 drift 治理會成為 AI 廠商分水嶺
未來 18 個月我們判斷 AI 客服市場會經歷一輪嚴重的廠商洗牌——「能做出 AI 客服 demo 的廠商」跟「能做 AI 客服長期治理的廠商」會徹底分開。中小企業老闆要問的不是「這套 AI 客服上線效果好不好」,而是「這家廠商有沒有月度品質報告 + drift 介入 SLA」。一個給讀者的判斷工具:問廠商「最近 12 個月你們客戶平均的 month-6 CSAT 跟 month-1 CSAT 差多少」——答不出來代表他們沒在看、不要簽。
Q中小企業沒有 ML 工程師可以做 drift 監控嗎?
可以,但要靠工具 + 流程而不是 ML 知識。5 個監控指標裡有 4 個(拒答率、轉接率、回覆長度、金牌測試集)完全不需要 ML 背景,用 Python 寫排程腳本 + Grafana / Looker Studio 看板就能跑。embedding drift 比較需要技術門檻,可以委外或用廠商提供的儀表板。
QAI 客服上線多久要開始監控?
上線當天就要開始——前 30 天的指標就是後續的 baseline。如果等到 3 個月後才裝監控,沒有基準線可以對照,drift 只能用「客戶開始抱怨」當訊號,已經太晚。
Q廠商說他們有監控我為什麼還要自己裝?
廠商監控的視角跟你的視角不一樣——廠商看的是「平台級平均指標」、你要看的是「你的客戶你的問題你的場景」。同一套 AI 客服在 A 客戶(電商)跟 B 客戶(醫療)的 drift 模式完全不同,平台級指標看不到 tenant 級異常。
Qprompt drift 怎麼避免?要不要禁止運維人員改 prompt?
不要禁止——禁止會讓維運效率掉 90%。正確做法是:prompt 走 git 版本控制、每次變更先在 canary 環境跑金牌測試集、評分不掉才推到正式環境。這是 LLMOps 標準流程,不是新東西。
Q換 AI 客服廠商會不會把所有資料卡死在他們系統?
會,這就是為什麼合約要寫第 4 條「資料與 prompt 可移植」。包括對話歷史 export、知識庫 export、prompt config 全部要約定 30 天內交付。沒寫這條等於資料人質。
AUTHOR
自由揚John
想了解更多?看看我們的相關服務
相關文章
用 AI 撰寫 ESG 永續報告完整指南:5 種報告框架、4 條合規風險、3 條人機協作流程——中小企業 2026 上市櫃供應商雙重申報的內容生產線

客戶成功(Customer Success)SaaS 採購完整指南:Gainsight / Totango / ChurnZero / Vitally / HubSpot+自架 5 條路徑——SaaS 老闆 6 個決策、5 條合約紅線、3 個報價區間

企業 LMS 線上培訓平台採購完整指南:TalentLMS / Docebo / 360Learning / 自架 Moodle 4 條路徑——中小企業老闆 6 個決策、5 個落地踩雷、3 個報價區間
中小企業老闆部署 Slack / Microsoft Teams AI 助理完整指南:4 條技術路徑、5 個資料邊界、3 個治理紅線

B2B 銷售信件序列工具採購完整指南:Apollo / Outreach / Lemlist / Reply.io / 自架 4 條路徑——中小企業老闆 6 個決策、5 條合約紅線、3 個報價區間

留言(0)
尚無留言,成為第一個留言的人吧!