

大部分台灣中小企業真正在比的是「誰最便宜」,而非「誰做得好」。這是台灣 AI 客製化外包失敗率破 50% 的根本原因——而你正在重蹈覆轍。
這句話我寫得很重,但攤開資料看其實還算保守。BCG 2025 年的全球 AI 落地調查 顯示,全球只有 26% 的企業能把 AI 從 POC 推到實際產生 ROI 的階段;MIT Sloan 與 BCG 的聯合研究 更直接點名「廠商選擇與合約結構」是排名第二的失敗主因,僅次於「資料品質」。問題從來不在 AI 不夠強,而在簽約那一刻就埋好了引爆點。
我們從 2023 年開始幫企業做 AI 客製化,看過太多老闆把選 AI vendor 當成選一般軟體外包來談——比三家、看 PPT、選最便宜的。三個月後 demo 出問題,回頭翻合約才發現:模型不是你的、訓練資料 ownership 沒寫清、廠商說 hallucination 是 AI 本質不是 bug、token 費用變成無底洞。當你想換廠商重做,發現整套 prompt 工程沒有交付,等於砍掉重練。
這篇文章會帶你拆解 7 個非看不可的評估維度、合約裡 7 條最容易被忽略的條款,再給你紅旗 vs 綠燈訊號清單,最後用一張決策樹幫你對應自己的場景。看完之後,你下一次跟 AI 廠商開會的姿勢會完全不一樣。
這篇文章是「客製化 AI 系統開發」主題群的 Spoke C,專注 vendor 評估維度。如果你還沒看過完整流程框架,先看 客製化 AI 系統開發完整指南;如果想看費用拆解,這裡有 AI 客製化費用結構與隱藏成本;如果想知道導入後 ROI 怎麼算,中小企業 AI 系統導入 ROI 場景 給你 4 種常見場景的回收期計算。傳統軟體 vendor 的評估標準(程式品質、UX、敏捷流程)這篇不重複談,請看 如何選軟體開發公司?7 個評估標準。
為什麼比三家、選最便宜,是 AI 外包最貴的決策
傳統軟體外包,比三家、看作品集、挑最便宜的,這套邏輯在 ERP、CRM、官網案場上跑了二十年都沒問題。換到 AI 客製化,這套全部失靈。原因很現實——AI 系統的成本不在「開發完那一刻」,而在「上線之後」。
一個典型的傳統軟體案,開發費佔總擁有成本(TCO)大約 60-70%,後續維運佔 30-40%。AI 客製化反過來——開發費可能只佔 TCO 的 30%,剩下 70% 都在資料更新、模型 retrain、token 費用、prompt 調整、hallucination 修正、合規維護。Gartner 在 2025 年的 AI Hype Cycle 報告 直接點出,企業低估 AI TCO 的平均幅度是 2.4 倍,主要落在運營階段。
這代表什麼?選一個開發費便宜 30% 的廠商,後面隱藏成本可能讓你多付 200%。比三家的時候比的明明是同一個系統,但每家的「開發完之後」差異大到像不同物種。有的把 prompt 工程藏起來不交付,有的把 retrain 列成額外服務按次計費,有的把 token 用量打包進「優惠價」其實不含 GPT-4 等級模型——這些藏在報價單沒寫的細節,才是真正決定你三年後付多少錢的關鍵。
迷思一:「AI 系統做完就是做完了」
AI 系統不像 ERP 上線之後可以放著跑五年。模型背後依賴的基礎模型(GPT-4、Claude、Gemini)每三到六個月就會大版本更新,廠商的 prompt 在新版本上的表現可能完全不同。資料分布也會漂移——你公司今年的客戶問題、產品線、組織架構跟去年都不一樣,模型如果沒 retrain 就會慢慢失準,Stanford HAI 2025 AI Index 統計的「production AI 模型平均使用壽命」只有 18 個月。
迷思二:「能 demo 就能上線」
廠商現場 demo 的成功率,跟正式上線後三個月的成功率差距常常超過 30 個百分點。Demo 環境是 cherry-pick 過的最佳案例,正式環境會碰到 edge case、髒資料、權限問題、user 各種你沒想過的問法。對口廠商該做的事很簡單:直接給你一個 staging 環境讓你實測一週。如果他不肯,這就是第一個紅旗。
想跳過踩坑直接拿到評估清單?
我們把這篇文章的 7 維度評分卡 + 合約 7 條款 checklist 整理成一份免費 PDF,附 8 個典型紅旗訊號的判讀範例。聯絡 自由揚 AI 顧問服務,我們會直接寄給你,並提供一次免費 30 分鐘的 vendor 體檢諮詢。
迷思三:「找大公司比較安全」
大顧問公司在 AI 客製化案上經常出現一個結構性問題——前期 partner 出席提案,簽約後實際執行的是入行三年的 consultant 帶兩個 intern。AI 不是傳統 IT 案件,可以靠標準化方法論帶人;它高度仰賴 senior 工程師對模型行為、prompt 設計、資料管線的直覺判斷。在台灣市場上,反而有 AI 落地經驗的中型團隊(30-80 人,創辦人本身有實作經驗)成功率明顯較高。Forrester 2025 AI Services Wave 也指出,AI 落地專案中「資深工程師參與比例」是最強的成功預測指標。
7 個評估維度評分卡:照這份打分,比看 PPT 更可靠
這是一張我們實際在幫客戶做 vendor 體檢時用的評分卡。每個維度滿分 10 分,總分 70 分。低於 45 分的廠商,不論報價多便宜都建議直接淘汰;45-55 分可以列入備選但要逐項補強;55 分以上才有實質討論的價值。
維度 | 權重 | 綠燈訊號(高分) | 紅旗訊號(低分) |
|---|---|---|---|
資料 ownership | 10% | 合約明訂訓練資料、衍生模型、產出全部歸客戶 | 只寫「依雙方協議」、廠商保留再利用權 |
模型 ownership | 15% | 終止合約可帶走完整模型權重 + prompt | 宣稱「模型是廠商技術機密」 |
資料合規能力 | 15% | ISO 27001 / SOC 2 / 個資法落地經驗 | 「我們有處理過」(拿不出文件) |
真實落地案例 | 15% | 有 3 個以上同產業 production case + 客戶推薦 | PPT 一堆 logo 但要不到 case 細節 |
AI 故障 SLA | 15% | hallucination 率 SLA + 應變時限 + 賠償條款 | 傳統 uptime SLA、輸出僅供參考 |
維運成本透明度 | 15% | 三年 TCO 試算表 + token 用量上限保證 | 報價單只有開發費 |
團隊組成 | 15% | 資料工程 + ML + 後端 + 產品 4 種角色齊全 | 純 ML 顧問 / 業務多於工程師 |
評分卡只是起點,每個維度背後的判斷邏輯才是關鍵。下面 7 個 H3 段落會一個一個拆給你看。

資料 ownership:你以為是你的,可能不是你的
AI 客製化案件最常見的爭議都從這裡開始——「訓練資料是誰的」、「衍生模型是誰的」、「使用 LLM 之後產出的內容是誰的」。傳統軟體合約只要寫「程式碼歸客戶」就解決 90% 的智財問題;AI 合約如果只寫這一條,等於什麼都沒寫。
具體要釐清的是三層:第一層是「你給廠商的訓練資料」(你公司的客戶資料、產品手冊、過往報價單),合約必須明訂這層資料用途僅限本案、不得用於訓練廠商其他客戶的模型、合約終止後 30 天內銷毀並提供書面證明。第二層是「廠商 fine-tune 出來的模型權重」,這層 ownership 要寫死歸客戶;第三層是「使用 AI 系統後產出的內容」(例如生成的文案、報價、回信),如果客戶要拿這些再去訓練自己的下一代模型,廠商不能阻擋。OECD AI Principles 2024 更新版 把這三層通稱為「AI 資料價值鏈」,建議都要逐層寫進合約。
模型 ownership 與 vendor lock-in:你能不能搬家
我看過最誇張的案例,是一家製造業客戶花了 380 萬請 AI 公司做客製化報價系統。三年後系統表現開始走下坡,老闆想換廠商重做,原廠商說:「prompt 是我們的 know-how,不交付。」客戶當場傻眼——所謂的客製化系統,核心其實是 50 個精心調校的 prompt,prompt 拿不走等於什麼都沒留下。
簽約前一定要問清楚四件事:模型權重(如果有 fine-tune)有沒有交付?prompt 工程文件有沒有完整交付?訓練/評估用的資料集 ownership 在誰手上?API key、工具串接、RAG 知識庫的 schema 文件有沒有交付?四個答案缺一個都會讓你變成 vendor 的「模型人質」。具體做法是把「合約終止交付清單」寫成附件 A,明列每一項交付物的格式(例如 prompt 用 Markdown 文件、模型用 GGUF 或 SafeTensors 格式、資料集用 JSONL)。
資料隱私與合規能力:個資法、GDPR、AI Act
台灣個人資料保護法第 27 條要求企業對個資處理採取「適當之安全措施」,AI 訓練資料如果包含個資,廠商必須能說明資料流(data flow)、儲存位置、加密機制、權限控管。如果你的客戶有歐盟人或業務涉歐,還要考慮 EU AI Act(2024 年通過) 對「高風險 AI 系統」的合規要求,包括 risk assessment、conformity assessment、技術文件保存十年。
實務上,要請廠商出示三份文件:ISO 27001 或 SOC 2 認證(資安管理系統)、近三年的滲透測試報告、資料處理合約(DPA)範本。如果是金融、醫療、政府案場,還要加上行業特定合規(金管會 AI 治理原則、HIPAA、政府個資保護要點)。沒有這三份文件的廠商,碰到客戶端資安稽核會直接被打槍。
⚠️公開 LLM API 的個資外洩風險
如果廠商系統直接呼叫 OpenAI / Anthropic 的公開 API,預設情況下你的 prompt 內容會傳到美國伺服器。雖然主流廠商承諾「API 資料不用於訓練」,但這仍不等於符合台灣個資法的「跨境傳輸告知」要求。要嘛要求廠商使用 Azure OpenAI(資料留存區可選)、AWS Bedrock,要嘛在系統前面加一層「個資去識別化中介層」。簽約前一定要問清楚資料路由路徑。
真實落地案例 vs 行銷話術:PPT 太多就是紅旗
AI 客製化的廠商行銷簡報幾乎都長得一樣——大標題寫「我們已經服務 100 家企業」,內頁列一堆品牌 logo,但細看才發現大部分是 POC、demo、教育訓練、PoC 階段的合作,真正進入 production、有 user 實際每天在用的案例可能不到三個。
簡單的判讀方法:請廠商提供「production case study」三個,每個要包含上線時間、月活使用者數、AI 輸出量、效益數字(時間節省、錯誤率下降、營收增加)。廠商若說「客戶要求保密不能公開」,可以接受,但至少要能提供「同產業匿名化版本 + 客戶端聯絡人讓你直接 reference call」。連 reference call 都安排不出來的廠商,那 100 家品牌 logo 大概九成是 demo level。我們在 AI 系統導入 ROI 場景分析 裡有提到,能拿出 production case 細節的廠商比例大約只有 15-20%。
AI 故障 SLA 與 hallucination 責任:傳統 SLA 不夠用
傳統軟體的 SLA 寫「99.5% uptime、4 小時內回應」就完事,AI 系統完全不夠。AI 故障有三種獨特模式:模型回應變慢(latency degradation)、回應品質下降(quality drift)、hallucination 比例上升(factuality drop)。這三種狀況系統還是「在跑」,傳統 uptime SLA 完全偵測不到。
一份夠用的 AI SLA 至少要包含:hallucination 率上限(例如 < 3% on 標準測試集)、回應 latency 95th percentile(例如 < 5 秒)、品質 drift 監測機制(每月跑一次 evaluation)、責任歸屬條款(如果 AI 給出錯誤建議導致客戶損失,誰負責)。最後一條最重要也最容易被廠商規避——很多合約寫「AI 輸出僅供參考,最終決策由用戶判斷」,這句話等於「出事我不負責」。要爭取的版本是「廠商保證 hallucination 率不超過 X%,超過視為違約並啟動賠償條款」。

迭代與維運成本透明度:報價單後面的隱形數字
我們在 AI 客製化費用結構與隱藏成本 裡面拆得很細,這裡只講選 vendor 時要看的訊號。第一個訊號是「三年 TCO 試算表」——好的廠商會主動給你開發費 + 第一年維運費 + 第二三年預估費的完整表,包含 token 用量假設、retrain 頻率、模型升級成本。第二個訊號是「token 用量保證上限」——很多廠商初期不寫 token 上限,等你上線量大了才告訴你「超過要加錢」。要爭取的條款是「第一年 token 用量保證 X 百萬以下,超過按 Y 元/百萬 token 線性計費」,把單價寫死。
第三個訊號是「retrain / 模型版本升級的計費方式」。基礎模型每六個月大改版一次,舊版 prompt 在新版本上可能要重調。廠商如果每次改版都跟你收一筆「適配費」,三年下來可能多付一倍。爭取的版本是「每年含一次免費 major version 升級,含 prompt 重新調校與 regression test」。
團隊組成:純 ML 顧問 vs 完整工程團隊
AI 系統能不能上線、能不能穩定,跟廠商團隊組成的關係比想像中大。一個能交付 production AI 系統的團隊至少要有四種角色:
角色 | 負責什麼 | 為什麼缺不可 |
|---|---|---|
ML / Prompt 工程師 | 模型選型、prompt 設計、fine-tune | AI 核心,決定品質 |
資料工程師 | 資料管線、ETL、向量資料庫 | 髒資料是 AI 失敗主因第一名 |
後端工程師 | API、權限、整合既有系統 | AI 不能孤立,要跟 ERP/CRM 串 |
產品 / UX 設計 | 互動流程、錯誤處理、user feedback loop | AI 體驗差,user 不會用 |
純 ML 顧問公司常常缺後三種角色,結果做出來的東西跑得動但接不上你的系統,或是 AI 很強但 user 找不到入口。對 SME 來說,找一個齊備四種角色的中型團隊(30-80 人),會比找純 ML 顧問 + 自己找後端外包來拼,要省事很多。
合約必看 7 條款:簽約前一定要逐條對照
評估維度通過了,到了簽約階段,魔鬼藏在合約細節。下面這 7 條是過去三年我們協助客戶談 AI 合約最常修改、也最容易被廠商「不寫」的條款。建議印一份對照清單,逐條跟廠商法務確認。
條款 | 標準寫法(綠燈) | 風險寫法(紅旗) |
|---|---|---|
模型版本變更通知 | 廠商升級基礎模型須提前 30 天書面通知並提供 regression test 報告 | 廠商保留隨時更新模型之權利 |
Token / API 計費透明 | 明列單價、月度上限、超用按線性計費,每月提供用量報表 | 「依實際用量計費」無單價條款 |
Hallucination 責任歸屬 | 廠商保證錯誤率 < X%,超過啟動賠償(金額或免費修正) | AI 輸出僅供參考,廠商不負責 |
資料外洩通報時限 | 發現外洩 24 小時內通知客戶,72 小時內完整報告 | 依個資法規定處理 |
合約終止資料刪除 | 30 天內刪除所有客戶資料並提供第三方稽核證明 | 依雙方協議處理 |
智財權歸屬 | 程式碼/模型/prompt/訓練資料 ownership 全歸客戶 | 雙方共有 / 廠商保留再利用權 |
第三方依賴揭露 | 完整列出 OpenAI/Anthropic/Google API key 等依賴與成本 | 未揭露第三方 |
條款一:模型版本變更通知
OpenAI 在 2024 年 GPT-4 改版時,全球至少 30% 的 production prompt 出現品質倒退,部分案場 hallucination 率從 2% 暴增到 11%。如果廠商沒有「升級前通知」條款,你會在某天早上發現系統突然亂答問題,找廠商才知道昨晚悄悄換了模型版本。具體建議寫法:「凡涉及基礎模型 major version 升級,廠商應於升級前 30 個工作日書面通知客戶,並附上 regression test 報告,客戶有權延遲升級或要求廠商先進行 prompt 適配。」
條款二:Token / API 用量計費透明
這是最常踩坑的地方。一個 AI 客服系統初期 demo 可能每月 token 費用只要兩萬,正式上線量大後可能變五十萬,廠商如果沒寫單價,可以直接標出三倍利潤。要求合約寫死:基礎模型單價(按廠商實際採購價加 N% margin)、月度 token 包額度、超用按 X 元 / 1M tokens 線性計費、每月 25 號前提供前一月詳細用量報表(含 prompt token、completion token、模型版本、call 來源)。
條款三:Hallucination / 錯誤輸出責任歸屬
這是合約攻防最激烈的一條。廠商一定會堅持「AI 本質有不確定性,輸出僅供參考」,這在法律上不算錯,但實務上對客戶極度不利。折衷的版本是分級責任:廠商保證在「商定的測試集」上 hallucination 率不超過 X%(通常 3-5%),超過視為品質違約,啟動三級補救——先調校 prompt(30 天內)、調整模型(60 天內)、退費(達不到則退還該模組費用)。最後一級是談判重點,廠商通常會抗拒,但能談下來等於拿到品質保證。
🚨千萬別簽這種「AI 免責條款」
如果合約裡有「客戶理解 AI 有不確定性,廠商不對任何 AI 輸出造成的損失負責」這種無限免責條款——直接拒簽。這等於廠商把所有風險甩給你,做爛了你還不能追究。可以接受「重大過失或故意」以外的責任限制,但不能完全免責。
條款四:資料外洩通報時限
台灣個資法施行細則第 22 條要求「發現個資外洩時應於 72 小時內通報」,但合約應該寫得比法令更嚴——24 小時內發現即通知、72 小時內提供初步分析報告、30 天內提供完整 root cause analysis。GDPR Article 33 也是 72 小時,但定義更明確(「成為知情者起算」),合約可以參照。違反通報義務的賠償條款也要寫清楚,避免廠商發現外洩後拖延。
條款五:合約終止後資料刪除證明
合約結束後,廠商手上你的資料怎麼處理?很多合約只寫「依雙方協議」,等於沒寫。要爭取的版本是:合約終止後 30 個工作日內,廠商須刪除所有客戶資料(含 backup、log、向量資料庫 embedding、模型 fine-tune checkpoint),並提供第三方稽核公司簽署的「資料銷毀證明」。沒有書面證明,等於沒刪——廠商保留你的資料,未來可能被用於 reference 訓練其他客戶模型。
條款六:智慧財產權歸屬
AI 客製化的智財權至少有四個物件要分別寫清楚:客製化程式碼(前端、後端、API)、fine-tune 模型權重、prompt 工程文件、訓練/評估資料集。每一項都要明確歸屬。標準綠燈版本是四項全歸客戶,廠商只保留「執行本合約所必要之使用權」。如果廠商堅持 prompt 是「他們的 know-how」要保留,可以折衷成「prompt 全文交付給客戶,廠商保留在不洩露客戶機密前提下用於開發類似系統的權利」——但要警覺,這已經在讓步區。
條款七:第三方依賴揭露
AI 客製化系統幾乎都依賴第三方——OpenAI、Anthropic、Google、Azure、AWS、Pinecone、Weaviate……廠商要在合約附件 B 中完整揭露所有依賴,包括服務名稱、API key 持有方、月度預估費用、SLA。為什麼?因為其中任何一個服務漲價、停服、政策變更,都會直接影響你的系統。OpenAI 在 2023-2024 兩年內 API 價格調整過 4 次,沒有揭露的客戶常常莫名其妙被加價。

12 個紅旗訊號 vs 綠燈訊號:第一次提案會議就能判斷
評分卡和合約都是後段才用得到,第一次提案會議怎麼快速篩選?下面這份訊號清單是我們實際在篩 vendor 用的。提案會議全程 60-90 分鐘,紅旗訊號出現 3 個以上的廠商,回去就可以淘汰;綠燈訊號出現 5 個以上的,可以進入第二輪深談。
項目 | 紅旗訊號 | 綠燈訊號 |
|---|---|---|
AI 落地案例 | PPT 多但要不到 production case 數據 | 現場開電腦給你看實際運行系統與用量 |
技術深度 | 回答都很「正面」沒有風險討論 | 主動講出三種會失敗的場景與緩解方式 |
團隊出席 | 業務 + PM,工程師掛 Zoom 不發言 | ML 工程師現場、能即時回答 prompt 設計細節 |
合約態度 | 「合約我們有標準版」「不能改」 | 願意逐條討論,提供修改版時程 |
資料 ownership | 「這個合約裡都會處理」(沒給細節) | 主動拿出 ownership 分層說明簡報 |
費用報價 | 一張總價,沒拆 token / retrain / 維運 | 三年 TCO 試算表 + 假設條件清單 |
timeline 承諾 | 「兩個月可以上線」(沒提資料準備期) | 標準 4-6 個月,含 POC、staging、production 三階段 |
前段廠商比較 | 貶低同業 / 不願意比較 | 客觀指出自己 vs 同業強弱項 |
技術選型 | 全部都是「我們自研框架」 | 說明何時用 OpenAI、何時自架 open-source |
客戶 reference | 「客戶要求保密都不能透露」 | 主動提供 2-3 個 reference call 聯絡人 |
失敗經驗 | 「我們從沒失敗過」 | 主動分享 1-2 個踩坑案例與學到的事 |
售後維運 | 「上線後我們也會繼續支援」(口頭) | 完整 maintenance SLA 文件 + 三年 roadmap |
ℹ️做一份「同樣的問題問三家」清單
提案會議每家用同樣的 10-15 個問題去問,把答案寫進對照表。例如:「token 用量超過合約上限怎麼計費?」「合約終止後 prompt 文件怎麼交付?」「上次 OpenAI 改版你們怎麼處理?」答案差異會比 PPT 簡報更有判斷力。我們把這份清單整理成 AI Vendor 提案會議 15 問,可以直接索取。
vendor 評估決策樹:對應你的場景挑廠商
不同場景需要不同類型的廠商。下面這張決策樹整理了三個常見維度——預算規模、AI 在系統中的核心程度、資料敏感度——幫你快速對應該找哪一類廠商。
這張圖只是粗略分類,實際評估還要疊加產業經驗(製造、零售、金融、醫療各有專長廠商)、技術 stack 偏好(重視自有 infra 還是雲端服務)、長期合作意願(一次性案件 vs 戰略合作)。把這三層條件加進去,候選廠商通常會收斂到 3-5 家,再用前面的評分卡逐一打分。
4 種典型場景:照場景對應 vendor 類型
理論講太多會抽象,最後給四個我們實際接觸過的典型場景,看你的狀況比較像哪一個,直接套用建議。
場景一:傳產製造,預算 150-300 萬,要做報價自動化
這類客戶的關鍵在於整合能力,而不在 AI 模型本身有多強——能不能接 ERP、能不能解析工程圖、能不能應對複雜規格才是重點。建議找「有製造業 production case」的中型團隊,避開純 ML 顧問。重點檢查項目:報價系統有沒有跟 ERP 對接過、能不能處理 Excel 多 sheet 規格表、AI 給錯規格的責任怎麼承擔。預算建議分配:開發 60%、第一年維運 25%、培訓 15%。
場景二:電商零售,預算 80-200 萬,要做 AI 客服
AI 客服坑最多——hallucination 給錯訂單資訊、語氣不對嚇跑客人、整合不了既有的客服工單系統。建議找「有 AI 客服 production case + 電商整合經驗」的廠商,特別注意 hallucination SLA 條款(客服場景錯一句話可能就是退款 + 客訴)。技術上要問清楚:用 RAG 還是 fine-tune?知識庫怎麼更新?多輪對話怎麼處理?這個場景在 中小企業 AI 系統導入 ROI 場景 裡有 ROI 試算範例。
場景三:金融保險,預算 500 萬以上,要做合規審查或核保輔助
這類案場資料敏感度極高,廠商必須具備 ISO 27001 + SOC 2 + 金融業實戰經驗。資料絕對不能流出國(不能用公開 OpenAI API),通常要自架 LLM(Llama 3 70B 或 Mistral)或用 Azure OpenAI 的台灣 region。合約上要加上「金管會 AI 治理原則合規承諾」、「跨境資料流出限制」、「主管機關稽核配合義務」。預算分配:合規 + 資安投入會比一般案場多 30-40%。
場景四:SaaS 產品要加 AI 功能,預算 300-600 萬
SaaS 加 AI 跟做客製化系統不一樣——你要的是長期合作的技術 partner,能跟著產品迭代,而非一次性交付完就走的廠商。這類案場建議直接找有 SaaS 自有產品的 AI 團隊(他們懂 product 思維,不只懂技術),合約結構也應該從「專案驗收」改成「retainer 月費 + 績效獎金」。重點談判項目:product roadmap 對齊、bug fix SLA、用量隨產品成長的計費階梯。可以參考 SaaS vs 客製化系統比較 與 系統上線後的第一年維運指南 的合作模式建議。
AI vendor vs 一般軟體 vendor 差異對照
最後一張對照表整理 AI vendor 跟一般軟體 vendor 在 12 個維度上的差異。如果你之前選軟體公司的經驗很豐富,這張表會幫你快速 update 思維。如何選軟體開發公司(傳統軟體版本) 補充了傳統軟體 vendor 的選擇邏輯,工廠系統 SaaS vs 客製化決策框架 則是製造業特定情境的延伸閱讀。
維度 | 一般軟體 vendor | AI vendor |
|---|---|---|
核心交付物 | 程式碼 + 文件 | 程式碼 + 模型 + prompt + 資料集 + 評估方法 |
TCO 結構 | 開發 65% / 維運 35% | 開發 30% / 維運 70% |
驗收標準 | 功能對 spec、bug 數量 | 功能 + 模型品質指標 + hallucination 率 |
SLA 重點 | uptime + 回應時間 | uptime + 品質 drift + hallucination 率 |
智財重點 | 程式碼 ownership | 程式碼 + 模型 + prompt + 資料 ownership |
團隊角色 | 前端/後端/PM/QA | 上述 + ML / 資料工程 / Prompt 工程 |
第三方依賴 | 資料庫、cloud | 上述 + LLM API + 向量資料庫 + embedding 模型 |
合約週期 | 一次性 + 維護年費 | 建議 retainer + 績效獎金 |
升級風險 | 框架版本升級(每 2-3 年) | 模型版本升級(每 6 個月) |
合規重點 | 個資法、資安基本 | 上述 + AI Act + 演算法治理 |
失敗模式 | 需求不清、進度落後 | 資料品質、hallucination、user 不會用 |
合作關係 | 甲方 / 乙方 | 技術 partner,需要長期共同迭代 |
最大的差異其實在最後一行——AI 客製化更像是「招募一個外部 AI 部門」,跟傳統「下單買軟體」的甲乙方思維完全是兩回事。這個心態轉變如果沒做到,前面所有的評估維度、合約條款都會在實作時被現實打臉。
常見問題:客戶在簽約前最常問的 6 個問題
Q我們公司沒人懂 AI,怎麼判斷廠商技術好不好?
找一個第三方 AI 顧問做 vendor 體檢是最快的方式(費用通常 5-15 萬),可以省掉幾百萬的學費。如果沒預算,至少做兩件事:一、要求廠商提供 3 個 production case 的 reference call;二、把廠商的提案給其他兩家廠商看,請他們指出技術選型上的疑慮——廠商之間互相 review 比你自己看 PPT 有用得多。
QAI 系統做完之後,可以自己接手維運嗎?
理論上可以,實務上很難。AI 系統的維運需要持續監控模型表現、處理 user feedback、retrain、prompt 調校,這些工作需要 ML 知識。建議至少前兩年仍由原廠商或專業團隊維運,內部慢慢培養 1-2 個能 handle 的工程師。如果要走「完全內製」路線,合約裡要寫明「廠商提供完整 knowledge transfer 與 6 個月 hand-over 期」。
Q廠商說「我們用的是最新 GPT-5」,這算優點嗎?
不一定。最新模型不代表最適合,反而可能 token 成本高 3-5 倍、API 不穩定(剛出時)、prompt 經驗少。成熟的廠商會根據場景選模型——簡單分類用便宜的 GPT-4o-mini 或 Claude Haiku,複雜推理才用 GPT-5 或 Claude Opus。如果廠商一律推「最新最強」模型,要警覺是不是想拉高 token 費抽成。
Q簽約前可以要求 POC 嗎?費用怎麼算?
強烈建議要求 POC,費用通常 30-80 萬(2-4 週週期)。POC 階段就能看出廠商實力——能不能在你的真實資料上跑出 demo、能不能誠實說明限制、報告寫得好不好。POC 費用可以談「正式簽約後折抵 50-100%」,廠商如果自信通常願意接受。POC 不通過直接放棄這家,遠比簽完約才發現做不出來便宜。
Q廠商要我簽 NDA 才能看 case,合理嗎?
看 case 細節要簽 NDA 是合理的,但「不能透露任何客戶名」有點奇怪——大公司案場通常經客戶同意可以揭露 logo 或產業類別。如果廠商連產業都不肯說,可能是 case 數量比宣稱的少很多。折衷做法:簽 NDA 後請廠商列出 production case 清單(含產業、規模、時間),看看跟你的 PPT 對得上嗎。
Q如果中途想換廠商,怎麼把舊系統的東西搬走最順?
這要從簽約那天就規劃。合約裡寫清楚「資料、模型、prompt、評估資料集」的交付格式(建議是業界標準格式:資料 JSONL/CSV、模型 GGUF/SafeTensors、prompt Markdown、API spec OpenAPI 3.0)。中途換廠商時,先讓新廠商以「審計」名義 review 舊系統 2 週,產出 migration plan,再正式切換。中間建議有 2-4 週並行期,舊系統繼續運作直到新系統穩定。
下一步:免費 vendor 體檢與 AI 顧問諮詢
選 AI 廠商不是一張評分卡可以涵蓋的事。每家公司的產業、資料、合規、預算結構都不同,同樣的廠商在 A 公司是綠燈、在 B 公司可能是紅旗。如果你正在評估 AI 客製化案,或者已經簽了約但對合約細節有疑慮,自由揚提供免費的 vendor 體檢服務——我們會看你的提案、合約、廠商報告,給出客觀第三方意見。
沒有業務話術,沒有要你換成我們做。我們做過自己的 AI 案,也在客製化系統諮詢中看過不少同業的提案,分得出什麼是真功夫、什麼是包裝得好的話術。立刻預約 30 分鐘免費 AI 顧問諮詢,把你目前的提案或合約寄給我們,我們會在 3 個工作日內回覆完整體檢報告。
延伸閱讀:完整框架看 客製化 AI 系統開發完整指南、費用全拆解看 AI 客製化費用結構與隱藏成本、ROI 試算看 中小企業 AI 系統導入 ROI 場景、傳統軟體 vendor 標準看 如何選軟體開發公司?7 個評估標準。
AUTHOR
自由揚John
想了解更多?看看我們的相關服務
相關文章
中小企業客戶反饋 NPS SaaS 採購完整指南:Typeform / SurveyMonkey / Qualtrics / Hotjar / 自架 4 條路徑、5 個落地踩雷、3 個報價區間

客戶流失預測(Customer Churn)AI 系統完整指南:4 條模型路徑、5 條觸發訊號、3 個 ROI 試算框架——中小企業老闆從「救單」到「主動預防」的決策手冊

中小企業老闆 AI 工具堆疊(AI Sprawl)治理完整指南:5 個盤點訊號、4 條合併路徑、3 個老闆每季審視框架

電子簽章 SaaS 採購完整指南:DocuSign / Adobe Acrobat Sign / CloudSign / 自架 4 條路徑、台灣法規必懂 5 點、4 條合約紅線——中小企業老闆「紙本合約消失」的完整決策框架

NTT DATA × Google Cloud 部署 500 個 AI Agent 完整解析:台灣中小企業 PoC → Production 的 6 個落地訊號 + 4 條合約對賭條款 + 3 階段 ROI 驗證

留言(0)
尚無留言,成為第一個留言的人吧!