怎麼選客製化 AI 系統開發公司？7 個評估標準與合約必看條款

自由揚John2026年5月5日約 24 分鐘閱讀

複製引文

AI 客製化開發公司評估與合約條款指南封面

大部分台灣中小企業真正在比的是「誰最便宜」，而非「誰做得好」。這是台灣 AI 客製化外包失敗率破 50% 的根本原因——而你正在重蹈覆轍。

這句話我寫得很重，但攤開資料看其實還算保守。BCG 2025 年的全球 AI 落地調查 顯示，全球只有 26% 的企業能把 AI 從 POC 推到實際產生 ROI 的階段；MIT Sloan 與 BCG 的聯合研究 更直接點名「廠商選擇與合約結構」是排名第二的失敗主因，僅次於「資料品質」。問題從來不在 AI 不夠強，而在簽約那一刻就埋好了引爆點。

我們從 2023 年開始幫企業做 AI 客製化，看過太多老闆把選 AI vendor 當成選一般軟體外包來談——比三家、看 PPT、選最便宜的。三個月後 demo 出問題，回頭翻合約才發現：模型不是你的、訓練資料 ownership 沒寫清、廠商說 hallucination 是 AI 本質不是 bug、token 費用變成無底洞。當你想換廠商重做，發現整套 prompt 工程沒有交付，等於砍掉重練。

這篇文章會帶你拆解 7 個非看不可的評估維度、合約裡 7 條最容易被忽略的條款，再給你紅旗 vs 綠燈訊號清單，最後用一張決策樹幫你對應自己的場景。看完之後，你下一次跟 AI 廠商開會的姿勢會完全不一樣。

這篇文章是「客製化 AI 系統開發」主題群的 Spoke C，專注 vendor 評估維度。如果你還沒看過完整流程框架，先看 客製化 AI 系統開發完整指南；如果想看費用拆解，這裡有 AI 客製化費用結構與隱藏成本；如果想知道導入後 ROI 怎麼算，中小企業 AI 系統導入 ROI 場景 給你 4 種常見場景的回收期計算。傳統軟體 vendor 的評估標準（程式品質、UX、敏捷流程）這篇不重複談，請看 如何選軟體開發公司？7 個評估標準。

為什麼比三家、選最便宜，是 AI 外包最貴的決策

傳統軟體外包，比三家、看作品集、挑最便宜的，這套邏輯在 ERP、CRM、官網案場上跑了二十年都沒問題。換到 AI 客製化，這套全部失靈。原因很現實——AI 系統的成本不在「開發完那一刻」，而在「上線之後」。

一個典型的傳統軟體案，開發費佔總擁有成本（TCO）大約 60-70%，後續維運佔 30-40%。AI 客製化反過來——開發費可能只佔 TCO 的 30%，剩下 70% 都在資料更新、模型 retrain、token 費用、prompt 調整、hallucination 修正、合規維護。Gartner 在 2025 年的 AI Hype Cycle 報告 直接點出，企業低估 AI TCO 的平均幅度是 2.4 倍，主要落在運營階段。

這代表什麼？選一個開發費便宜 30% 的廠商，後面隱藏成本可能讓你多付 200%。比三家的時候比的明明是同一個系統，但每家的「開發完之後」差異大到像不同物種。有的把 prompt 工程藏起來不交付，有的把 retrain 列成額外服務按次計費，有的把 token 用量打包進「優惠價」其實不含 GPT-4 等級模型——這些藏在報價單沒寫的細節，才是真正決定你三年後付多少錢的關鍵。

迷思一：「AI 系統做完就是做完了」

AI 系統不像 ERP 上線之後可以放著跑五年。模型背後依賴的基礎模型（GPT-4、Claude、Gemini）每三到六個月就會大版本更新，廠商的 prompt 在新版本上的表現可能完全不同。資料分布也會漂移——你公司今年的客戶問題、產品線、組織架構跟去年都不一樣，模型如果沒 retrain 就會慢慢失準，Stanford HAI 2025 AI Index 統計的「production AI 模型平均使用壽命」只有 18 個月。

迷思二：「能 demo 就能上線」

廠商現場 demo 的成功率，跟正式上線後三個月的成功率差距常常超過 30 個百分點。Demo 環境是 cherry-pick 過的最佳案例，正式環境會碰到 edge case、髒資料、權限問題、user 各種你沒想過的問法。對口廠商該做的事很簡單：直接給你一個 staging 環境讓你實測一週。如果他不肯，這就是第一個紅旗。

想跳過踩坑直接拿到評估清單？

我們把這篇文章的 7 維度評分卡 + 合約 7 條款 checklist 整理成一份免費 PDF，附 8 個典型紅旗訊號的判讀範例。聯絡自由揚 AI 顧問服務，我們會直接寄給你，並提供一次免費 30 分鐘的 vendor 體檢諮詢。

迷思三：「找大公司比較安全」

大顧問公司在 AI 客製化案上經常出現一個結構性問題——前期 partner 出席提案，簽約後實際執行的是入行三年的 consultant 帶兩個 intern。AI 不是傳統 IT 案件，可以靠標準化方法論帶人；它高度仰賴 senior 工程師對模型行為、prompt 設計、資料管線的直覺判斷。在台灣市場上，反而有 AI 落地經驗的中型團隊（30-80 人，創辦人本身有實作經驗）成功率明顯較高。Forrester 2025 AI Services Wave 也指出，AI 落地專案中「資深工程師參與比例」是最強的成功預測指標。

7 個評估維度評分卡：照這份打分，比看 PPT 更可靠

這是一張我們實際在幫客戶做 vendor 體檢時用的評分卡。每個維度滿分 10 分，總分 70 分。低於 45 分的廠商，不論報價多便宜都建議直接淘汰；45-55 分可以列入備選但要逐項補強；55 分以上才有實質討論的價值。

維度	權重	綠燈訊號（高分）	紅旗訊號（低分）
資料 ownership	10%	合約明訂訓練資料、衍生模型、產出全部歸客戶	只寫「依雙方協議」、廠商保留再利用權
模型 ownership	15%	終止合約可帶走完整模型權重 + prompt	宣稱「模型是廠商技術機密」
資料合規能力	15%	ISO 27001 / SOC 2 / 個資法落地經驗	「我們有處理過」（拿不出文件）
真實落地案例	15%	有 3 個以上同產業 production case + 客戶推薦	PPT 一堆 logo 但要不到 case 細節
AI 故障 SLA	15%	hallucination 率 SLA + 應變時限 + 賠償條款	傳統 uptime SLA、輸出僅供參考
維運成本透明度	15%	三年 TCO 試算表 + token 用量上限保證	報價單只有開發費
團隊組成	15%	資料工程 + ML + 後端 + 產品 4 種角色齊全	純 ML 顧問 / 業務多於工程師

評分卡只是起點，每個維度背後的判斷邏輯才是關鍵。下面 7 個 H3 段落會一個一個拆給你看。

企業主與 AI 開發團隊在會議室審視合約

資料 ownership：你以為是你的，可能不是你的

AI 客製化案件最常見的爭議都從這裡開始——「訓練資料是誰的」、「衍生模型是誰的」、「使用 LLM 之後產出的內容是誰的」。傳統軟體合約只要寫「程式碼歸客戶」就解決 90% 的智財問題；AI 合約如果只寫這一條，等於什麼都沒寫。

具體要釐清的是三層：第一層是「你給廠商的訓練資料」（你公司的客戶資料、產品手冊、過往報價單），合約必須明訂這層資料用途僅限本案、不得用於訓練廠商其他客戶的模型、合約終止後 30 天內銷毀並提供書面證明。第二層是「廠商 fine-tune 出來的模型權重」，這層 ownership 要寫死歸客戶；第三層是「使用 AI 系統後產出的內容」（例如生成的文案、報價、回信），如果客戶要拿這些再去訓練自己的下一代模型，廠商不能阻擋。OECD AI Principles 2024 更新版 把這三層通稱為「AI 資料價值鏈」，建議都要逐層寫進合約。

模型 ownership 與 vendor lock-in：你能不能搬家

我看過最誇張的案例，是一家製造業客戶花了 380 萬請 AI 公司做客製化報價系統。三年後系統表現開始走下坡，老闆想換廠商重做，原廠商說：「prompt 是我們的 know-how，不交付。」客戶當場傻眼——所謂的客製化系統，核心其實是 50 個精心調校的 prompt，prompt 拿不走等於什麼都沒留下。

簽約前一定要問清楚四件事：模型權重（如果有 fine-tune）有沒有交付？prompt 工程文件有沒有完整交付？訓練/評估用的資料集 ownership 在誰手上？API key、工具串接、RAG 知識庫的 schema 文件有沒有交付？四個答案缺一個都會讓你變成 vendor 的「模型人質」。具體做法是把「合約終止交付清單」寫成附件 A，明列每一項交付物的格式（例如 prompt 用 Markdown 文件、模型用 GGUF 或 SafeTensors 格式、資料集用 JSONL）。

資料隱私與合規能力：個資法、GDPR、AI Act

台灣個人資料保護法第 27 條要求企業對個資處理採取「適當之安全措施」，AI 訓練資料如果包含個資，廠商必須能說明資料流（data flow）、儲存位置、加密機制、權限控管。如果你的客戶有歐盟人或業務涉歐，還要考慮 EU AI Act（2024 年通過） 對「高風險 AI 系統」的合規要求，包括 risk assessment、conformity assessment、技術文件保存十年。

實務上，要請廠商出示三份文件：ISO 27001 或 SOC 2 認證（資安管理系統）、近三年的滲透測試報告、資料處理合約（DPA）範本。如果是金融、醫療、政府案場，還要加上行業特定合規（金管會 AI 治理原則、HIPAA、政府個資保護要點）。沒有這三份文件的廠商，碰到客戶端資安稽核會直接被打槍。

⚠️公開 LLM API 的個資外洩風險

如果廠商系統直接呼叫 OpenAI / Anthropic 的公開 API，預設情況下你的 prompt 內容會傳到美國伺服器。雖然主流廠商承諾「API 資料不用於訓練」，但這仍不等於符合台灣個資法的「跨境傳輸告知」要求。要嘛要求廠商使用 Azure OpenAI（資料留存區可選）、AWS Bedrock，要嘛在系統前面加一層「個資去識別化中介層」。簽約前一定要問清楚資料路由路徑。

真實落地案例 vs 行銷話術：PPT 太多就是紅旗

AI 客製化的廠商行銷簡報幾乎都長得一樣——大標題寫「我們已經服務 100 家企業」，內頁列一堆品牌 logo，但細看才發現大部分是 POC、demo、教育訓練、PoC 階段的合作，真正進入 production、有 user 實際每天在用的案例可能不到三個。

簡單的判讀方法：請廠商提供「production case study」三個，每個要包含上線時間、月活使用者數、AI 輸出量、效益數字（時間節省、錯誤率下降、營收增加）。廠商若說「客戶要求保密不能公開」，可以接受，但至少要能提供「同產業匿名化版本 + 客戶端聯絡人讓你直接 reference call」。連 reference call 都安排不出來的廠商，那 100 家品牌 logo 大概九成是 demo level。我們在 AI 系統導入 ROI 場景分析 裡有提到，能拿出 production case 細節的廠商比例大約只有 15-20%。

AI 故障 SLA 與 hallucination 責任：傳統 SLA 不夠用

傳統軟體的 SLA 寫「99.5% uptime、4 小時內回應」就完事，AI 系統完全不夠。AI 故障有三種獨特模式：模型回應變慢（latency degradation）、回應品質下降（quality drift）、hallucination 比例上升（factuality drop）。這三種狀況系統還是「在跑」，傳統 uptime SLA 完全偵測不到。

一份夠用的 AI SLA 至少要包含：hallucination 率上限（例如 < 3% on 標準測試集）、回應 latency 95th percentile（例如 < 5 秒）、品質 drift 監測機制（每月跑一次 evaluation）、責任歸屬條款（如果 AI 給出錯誤建議導致客戶損失，誰負責）。最後一條最重要也最容易被廠商規避——很多合約寫「AI 輸出僅供參考，最終決策由用戶判斷」，這句話等於「出事我不負責」。要爭取的版本是「廠商保證 hallucination 率不超過 X%，超過視為違約並啟動賠償條款」。

簽署 AI 開發合約，桌上有筆與文件

迭代與維運成本透明度：報價單後面的隱形數字

我們在 AI 客製化費用結構與隱藏成本 裡面拆得很細，這裡只講選 vendor 時要看的訊號。第一個訊號是「三年 TCO 試算表」——好的廠商會主動給你開發費 + 第一年維運費 + 第二三年預估費的完整表，包含 token 用量假設、retrain 頻率、模型升級成本。第二個訊號是「token 用量保證上限」——很多廠商初期不寫 token 上限，等你上線量大了才告訴你「超過要加錢」。要爭取的條款是「第一年 token 用量保證 X 百萬以下，超過按 Y 元/百萬 token 線性計費」，把單價寫死。

第三個訊號是「retrain / 模型版本升級的計費方式」。基礎模型每六個月大改版一次，舊版 prompt 在新版本上可能要重調。廠商如果每次改版都跟你收一筆「適配費」，三年下來可能多付一倍。爭取的版本是「每年含一次免費 major version 升級，含 prompt 重新調校與 regression test」。

團隊組成：純 ML 顧問 vs 完整工程團隊

AI 系統能不能上線、能不能穩定，跟廠商團隊組成的關係比想像中大。一個能交付 production AI 系統的團隊至少要有四種角色：

角色	負責什麼	為什麼缺不可
ML / Prompt 工程師	模型選型、prompt 設計、fine-tune	AI 核心，決定品質
資料工程師	資料管線、ETL、向量資料庫	髒資料是 AI 失敗主因第一名
後端工程師	API、權限、整合既有系統	AI 不能孤立，要跟 ERP/CRM 串
產品 / UX 設計	互動流程、錯誤處理、user feedback loop	AI 體驗差，user 不會用

純 ML 顧問公司常常缺後三種角色，結果做出來的東西跑得動但接不上你的系統，或是 AI 很強但 user 找不到入口。對 SME 來說，找一個齊備四種角色的中型團隊（30-80 人），會比找純 ML 顧問 + 自己找後端外包來拼，要省事很多。

合約必看 7 條款：簽約前一定要逐條對照

評估維度通過了，到了簽約階段，魔鬼藏在合約細節。下面這 7 條是過去三年我們協助客戶談 AI 合約最常修改、也最容易被廠商「不寫」的條款。建議印一份對照清單，逐條跟廠商法務確認。

條款	標準寫法（綠燈）	風險寫法（紅旗）
模型版本變更通知	廠商升級基礎模型須提前 30 天書面通知並提供 regression test 報告	廠商保留隨時更新模型之權利
Token / API 計費透明	明列單價、月度上限、超用按線性計費，每月提供用量報表	「依實際用量計費」無單價條款
Hallucination 責任歸屬	廠商保證錯誤率 < X%，超過啟動賠償（金額或免費修正）	AI 輸出僅供參考，廠商不負責
資料外洩通報時限	發現外洩 24 小時內通知客戶，72 小時內完整報告	依個資法規定處理
合約終止資料刪除	30 天內刪除所有客戶資料並提供第三方稽核證明	依雙方協議處理
智財權歸屬	程式碼/模型/prompt/訓練資料 ownership 全歸客戶	雙方共有 / 廠商保留再利用權
第三方依賴揭露	完整列出 OpenAI/Anthropic/Google API key 等依賴與成本	未揭露第三方

條款一：模型版本變更通知

OpenAI 在 2024 年 GPT-4 改版時，全球至少 30% 的 production prompt 出現品質倒退，部分案場 hallucination 率從 2% 暴增到 11%。如果廠商沒有「升級前通知」條款，你會在某天早上發現系統突然亂答問題，找廠商才知道昨晚悄悄換了模型版本。具體建議寫法：「凡涉及基礎模型 major version 升級，廠商應於升級前 30 個工作日書面通知客戶，並附上 regression test 報告，客戶有權延遲升級或要求廠商先進行 prompt 適配。」

條款二：Token / API 用量計費透明

這是最常踩坑的地方。一個 AI 客服系統初期 demo 可能每月 token 費用只要兩萬，正式上線量大後可能變五十萬，廠商如果沒寫單價，可以直接標出三倍利潤。要求合約寫死：基礎模型單價（按廠商實際採購價加 N% margin）、月度 token 包額度、超用按 X 元 / 1M tokens 線性計費、每月 25 號前提供前一月詳細用量報表（含 prompt token、completion token、模型版本、call 來源）。

條款三：Hallucination / 錯誤輸出責任歸屬

這是合約攻防最激烈的一條。廠商一定會堅持「AI 本質有不確定性，輸出僅供參考」，這在法律上不算錯，但實務上對客戶極度不利。折衷的版本是分級責任：廠商保證在「商定的測試集」上 hallucination 率不超過 X%（通常 3-5%），超過視為品質違約，啟動三級補救——先調校 prompt（30 天內）、調整模型（60 天內）、退費（達不到則退還該模組費用）。最後一級是談判重點，廠商通常會抗拒，但能談下來等於拿到品質保證。

🚨千萬別簽這種「AI 免責條款」

如果合約裡有「客戶理解 AI 有不確定性，廠商不對任何 AI 輸出造成的損失負責」這種無限免責條款——直接拒簽。這等於廠商把所有風險甩給你，做爛了你還不能追究。可以接受「重大過失或故意」以外的責任限制，但不能完全免責。

條款四：資料外洩通報時限

台灣個資法施行細則第 22 條要求「發現個資外洩時應於 72 小時內通報」，但合約應該寫得比法令更嚴——24 小時內發現即通知、72 小時內提供初步分析報告、30 天內提供完整 root cause analysis。GDPR Article 33 也是 72 小時，但定義更明確（「成為知情者起算」），合約可以參照。違反通報義務的賠償條款也要寫清楚，避免廠商發現外洩後拖延。

條款五：合約終止後資料刪除證明

合約結束後，廠商手上你的資料怎麼處理？很多合約只寫「依雙方協議」，等於沒寫。要爭取的版本是：合約終止後 30 個工作日內，廠商須刪除所有客戶資料（含 backup、log、向量資料庫 embedding、模型 fine-tune checkpoint），並提供第三方稽核公司簽署的「資料銷毀證明」。沒有書面證明，等於沒刪——廠商保留你的資料，未來可能被用於 reference 訓練其他客戶模型。

條款六：智慧財產權歸屬

AI 客製化的智財權至少有四個物件要分別寫清楚：客製化程式碼（前端、後端、API）、fine-tune 模型權重、prompt 工程文件、訓練/評估資料集。每一項都要明確歸屬。標準綠燈版本是四項全歸客戶，廠商只保留「執行本合約所必要之使用權」。如果廠商堅持 prompt 是「他們的 know-how」要保留，可以折衷成「prompt 全文交付給客戶，廠商保留在不洩露客戶機密前提下用於開發類似系統的權利」——但要警覺，這已經在讓步區。

條款七：第三方依賴揭露

AI 客製化系統幾乎都依賴第三方——OpenAI、Anthropic、Google、Azure、AWS、Pinecone、Weaviate……廠商要在合約附件 B 中完整揭露所有依賴，包括服務名稱、API key 持有方、月度預估費用、SLA。為什麼？因為其中任何一個服務漲價、停服、政策變更，都會直接影響你的系統。OpenAI 在 2023-2024 兩年內 API 價格調整過 4 次，沒有揭露的客戶常常莫名其妙被加價。

雙方代表握手達成 AI 開發合作協議

12 個紅旗訊號 vs 綠燈訊號：第一次提案會議就能判斷

評分卡和合約都是後段才用得到，第一次提案會議怎麼快速篩選？下面這份訊號清單是我們實際在篩 vendor 用的。提案會議全程 60-90 分鐘，紅旗訊號出現 3 個以上的廠商，回去就可以淘汰；綠燈訊號出現 5 個以上的，可以進入第二輪深談。

項目	紅旗訊號	綠燈訊號
AI 落地案例	PPT 多但要不到 production case 數據	現場開電腦給你看實際運行系統與用量
技術深度	回答都很「正面」沒有風險討論	主動講出三種會失敗的場景與緩解方式
團隊出席	業務 + PM，工程師掛 Zoom 不發言	ML 工程師現場、能即時回答 prompt 設計細節
合約態度	「合約我們有標準版」「不能改」	願意逐條討論，提供修改版時程
資料 ownership	「這個合約裡都會處理」（沒給細節）	主動拿出 ownership 分層說明簡報
費用報價	一張總價，沒拆 token / retrain / 維運	三年 TCO 試算表 + 假設條件清單
timeline 承諾	「兩個月可以上線」（沒提資料準備期）	標準 4-6 個月，含 POC、staging、production 三階段
前段廠商比較	貶低同業 / 不願意比較	客觀指出自己 vs 同業強弱項
技術選型	全部都是「我們自研框架」	說明何時用 OpenAI、何時自架 open-source
客戶 reference	「客戶要求保密都不能透露」	主動提供 2-3 個 reference call 聯絡人
失敗經驗	「我們從沒失敗過」	主動分享 1-2 個踩坑案例與學到的事
售後維運	「上線後我們也會繼續支援」（口頭）	完整 maintenance SLA 文件 + 三年 roadmap

ℹ️做一份「同樣的問題問三家」清單

提案會議每家用同樣的 10-15 個問題去問，把答案寫進對照表。例如：「token 用量超過合約上限怎麼計費？」「合約終止後 prompt 文件怎麼交付？」「上次 OpenAI 改版你們怎麼處理？」答案差異會比 PPT 簡報更有判斷力。我們把這份清單整理成 AI Vendor 提案會議 15 問，可以直接索取。

vendor 評估決策樹：對應你的場景挑廠商

不同場景需要不同類型的廠商。下面這張決策樹整理了三個常見維度——預算規模、AI 在系統中的核心程度、資料敏感度——幫你快速對應該找哪一類廠商。

圖表載入中…

這張圖只是粗略分類，實際評估還要疊加產業經驗（製造、零售、金融、醫療各有專長廠商）、技術 stack 偏好（重視自有 infra 還是雲端服務）、長期合作意願（一次性案件 vs 戰略合作）。把這三層條件加進去，候選廠商通常會收斂到 3-5 家，再用前面的評分卡逐一打分。

4 種典型場景：照場景對應 vendor 類型

理論講太多會抽象，最後給四個我們實際接觸過的典型場景，看你的狀況比較像哪一個，直接套用建議。

場景一：傳產製造，預算 150-300 萬，要做報價自動化

這類客戶的關鍵在於整合能力，而不在 AI 模型本身有多強——能不能接 ERP、能不能解析工程圖、能不能應對複雜規格才是重點。建議找「有製造業 production case」的中型團隊，避開純 ML 顧問。重點檢查項目：報價系統有沒有跟 ERP 對接過、能不能處理 Excel 多 sheet 規格表、AI 給錯規格的責任怎麼承擔。預算建議分配：開發 60%、第一年維運 25%、培訓 15%。

場景二：電商零售，預算 80-200 萬，要做 AI 客服

AI 客服坑最多——hallucination 給錯訂單資訊、語氣不對嚇跑客人、整合不了既有的客服工單系統。建議找「有 AI 客服 production case + 電商整合經驗」的廠商，特別注意 hallucination SLA 條款（客服場景錯一句話可能就是退款 + 客訴）。技術上要問清楚：用 RAG 還是 fine-tune？知識庫怎麼更新？多輪對話怎麼處理？這個場景在 中小企業 AI 系統導入 ROI 場景 裡有 ROI 試算範例。

場景三：金融保險，預算 500 萬以上，要做合規審查或核保輔助

這類案場資料敏感度極高，廠商必須具備 ISO 27001 + SOC 2 + 金融業實戰經驗。資料絕對不能流出國（不能用公開 OpenAI API），通常要自架 LLM（Llama 3 70B 或 Mistral）或用 Azure OpenAI 的台灣 region。合約上要加上「金管會 AI 治理原則合規承諾」、「跨境資料流出限制」、「主管機關稽核配合義務」。預算分配：合規 + 資安投入會比一般案場多 30-40%。

場景四：SaaS 產品要加 AI 功能，預算 300-600 萬

SaaS 加 AI 跟做客製化系統不一樣——你要的是長期合作的技術 partner，能跟著產品迭代，而非一次性交付完就走的廠商。這類案場建議直接找有 SaaS 自有產品的 AI 團隊（他們懂 product 思維，不只懂技術），合約結構也應該從「專案驗收」改成「retainer 月費 + 績效獎金」。重點談判項目：product roadmap 對齊、bug fix SLA、用量隨產品成長的計費階梯。可以參考 SaaS vs 客製化系統比較 與 系統上線後的第一年維運指南 的合作模式建議。

AI vendor vs 一般軟體 vendor 差異對照

最後一張對照表整理 AI vendor 跟一般軟體 vendor 在 12 個維度上的差異。如果你之前選軟體公司的經驗很豐富，這張表會幫你快速 update 思維。如何選軟體開發公司（傳統軟體版本） 補充了傳統軟體 vendor 的選擇邏輯，工廠系統 SaaS vs 客製化決策框架 則是製造業特定情境的延伸閱讀。

維度	一般軟體 vendor	AI vendor
核心交付物	程式碼 + 文件	程式碼 + 模型 + prompt + 資料集 + 評估方法
TCO 結構	開發 65% / 維運 35%	開發 30% / 維運 70%
驗收標準	功能對 spec、bug 數量	功能 + 模型品質指標 + hallucination 率
SLA 重點	uptime + 回應時間	uptime + 品質 drift + hallucination 率
智財重點	程式碼 ownership	程式碼 + 模型 + prompt + 資料 ownership
團隊角色	前端/後端/PM/QA	上述 + ML / 資料工程 / Prompt 工程
第三方依賴	資料庫、cloud	上述 + LLM API + 向量資料庫 + embedding 模型
合約週期	一次性 + 維護年費	建議 retainer + 績效獎金
升級風險	框架版本升級（每 2-3 年）	模型版本升級（每 6 個月）
合規重點	個資法、資安基本	上述 + AI Act + 演算法治理
失敗模式	需求不清、進度落後	資料品質、hallucination、user 不會用
合作關係	甲方 / 乙方	技術 partner，需要長期共同迭代

最大的差異其實在最後一行——AI 客製化更像是「招募一個外部 AI 部門」，跟傳統「下單買軟體」的甲乙方思維完全是兩回事。這個心態轉變如果沒做到，前面所有的評估維度、合約條款都會在實作時被現實打臉。

常見問題：客戶在簽約前最常問的 6 個問題

Q我們公司沒人懂 AI，怎麼判斷廠商技術好不好？

找一個第三方 AI 顧問做 vendor 體檢是最快的方式（費用通常 5-15 萬），可以省掉幾百萬的學費。如果沒預算，至少做兩件事：一、要求廠商提供 3 個 production case 的 reference call；二、把廠商的提案給其他兩家廠商看，請他們指出技術選型上的疑慮——廠商之間互相 review 比你自己看 PPT 有用得多。

QAI 系統做完之後，可以自己接手維運嗎？

理論上可以，實務上很難。AI 系統的維運需要持續監控模型表現、處理 user feedback、retrain、prompt 調校，這些工作需要 ML 知識。建議至少前兩年仍由原廠商或專業團隊維運，內部慢慢培養 1-2 個能 handle 的工程師。如果要走「完全內製」路線，合約裡要寫明「廠商提供完整 knowledge transfer 與 6 個月 hand-over 期」。

Q廠商說「我們用的是最新 GPT-5」，這算優點嗎？

不一定。最新模型不代表最適合，反而可能 token 成本高 3-5 倍、API 不穩定（剛出時）、prompt 經驗少。成熟的廠商會根據場景選模型——簡單分類用便宜的 GPT-4o-mini 或 Claude Haiku，複雜推理才用 GPT-5 或 Claude Opus。如果廠商一律推「最新最強」模型，要警覺是不是想拉高 token 費抽成。

Q簽約前可以要求 POC 嗎？費用怎麼算？

強烈建議要求 POC，費用通常 30-80 萬（2-4 週週期）。POC 階段就能看出廠商實力——能不能在你的真實資料上跑出 demo、能不能誠實說明限制、報告寫得好不好。POC 費用可以談「正式簽約後折抵 50-100%」，廠商如果自信通常願意接受。POC 不通過直接放棄這家，遠比簽完約才發現做不出來便宜。

Q廠商要我簽 NDA 才能看 case，合理嗎？

看 case 細節要簽 NDA 是合理的，但「不能透露任何客戶名」有點奇怪——大公司案場通常經客戶同意可以揭露 logo 或產業類別。如果廠商連產業都不肯說，可能是 case 數量比宣稱的少很多。折衷做法：簽 NDA 後請廠商列出 production case 清單（含產業、規模、時間），看看跟你的 PPT 對得上嗎。

Q如果中途想換廠商，怎麼把舊系統的東西搬走最順？

這要從簽約那天就規劃。合約裡寫清楚「資料、模型、prompt、評估資料集」的交付格式（建議是業界標準格式：資料 JSONL/CSV、模型 GGUF/SafeTensors、prompt Markdown、API spec OpenAPI 3.0）。中途換廠商時，先讓新廠商以「審計」名義 review 舊系統 2 週，產出 migration plan，再正式切換。中間建議有 2-4 週並行期，舊系統繼續運作直到新系統穩定。

下一步：免費 vendor 體檢與 AI 顧問諮詢

選 AI 廠商不是一張評分卡可以涵蓋的事。每家公司的產業、資料、合規、預算結構都不同，同樣的廠商在 A 公司是綠燈、在 B 公司可能是紅旗。如果你正在評估 AI 客製化案，或者已經簽了約但對合約細節有疑慮，自由揚提供免費的 vendor 體檢服務——我們會看你的提案、合約、廠商報告，給出客觀第三方意見。

沒有業務話術，沒有要你換成我們做。我們做過自己的 AI 案，也在客製化系統諮詢中看過不少同業的提案，分得出什麼是真功夫、什麼是包裝得好的話術。立刻預約 30 分鐘免費 AI 顧問諮詢，把你目前的提案或合約寄給我們，我們會在 3 個工作日內回覆完整體檢報告。

延伸閱讀：完整框架看 客製化 AI 系統開發完整指南、費用全拆解看 AI 客製化費用結構與隱藏成本、ROI 試算看 中小企業 AI 系統導入 ROI 場景、傳統軟體 vendor 標準看 如何選軟體開發公司？7 個評估標準。

分享文章

自

AUTHOR

自由揚John

查看作者頁