AI 客製化開發公司評估與合約條款指南封面

怎麼選客製化 AI 系統開發公司?7 個評估標準與合約必看條款

自由揚John24 分鐘閱讀
複製引文
AI 客製化開發公司評估與合約條款指南封面
AI 客製化開發公司評估與合約條款指南封面

大部分台灣中小企業真正在比的是「誰最便宜」,而非「誰做得好」。這是台灣 AI 客製化外包失敗率破 50% 的根本原因——而你正在重蹈覆轍。

這句話我寫得很重,但攤開資料看其實還算保守。BCG 2025 年的全球 AI 落地調查 顯示,全球只有 26% 的企業能把 AI 從 POC 推到實際產生 ROI 的階段;MIT Sloan 與 BCG 的聯合研究 更直接點名「廠商選擇與合約結構」是排名第二的失敗主因,僅次於「資料品質」。問題從來不在 AI 不夠強,而在簽約那一刻就埋好了引爆點。

我們從 2023 年開始幫企業做 AI 客製化,看過太多老闆把選 AI vendor 當成選一般軟體外包來談——比三家、看 PPT、選最便宜的。三個月後 demo 出問題,回頭翻合約才發現:模型不是你的、訓練資料 ownership 沒寫清、廠商說 hallucination 是 AI 本質不是 bug、token 費用變成無底洞。當你想換廠商重做,發現整套 prompt 工程沒有交付,等於砍掉重練。

這篇文章會帶你拆解 7 個非看不可的評估維度、合約裡 7 條最容易被忽略的條款,再給你紅旗 vs 綠燈訊號清單,最後用一張決策樹幫你對應自己的場景。看完之後,你下一次跟 AI 廠商開會的姿勢會完全不一樣。

這篇文章是「客製化 AI 系統開發」主題群的 Spoke C,專注 vendor 評估維度。如果你還沒看過完整流程框架,先看 客製化 AI 系統開發完整指南;如果想看費用拆解,這裡有 AI 客製化費用結構與隱藏成本;如果想知道導入後 ROI 怎麼算,中小企業 AI 系統導入 ROI 場景 給你 4 種常見場景的回收期計算。傳統軟體 vendor 的評估標準(程式品質、UX、敏捷流程)這篇不重複談,請看 如何選軟體開發公司?7 個評估標準

為什麼比三家、選最便宜,是 AI 外包最貴的決策

傳統軟體外包,比三家、看作品集、挑最便宜的,這套邏輯在 ERP、CRM、官網案場上跑了二十年都沒問題。換到 AI 客製化,這套全部失靈。原因很現實——AI 系統的成本不在「開發完那一刻」,而在「上線之後」。

一個典型的傳統軟體案,開發費佔總擁有成本(TCO)大約 60-70%,後續維運佔 30-40%。AI 客製化反過來——開發費可能只佔 TCO 的 30%,剩下 70% 都在資料更新、模型 retrain、token 費用、prompt 調整、hallucination 修正、合規維護。Gartner 在 2025 年的 AI Hype Cycle 報告 直接點出,企業低估 AI TCO 的平均幅度是 2.4 倍,主要落在運營階段。

這代表什麼?選一個開發費便宜 30% 的廠商,後面隱藏成本可能讓你多付 200%。比三家的時候比的明明是同一個系統,但每家的「開發完之後」差異大到像不同物種。有的把 prompt 工程藏起來不交付,有的把 retrain 列成額外服務按次計費,有的把 token 用量打包進「優惠價」其實不含 GPT-4 等級模型——這些藏在報價單沒寫的細節,才是真正決定你三年後付多少錢的關鍵。

迷思一:「AI 系統做完就是做完了」

AI 系統不像 ERP 上線之後可以放著跑五年。模型背後依賴的基礎模型(GPT-4、Claude、Gemini)每三到六個月就會大版本更新,廠商的 prompt 在新版本上的表現可能完全不同。資料分布也會漂移——你公司今年的客戶問題、產品線、組織架構跟去年都不一樣,模型如果沒 retrain 就會慢慢失準,Stanford HAI 2025 AI Index 統計的「production AI 模型平均使用壽命」只有 18 個月。

迷思二:「能 demo 就能上線」

廠商現場 demo 的成功率,跟正式上線後三個月的成功率差距常常超過 30 個百分點。Demo 環境是 cherry-pick 過的最佳案例,正式環境會碰到 edge case、髒資料、權限問題、user 各種你沒想過的問法。對口廠商該做的事很簡單:直接給你一個 staging 環境讓你實測一週。如果他不肯,這就是第一個紅旗。

想跳過踩坑直接拿到評估清單?

我們把這篇文章的 7 維度評分卡 + 合約 7 條款 checklist 整理成一份免費 PDF,附 8 個典型紅旗訊號的判讀範例。聯絡 自由揚 AI 顧問服務,我們會直接寄給你,並提供一次免費 30 分鐘的 vendor 體檢諮詢。

迷思三:「找大公司比較安全」

大顧問公司在 AI 客製化案上經常出現一個結構性問題——前期 partner 出席提案,簽約後實際執行的是入行三年的 consultant 帶兩個 intern。AI 不是傳統 IT 案件,可以靠標準化方法論帶人;它高度仰賴 senior 工程師對模型行為、prompt 設計、資料管線的直覺判斷。在台灣市場上,反而有 AI 落地經驗的中型團隊(30-80 人,創辦人本身有實作經驗)成功率明顯較高。Forrester 2025 AI Services Wave 也指出,AI 落地專案中「資深工程師參與比例」是最強的成功預測指標。

7 個評估維度評分卡:照這份打分,比看 PPT 更可靠

這是一張我們實際在幫客戶做 vendor 體檢時用的評分卡。每個維度滿分 10 分,總分 70 分。低於 45 分的廠商,不論報價多便宜都建議直接淘汰;45-55 分可以列入備選但要逐項補強;55 分以上才有實質討論的價值。

維度

權重

綠燈訊號(高分)

紅旗訊號(低分)

資料 ownership

10%

合約明訂訓練資料、衍生模型、產出全部歸客戶

只寫「依雙方協議」、廠商保留再利用權

模型 ownership

15%

終止合約可帶走完整模型權重 + prompt

宣稱「模型是廠商技術機密」

資料合規能力

15%

ISO 27001 / SOC 2 / 個資法落地經驗

「我們有處理過」(拿不出文件)

真實落地案例

15%

有 3 個以上同產業 production case + 客戶推薦

PPT 一堆 logo 但要不到 case 細節

AI 故障 SLA

15%

hallucination 率 SLA + 應變時限 + 賠償條款

傳統 uptime SLA、輸出僅供參考

維運成本透明度

15%

三年 TCO 試算表 + token 用量上限保證

報價單只有開發費

團隊組成

15%

資料工程 + ML + 後端 + 產品 4 種角色齊全

純 ML 顧問 / 業務多於工程師

評分卡只是起點,每個維度背後的判斷邏輯才是關鍵。下面 7 個 H3 段落會一個一個拆給你看。

企業主與 AI 開發團隊在會議室審視合約
企業主與 AI 開發團隊在會議室審視合約

資料 ownership:你以為是你的,可能不是你的

AI 客製化案件最常見的爭議都從這裡開始——「訓練資料是誰的」、「衍生模型是誰的」、「使用 LLM 之後產出的內容是誰的」。傳統軟體合約只要寫「程式碼歸客戶」就解決 90% 的智財問題;AI 合約如果只寫這一條,等於什麼都沒寫。

具體要釐清的是三層:第一層是「你給廠商的訓練資料」(你公司的客戶資料、產品手冊、過往報價單),合約必須明訂這層資料用途僅限本案、不得用於訓練廠商其他客戶的模型、合約終止後 30 天內銷毀並提供書面證明。第二層是「廠商 fine-tune 出來的模型權重」,這層 ownership 要寫死歸客戶;第三層是「使用 AI 系統後產出的內容」(例如生成的文案、報價、回信),如果客戶要拿這些再去訓練自己的下一代模型,廠商不能阻擋。OECD AI Principles 2024 更新版 把這三層通稱為「AI 資料價值鏈」,建議都要逐層寫進合約。

模型 ownership 與 vendor lock-in:你能不能搬家

我看過最誇張的案例,是一家製造業客戶花了 380 萬請 AI 公司做客製化報價系統。三年後系統表現開始走下坡,老闆想換廠商重做,原廠商說:「prompt 是我們的 know-how,不交付。」客戶當場傻眼——所謂的客製化系統,核心其實是 50 個精心調校的 prompt,prompt 拿不走等於什麼都沒留下。

簽約前一定要問清楚四件事:模型權重(如果有 fine-tune)有沒有交付?prompt 工程文件有沒有完整交付?訓練/評估用的資料集 ownership 在誰手上?API key、工具串接、RAG 知識庫的 schema 文件有沒有交付?四個答案缺一個都會讓你變成 vendor 的「模型人質」。具體做法是把「合約終止交付清單」寫成附件 A,明列每一項交付物的格式(例如 prompt 用 Markdown 文件、模型用 GGUF 或 SafeTensors 格式、資料集用 JSONL)。

資料隱私與合規能力:個資法、GDPR、AI Act

台灣個人資料保護法第 27 條要求企業對個資處理採取「適當之安全措施」,AI 訓練資料如果包含個資,廠商必須能說明資料流(data flow)、儲存位置、加密機制、權限控管。如果你的客戶有歐盟人或業務涉歐,還要考慮 EU AI Act(2024 年通過) 對「高風險 AI 系統」的合規要求,包括 risk assessment、conformity assessment、技術文件保存十年。

實務上,要請廠商出示三份文件:ISO 27001 或 SOC 2 認證(資安管理系統)、近三年的滲透測試報告、資料處理合約(DPA)範本。如果是金融、醫療、政府案場,還要加上行業特定合規(金管會 AI 治理原則、HIPAA、政府個資保護要點)。沒有這三份文件的廠商,碰到客戶端資安稽核會直接被打槍。

⚠️公開 LLM API 的個資外洩風險

如果廠商系統直接呼叫 OpenAI / Anthropic 的公開 API,預設情況下你的 prompt 內容會傳到美國伺服器。雖然主流廠商承諾「API 資料不用於訓練」,但這仍不等於符合台灣個資法的「跨境傳輸告知」要求。要嘛要求廠商使用 Azure OpenAI(資料留存區可選)、AWS Bedrock,要嘛在系統前面加一層「個資去識別化中介層」。簽約前一定要問清楚資料路由路徑。

真實落地案例 vs 行銷話術:PPT 太多就是紅旗

AI 客製化的廠商行銷簡報幾乎都長得一樣——大標題寫「我們已經服務 100 家企業」,內頁列一堆品牌 logo,但細看才發現大部分是 POC、demo、教育訓練、PoC 階段的合作,真正進入 production、有 user 實際每天在用的案例可能不到三個。

簡單的判讀方法:請廠商提供「production case study」三個,每個要包含上線時間、月活使用者數、AI 輸出量、效益數字(時間節省、錯誤率下降、營收增加)。廠商若說「客戶要求保密不能公開」,可以接受,但至少要能提供「同產業匿名化版本 + 客戶端聯絡人讓你直接 reference call」。連 reference call 都安排不出來的廠商,那 100 家品牌 logo 大概九成是 demo level。我們在 AI 系統導入 ROI 場景分析 裡有提到,能拿出 production case 細節的廠商比例大約只有 15-20%。

AI 故障 SLA 與 hallucination 責任:傳統 SLA 不夠用

傳統軟體的 SLA 寫「99.5% uptime、4 小時內回應」就完事,AI 系統完全不夠。AI 故障有三種獨特模式:模型回應變慢(latency degradation)、回應品質下降(quality drift)、hallucination 比例上升(factuality drop)。這三種狀況系統還是「在跑」,傳統 uptime SLA 完全偵測不到。

一份夠用的 AI SLA 至少要包含:hallucination 率上限(例如 < 3% on 標準測試集)、回應 latency 95th percentile(例如 < 5 秒)、品質 drift 監測機制(每月跑一次 evaluation)、責任歸屬條款(如果 AI 給出錯誤建議導致客戶損失,誰負責)。最後一條最重要也最容易被廠商規避——很多合約寫「AI 輸出僅供參考,最終決策由用戶判斷」,這句話等於「出事我不負責」。要爭取的版本是「廠商保證 hallucination 率不超過 X%,超過視為違約並啟動賠償條款」。

簽署 AI 開發合約,桌上有筆與文件
簽署 AI 開發合約,桌上有筆與文件

迭代與維運成本透明度:報價單後面的隱形數字

我們在 AI 客製化費用結構與隱藏成本 裡面拆得很細,這裡只講選 vendor 時要看的訊號。第一個訊號是「三年 TCO 試算表」——好的廠商會主動給你開發費 + 第一年維運費 + 第二三年預估費的完整表,包含 token 用量假設、retrain 頻率、模型升級成本。第二個訊號是「token 用量保證上限」——很多廠商初期不寫 token 上限,等你上線量大了才告訴你「超過要加錢」。要爭取的條款是「第一年 token 用量保證 X 百萬以下,超過按 Y 元/百萬 token 線性計費」,把單價寫死。

第三個訊號是「retrain / 模型版本升級的計費方式」。基礎模型每六個月大改版一次,舊版 prompt 在新版本上可能要重調。廠商如果每次改版都跟你收一筆「適配費」,三年下來可能多付一倍。爭取的版本是「每年含一次免費 major version 升級,含 prompt 重新調校與 regression test」。

團隊組成:純 ML 顧問 vs 完整工程團隊

AI 系統能不能上線、能不能穩定,跟廠商團隊組成的關係比想像中大。一個能交付 production AI 系統的團隊至少要有四種角色:

角色

負責什麼

為什麼缺不可

ML / Prompt 工程師

模型選型、prompt 設計、fine-tune

AI 核心,決定品質

資料工程師

資料管線、ETL、向量資料庫

髒資料是 AI 失敗主因第一名

後端工程師

API、權限、整合既有系統

AI 不能孤立,要跟 ERP/CRM 串

產品 / UX 設計

互動流程、錯誤處理、user feedback loop

AI 體驗差,user 不會用

純 ML 顧問公司常常缺後三種角色,結果做出來的東西跑得動但接不上你的系統,或是 AI 很強但 user 找不到入口。對 SME 來說,找一個齊備四種角色的中型團隊(30-80 人),會比找純 ML 顧問 + 自己找後端外包來拼,要省事很多。

合約必看 7 條款:簽約前一定要逐條對照

評估維度通過了,到了簽約階段,魔鬼藏在合約細節。下面這 7 條是過去三年我們協助客戶談 AI 合約最常修改、也最容易被廠商「不寫」的條款。建議印一份對照清單,逐條跟廠商法務確認。

條款

標準寫法(綠燈)

風險寫法(紅旗)

模型版本變更通知

廠商升級基礎模型須提前 30 天書面通知並提供 regression test 報告

廠商保留隨時更新模型之權利

Token / API 計費透明

明列單價、月度上限、超用按線性計費,每月提供用量報表

「依實際用量計費」無單價條款

Hallucination 責任歸屬

廠商保證錯誤率 < X%,超過啟動賠償(金額或免費修正)

AI 輸出僅供參考,廠商不負責

資料外洩通報時限

發現外洩 24 小時內通知客戶,72 小時內完整報告

依個資法規定處理

合約終止資料刪除

30 天內刪除所有客戶資料並提供第三方稽核證明

依雙方協議處理

智財權歸屬

程式碼/模型/prompt/訓練資料 ownership 全歸客戶

雙方共有 / 廠商保留再利用權

第三方依賴揭露

完整列出 OpenAI/Anthropic/Google API key 等依賴與成本

未揭露第三方

條款一:模型版本變更通知

OpenAI 在 2024 年 GPT-4 改版時,全球至少 30% 的 production prompt 出現品質倒退,部分案場 hallucination 率從 2% 暴增到 11%。如果廠商沒有「升級前通知」條款,你會在某天早上發現系統突然亂答問題,找廠商才知道昨晚悄悄換了模型版本。具體建議寫法:「凡涉及基礎模型 major version 升級,廠商應於升級前 30 個工作日書面通知客戶,並附上 regression test 報告,客戶有權延遲升級或要求廠商先進行 prompt 適配。」

條款二:Token / API 用量計費透明

這是最常踩坑的地方。一個 AI 客服系統初期 demo 可能每月 token 費用只要兩萬,正式上線量大後可能變五十萬,廠商如果沒寫單價,可以直接標出三倍利潤。要求合約寫死:基礎模型單價(按廠商實際採購價加 N% margin)、月度 token 包額度、超用按 X 元 / 1M tokens 線性計費、每月 25 號前提供前一月詳細用量報表(含 prompt token、completion token、模型版本、call 來源)。

條款三:Hallucination / 錯誤輸出責任歸屬

這是合約攻防最激烈的一條。廠商一定會堅持「AI 本質有不確定性,輸出僅供參考」,這在法律上不算錯,但實務上對客戶極度不利。折衷的版本是分級責任:廠商保證在「商定的測試集」上 hallucination 率不超過 X%(通常 3-5%),超過視為品質違約,啟動三級補救——先調校 prompt(30 天內)、調整模型(60 天內)、退費(達不到則退還該模組費用)。最後一級是談判重點,廠商通常會抗拒,但能談下來等於拿到品質保證。

🚨千萬別簽這種「AI 免責條款」

如果合約裡有「客戶理解 AI 有不確定性,廠商不對任何 AI 輸出造成的損失負責」這種無限免責條款——直接拒簽。這等於廠商把所有風險甩給你,做爛了你還不能追究。可以接受「重大過失或故意」以外的責任限制,但不能完全免責。

條款四:資料外洩通報時限

台灣個資法施行細則第 22 條要求「發現個資外洩時應於 72 小時內通報」,但合約應該寫得比法令更嚴——24 小時內發現即通知、72 小時內提供初步分析報告、30 天內提供完整 root cause analysis。GDPR Article 33 也是 72 小時,但定義更明確(「成為知情者起算」),合約可以參照。違反通報義務的賠償條款也要寫清楚,避免廠商發現外洩後拖延。

條款五:合約終止後資料刪除證明

合約結束後,廠商手上你的資料怎麼處理?很多合約只寫「依雙方協議」,等於沒寫。要爭取的版本是:合約終止後 30 個工作日內,廠商須刪除所有客戶資料(含 backup、log、向量資料庫 embedding、模型 fine-tune checkpoint),並提供第三方稽核公司簽署的「資料銷毀證明」。沒有書面證明,等於沒刪——廠商保留你的資料,未來可能被用於 reference 訓練其他客戶模型。

條款六:智慧財產權歸屬

AI 客製化的智財權至少有四個物件要分別寫清楚:客製化程式碼(前端、後端、API)、fine-tune 模型權重、prompt 工程文件、訓練/評估資料集。每一項都要明確歸屬。標準綠燈版本是四項全歸客戶,廠商只保留「執行本合約所必要之使用權」。如果廠商堅持 prompt 是「他們的 know-how」要保留,可以折衷成「prompt 全文交付給客戶,廠商保留在不洩露客戶機密前提下用於開發類似系統的權利」——但要警覺,這已經在讓步區。

條款七:第三方依賴揭露

AI 客製化系統幾乎都依賴第三方——OpenAI、Anthropic、Google、Azure、AWS、Pinecone、Weaviate……廠商要在合約附件 B 中完整揭露所有依賴,包括服務名稱、API key 持有方、月度預估費用、SLA。為什麼?因為其中任何一個服務漲價、停服、政策變更,都會直接影響你的系統。OpenAI 在 2023-2024 兩年內 API 價格調整過 4 次,沒有揭露的客戶常常莫名其妙被加價。

雙方代表握手達成 AI 開發合作協議
雙方代表握手達成 AI 開發合作協議

12 個紅旗訊號 vs 綠燈訊號:第一次提案會議就能判斷

評分卡和合約都是後段才用得到,第一次提案會議怎麼快速篩選?下面這份訊號清單是我們實際在篩 vendor 用的。提案會議全程 60-90 分鐘,紅旗訊號出現 3 個以上的廠商,回去就可以淘汰;綠燈訊號出現 5 個以上的,可以進入第二輪深談。

項目

紅旗訊號

綠燈訊號

AI 落地案例

PPT 多但要不到 production case 數據

現場開電腦給你看實際運行系統與用量

技術深度

回答都很「正面」沒有風險討論

主動講出三種會失敗的場景與緩解方式

團隊出席

業務 + PM,工程師掛 Zoom 不發言

ML 工程師現場、能即時回答 prompt 設計細節

合約態度

「合約我們有標準版」「不能改」

願意逐條討論,提供修改版時程

資料 ownership

「這個合約裡都會處理」(沒給細節)

主動拿出 ownership 分層說明簡報

費用報價

一張總價,沒拆 token / retrain / 維運

三年 TCO 試算表 + 假設條件清單

timeline 承諾

「兩個月可以上線」(沒提資料準備期)

標準 4-6 個月,含 POC、staging、production 三階段

前段廠商比較

貶低同業 / 不願意比較

客觀指出自己 vs 同業強弱項

技術選型

全部都是「我們自研框架」

說明何時用 OpenAI、何時自架 open-source

客戶 reference

「客戶要求保密都不能透露」

主動提供 2-3 個 reference call 聯絡人

失敗經驗

「我們從沒失敗過」

主動分享 1-2 個踩坑案例與學到的事

售後維運

「上線後我們也會繼續支援」(口頭)

完整 maintenance SLA 文件 + 三年 roadmap

ℹ️做一份「同樣的問題問三家」清單

提案會議每家用同樣的 10-15 個問題去問,把答案寫進對照表。例如:「token 用量超過合約上限怎麼計費?」「合約終止後 prompt 文件怎麼交付?」「上次 OpenAI 改版你們怎麼處理?」答案差異會比 PPT 簡報更有判斷力。我們把這份清單整理成 AI Vendor 提案會議 15 問,可以直接索取。

vendor 評估決策樹:對應你的場景挑廠商

不同場景需要不同類型的廠商。下面這張決策樹整理了三個常見維度——預算規模、AI 在系統中的核心程度、資料敏感度——幫你快速對應該找哪一類廠商。

圖表載入中…

這張圖只是粗略分類,實際評估還要疊加產業經驗(製造、零售、金融、醫療各有專長廠商)、技術 stack 偏好(重視自有 infra 還是雲端服務)、長期合作意願(一次性案件 vs 戰略合作)。把這三層條件加進去,候選廠商通常會收斂到 3-5 家,再用前面的評分卡逐一打分。

4 種典型場景:照場景對應 vendor 類型

理論講太多會抽象,最後給四個我們實際接觸過的典型場景,看你的狀況比較像哪一個,直接套用建議。

場景一:傳產製造,預算 150-300 萬,要做報價自動化

這類客戶的關鍵在於整合能力,而不在 AI 模型本身有多強——能不能接 ERP、能不能解析工程圖、能不能應對複雜規格才是重點。建議找「有製造業 production case」的中型團隊,避開純 ML 顧問。重點檢查項目:報價系統有沒有跟 ERP 對接過、能不能處理 Excel 多 sheet 規格表、AI 給錯規格的責任怎麼承擔。預算建議分配:開發 60%、第一年維運 25%、培訓 15%。

場景二:電商零售,預算 80-200 萬,要做 AI 客服

AI 客服坑最多——hallucination 給錯訂單資訊、語氣不對嚇跑客人、整合不了既有的客服工單系統。建議找「有 AI 客服 production case + 電商整合經驗」的廠商,特別注意 hallucination SLA 條款(客服場景錯一句話可能就是退款 + 客訴)。技術上要問清楚:用 RAG 還是 fine-tune?知識庫怎麼更新?多輪對話怎麼處理?這個場景在 中小企業 AI 系統導入 ROI 場景 裡有 ROI 試算範例。

場景三:金融保險,預算 500 萬以上,要做合規審查或核保輔助

這類案場資料敏感度極高,廠商必須具備 ISO 27001 + SOC 2 + 金融業實戰經驗。資料絕對不能流出國(不能用公開 OpenAI API),通常要自架 LLM(Llama 3 70B 或 Mistral)或用 Azure OpenAI 的台灣 region。合約上要加上「金管會 AI 治理原則合規承諾」、「跨境資料流出限制」、「主管機關稽核配合義務」。預算分配:合規 + 資安投入會比一般案場多 30-40%。

場景四:SaaS 產品要加 AI 功能,預算 300-600 萬

SaaS 加 AI 跟做客製化系統不一樣——你要的是長期合作的技術 partner,能跟著產品迭代,而非一次性交付完就走的廠商。這類案場建議直接找有 SaaS 自有產品的 AI 團隊(他們懂 product 思維,不只懂技術),合約結構也應該從「專案驗收」改成「retainer 月費 + 績效獎金」。重點談判項目:product roadmap 對齊、bug fix SLA、用量隨產品成長的計費階梯。可以參考 SaaS vs 客製化系統比較系統上線後的第一年維運指南 的合作模式建議。

AI vendor vs 一般軟體 vendor 差異對照

最後一張對照表整理 AI vendor 跟一般軟體 vendor 在 12 個維度上的差異。如果你之前選軟體公司的經驗很豐富,這張表會幫你快速 update 思維。如何選軟體開發公司(傳統軟體版本) 補充了傳統軟體 vendor 的選擇邏輯,工廠系統 SaaS vs 客製化決策框架 則是製造業特定情境的延伸閱讀。

維度

一般軟體 vendor

AI vendor

核心交付物

程式碼 + 文件

程式碼 + 模型 + prompt + 資料集 + 評估方法

TCO 結構

開發 65% / 維運 35%

開發 30% / 維運 70%

驗收標準

功能對 spec、bug 數量

功能 + 模型品質指標 + hallucination 率

SLA 重點

uptime + 回應時間

uptime + 品質 drift + hallucination 率

智財重點

程式碼 ownership

程式碼 + 模型 + prompt + 資料 ownership

團隊角色

前端/後端/PM/QA

上述 + ML / 資料工程 / Prompt 工程

第三方依賴

資料庫、cloud

上述 + LLM API + 向量資料庫 + embedding 模型

合約週期

一次性 + 維護年費

建議 retainer + 績效獎金

升級風險

框架版本升級(每 2-3 年)

模型版本升級(每 6 個月)

合規重點

個資法、資安基本

上述 + AI Act + 演算法治理

失敗模式

需求不清、進度落後

資料品質、hallucination、user 不會用

合作關係

甲方 / 乙方

技術 partner,需要長期共同迭代

最大的差異其實在最後一行——AI 客製化更像是「招募一個外部 AI 部門」,跟傳統「下單買軟體」的甲乙方思維完全是兩回事。這個心態轉變如果沒做到,前面所有的評估維度、合約條款都會在實作時被現實打臉。

常見問題:客戶在簽約前最常問的 6 個問題

Q我們公司沒人懂 AI,怎麼判斷廠商技術好不好?

找一個第三方 AI 顧問做 vendor 體檢是最快的方式(費用通常 5-15 萬),可以省掉幾百萬的學費。如果沒預算,至少做兩件事:一、要求廠商提供 3 個 production case 的 reference call;二、把廠商的提案給其他兩家廠商看,請他們指出技術選型上的疑慮——廠商之間互相 review 比你自己看 PPT 有用得多。

QAI 系統做完之後,可以自己接手維運嗎?

理論上可以,實務上很難。AI 系統的維運需要持續監控模型表現、處理 user feedback、retrain、prompt 調校,這些工作需要 ML 知識。建議至少前兩年仍由原廠商或專業團隊維運,內部慢慢培養 1-2 個能 handle 的工程師。如果要走「完全內製」路線,合約裡要寫明「廠商提供完整 knowledge transfer 與 6 個月 hand-over 期」。

Q廠商說「我們用的是最新 GPT-5」,這算優點嗎?

不一定。最新模型不代表最適合,反而可能 token 成本高 3-5 倍、API 不穩定(剛出時)、prompt 經驗少。成熟的廠商會根據場景選模型——簡單分類用便宜的 GPT-4o-mini 或 Claude Haiku,複雜推理才用 GPT-5 或 Claude Opus。如果廠商一律推「最新最強」模型,要警覺是不是想拉高 token 費抽成。

Q簽約前可以要求 POC 嗎?費用怎麼算?

強烈建議要求 POC,費用通常 30-80 萬(2-4 週週期)。POC 階段就能看出廠商實力——能不能在你的真實資料上跑出 demo、能不能誠實說明限制、報告寫得好不好。POC 費用可以談「正式簽約後折抵 50-100%」,廠商如果自信通常願意接受。POC 不通過直接放棄這家,遠比簽完約才發現做不出來便宜。

Q廠商要我簽 NDA 才能看 case,合理嗎?

看 case 細節要簽 NDA 是合理的,但「不能透露任何客戶名」有點奇怪——大公司案場通常經客戶同意可以揭露 logo 或產業類別。如果廠商連產業都不肯說,可能是 case 數量比宣稱的少很多。折衷做法:簽 NDA 後請廠商列出 production case 清單(含產業、規模、時間),看看跟你的 PPT 對得上嗎。

Q如果中途想換廠商,怎麼把舊系統的東西搬走最順?

這要從簽約那天就規劃。合約裡寫清楚「資料、模型、prompt、評估資料集」的交付格式(建議是業界標準格式:資料 JSONL/CSV、模型 GGUF/SafeTensors、prompt Markdown、API spec OpenAPI 3.0)。中途換廠商時,先讓新廠商以「審計」名義 review 舊系統 2 週,產出 migration plan,再正式切換。中間建議有 2-4 週並行期,舊系統繼續運作直到新系統穩定。

下一步:免費 vendor 體檢與 AI 顧問諮詢

選 AI 廠商不是一張評分卡可以涵蓋的事。每家公司的產業、資料、合規、預算結構都不同,同樣的廠商在 A 公司是綠燈、在 B 公司可能是紅旗。如果你正在評估 AI 客製化案,或者已經簽了約但對合約細節有疑慮,自由揚提供免費的 vendor 體檢服務——我們會看你的提案、合約、廠商報告,給出客觀第三方意見。

沒有業務話術,沒有要你換成我們做。我們做過自己的 AI 案,也在客製化系統諮詢中看過不少同業的提案,分得出什麼是真功夫、什麼是包裝得好的話術。立刻預約 30 分鐘免費 AI 顧問諮詢,把你目前的提案或合約寄給我們,我們會在 3 個工作日內回覆完整體檢報告。

延伸閱讀:完整框架看 客製化 AI 系統開發完整指南、費用全拆解看 AI 客製化費用結構與隱藏成本、ROI 試算看 中小企業 AI 系統導入 ROI 場景、傳統軟體 vendor 標準看 如何選軟體開發公司?7 個評估標準

分享文章

AUTHOR

自由揚John

留言(0)

尚無留言,成為第一個留言的人吧!

需要網站系統架設或軟體開發?

無論是品牌官網、客製化系統還是應用程式,我們的團隊擁有豐富經驗,歡迎聯繫我們,讓專業為您的事業加分。