
找外包做 AI 專案完整報價框架:6 種專案類型、預算區間、估時方法與 5 條合約紅線
你拿到一份 AI 專案的 RFP(需求書),上面寫「我們要做一個 AI 客服 bot,預算 100 萬,3 個月上線」。你應該答應嗎?答案是「不知道」——因為 AI 客服 bot 可以是 30 萬的事,也可以是 300 萬的事,差異不在客戶腦中,而在這份 RFP 沒寫出來的 6 個變數。今天這篇文章就是要告訴你那 6 個變數是什麼,以及對應的 6 種 AI 專案類型該怎麼抓報價。

為什麼 AI 接案報價最容易失準?3 個結構性原因
傳統軟體開發報價有相對成熟的估算方法:功能點分析、人月估算、類比歷史專案。AI 專案這套都不太管用。原因有 3 個結構性差異:
第一個是「資料品質的隱性成本」。客戶說「我們有資料」通常意思是「我們有 Excel 散落在各部門電腦」,要先花 30-50% 的專案時間整理。Anthropic 2026 Agentic Coding Trends Report 指出,企業 AI 專案中 41% 的失敗原因是「資料未準備好」,但這個成本在報價階段幾乎沒人估進去。
第二個是「準確率 SLA 的迭代成本」。傳統軟體寫完就是寫完,AI 模型上線後要持續調校。準確率從 85% 提到 92% 可能比從 0 提到 85% 還難——這段在報價時很難量化,但客戶通常預期「上線就是完成」。
第三個是「模型 / API 費用的長期負擔」。AI 不像傳統軟體一次性投入,背後 GPT-4 Turbo、Claude Sonnet、Gemini Pro 每月都在燒 token 費用。一個中型客服 bot 月 API 費用可能 5,000-30,000 美元,這要算成「年運維費」報給客戶,不是接案費。
以下表格把 3 個結構性差異的「客戶預期 vs 實際成本」對照給你看:
變數 | 客戶預期 | 實際成本佔比 |
|---|---|---|
資料準備 | 「我們有資料」 | 專案總時數 30-50% |
模型訓練 | 「就買 API 套上去」 | 專案總時數 15-30% |
準確率調校 | 「上線就是完成」 | 專案總時數 20-35% |
運維費用 | 「不需要」 | 年 5-50 萬美元(看規模) |
6 種主流 AI 專案類型總覽:先看預算區間表
這 6 種類型是我們從 2024-2026 年實際接觸過的 80+ 個 AI 專案 RFP 歸納出來的,幾乎涵蓋台灣中小企業的所有需求。先給你一張整體對照,下面分章節詳拆:
專案類型 | 典型用途 | 預算區間(台幣) | 交付時程 |
|---|---|---|---|
① RAG 知識庫 / 客服 bot | 內部問答、產品 FAQ、技術文件查詢 | 30-180 萬 | 6-14 週 |
② AI Agent 流程自動化 | 跨系統工作流、自主決策 | 80-400 萬 | 12-24 週 |
③ Coding Assistant / Workflow Embed | 為開發團隊打造專屬 AI 工具 | 60-250 萬 | 8-18 週 |
④ 影像辨識 / OCR / 文件理解 | 品檢、發票辨識、合約抽取 | 50-300 萬 | 10-20 週 |
⑤ Voice agent / 語音對話 | 電話客服、預約系統、訂位 | 70-280 萬 | 10-18 週 |
⑥ 模型微調 / fine-tuning | 打造特定領域專屬模型 | 150-600 萬 | 16-32 週 |
預算區間的下緣是 PoC + 簡單上線,上緣是完整生產級系統含監控、運維工具、3 年支援。多數中小企業實際落地的案子落在中間偏下緣(區間最低值的 1.5-2 倍)。
類型 ① RAG 知識庫 / 客服 bot:最常見、最容易低估
RAG(Retrieval-Augmented Generation,檢索增強生成)是台灣中小企業最常問的 AI 應用——把公司內部文件(產品手冊、SOP、FAQ、合約範本)變成 AI 能回答的知識庫。看似簡單,實際做起來坑很深。
坑在哪?文件品質、檢索準確度、回答幻覺、權限控管,每一塊都是地雷。LangChain 2026 RAG Production Report 統計,從 PoC 到正式上線的 RAG 系統,平均要做 8-12 輪 chunking / embedding / re-ranking 的調校。每一輪都是時間,每一輪都要錢。
典型報價拆解(以 100 萬等級的 RAG 客服 bot 為例):
需求訪談 + 文件盤點:8-10 萬(2-3 週)
資料前處理 + chunking 策略:18-25 萬(2-3 週)
向量資料庫 + Embedding 模型選型:12-18 萬(1-2 週)
對話介面 + 後台管理:15-25 萬(3-4 週)
Re-ranking + 準確率調校:18-25 萬(2-3 週)
測試 + 上線 + 教育訓練:10-15 萬(1-2 週)
年運維費抓 15-25% 接案費,包含 API 費用、向量庫主機、季度模型更新、bug 修復。客戶最常想砍的是「準確率調校」這段,但這段省不得——少這段準確率會卡在 70-75%,使用者體驗很差。
類型 ② AI Agent 流程自動化:報價最容易爆
AI Agent 是 2025 下半年到 2026 最熱的詞,意思是讓 AI 不只回答問題,而是「自己跑完整個流程」——例如收到客戶詢價 email → 查 CRM 找出客戶歷史 → 查產品庫存 → 算報價 → 寫 email → 等主管簽核。聽起來很酷,做起來是地獄。
為什麼會爆?因為 Agent 的失敗模式很多。中途資料對不上、外部 API 突然壞、客戶資料不在預期範圍。Salesforce 2026 Agent Survey 顯示,企業導入 Agent 平均要試 3-5 個 prompt 版本、處理 12-18 種邊界案例,才能達到 80% 的成功率。每一種邊界案例都是工時。
Agent 報價的關鍵在「整合複雜度」。同樣是「跨系統的 Agent」,整合 2 個系統和整合 8 個系統的報價可能差 5 倍。報價前一定要做的 3 件事:
把 Agent 要走的「快樂路徑」(happy path)和「邊界案例」(edge cases)列清單
盤點每個 touchpoint 的 API 成熟度(有 REST API 的容易、要爬畫面的爛)
明確定義「成功」的標準(90% 成功 + 10% 轉人 vs 95% 成功 + 5% 轉人,報價可能差 50%)
⚠️Agent 報價的 3 條合約紅線
第一,明定「超過 N 種邊界案例不在範圍」,避免無限加範圍。第二,準確率 SLA 必須含「失敗轉真人」的兜底機制,不是純 AI 成功率。第三,運維期內模型升級費用要寫清楚,OpenAI / Anthropic 每 3-6 個月會出新模型,不升你的客戶會抱怨。
類型 ③ Coding Assistant / Workflow Embed:為開發團隊打造專屬 AI
這類專案在 2026 變熱,因為 Anthropic 2026 Agentic Coding Trends Report 顯示 72% 的開發者每天用 AI 工具、AI 貢獻 42% 的程式碼。許多公司想把這套變成「自己團隊專屬」——例如包進公司 coding 規範、API 文件、安全紅線、內部框架,讓新進工程師上手快 3 倍。
典型內容包括:客製化 Cursor / Claude Code 設定、企業內部 prompt 庫、私有 MCP server、自動 PR review 機器人、coding standard 違反偵測。一個 100-200 萬的專案大約能做到「客製化 IDE 配置 + 內部 prompt 庫 + 基本 PR review」。
報價的關鍵變數:
變數 | 低端報價影響 | 高端報價影響 |
|---|---|---|
團隊規模 | 5-10 人 | 50+ 人,需 multi-tenant 設計 |
技術棧多樣性 | 單一語言 / 框架 | 4+ 種語言並存 |
安全等級 | 一般 RBAC | ISO 27001 / SOC 2 合規 |
整合系統 | 接 GitHub + Slack | 接 Jira + Bitbucket + Jenkins + SonarQube |
延伸閱讀:AI Coding 三強對決:Cursor、Windsurf、Claude Code 講了選工具的決策框架,AI Agent 系統採購完整框架 講了大型 Agent 系統的合約紅線,這兩篇可以一起讀。
類型 ④ 影像辨識 / OCR / 文件理解:硬體成本是隱形殺手
影像辨識專案有兩種:純軟體(OCR、發票辨識、合約抽取)和軟硬整合(工廠品檢、車牌辨識、醫療影像)。純軟體類報價比較標準,軟硬整合容易爆——因為硬體規格、現場光源、相機角度都會影響準確率。
純軟體類(例如發票辨識)的市場行情:自建 PoC 約 30-60 萬、生產級系統 60-150 萬。但要小心一件事:客戶常問「能不能 99% 準確」。Google Document AI 2026 Benchmark 顯示通用 OCR 引擎在繁體中文混合英數的場景準確率約 92-96%,要做到 99% 必須客戶提供 5,000+ 標記樣本,這段成本通常在報價階段沒講清楚。
軟硬整合類更需要小心。業界曾發生一個案例:客戶要做產線品檢系統,PoC 階段用辦公室筆電拍的照片準確率 96%,正式上線到產線後因為光源、震動、角度問題,準確率掉到 78%——重新調校花了 2 個月、額外 60 萬。報價時務必加上「現場校準」這個項目,避免被當成「免費售後」。
類型 ⑤ Voice agent / 語音對話:語音模型費用比想像中貴
語音 AI 在 2025 下半年成熟。台灣中小企業常見需求:自動接聽預約電話、語音點餐、24 小時客服。看起來簡單,實際做的時候有 4 個技術門檻:語音轉文字(STT)、意圖理解、回應生成、文字轉語音(TTS)。每一塊都要選模型、調參數。
成本結構和文字 bot 很不一樣。文字 bot 主要燒 LLM token 費,語音 bot 還要加 STT/TTS 費用——以 OpenAI Realtime API 為例,每分鐘對話約 0.06-0.18 美元,一個月 1,000 通電話、每通 3 分鐘,月 API 費用就要 180-540 美元,年費 6.5-19.5 萬台幣。這個成本要寫進報價單給客戶,不要自己吞下去。
選擇 voice agent 平台時,繁中支援度是關鍵。OpenAI Realtime API 繁中發音自然但有腔調,Google Vertex AI Speech 繁中發音較道地但意圖辨識略弱,Microsoft Azure Speech 在企業合規上最完整但成本最高。報價前先做 3 家 demo,讓客戶聽過再選。
一個 150-250 萬的 voice agent 專案,大約能做到:完整對話流程設計、3 種以上意圖支援(預約 / 查詢 / 改期)、整合 CRM、後台對話分析儀表板、3 個月準確率調校。再加多語言、加情緒辨識、加多人會議轉錄,報價就會跳到 300 萬以上。
類型 ⑥ 模型微調 / fine-tuning:最貴、最容易失敗、最少人真的需要
Fine-tuning 是 AI 接案的「奢侈品」。意思是把開源大模型(Llama、Mistral、Qwen)或商業模型(GPT-4o、Claude Sonnet)拿來,用客戶自己的資料再訓練一輪,做出「專屬模型」。聽起來很高大上,實際 95% 的中小企業需求不需要做到這一步。
為什麼?因為 RAG(類型 ①)通常就能解決 90% 的需求,成本只要 fine-tuning 的 1/5。OpenAI Cookbook 2026 明確建議:先試 RAG,做不到的部分再考慮 fine-tuning。多數客戶會在沒理解差異時就要 fine-tuning,是因為「聽起來比較專業」——你要當顧問把這件事講清楚。
什麼情況真的需要 fine-tuning?三個場景:(1) 特定領域的專業術語(法律、醫療、化工),通用模型理解不準;(2) 客戶有大量歷史對話 / 文件,想複製專屬語氣;(3) 需要在地端 / 私有雲跑(資安要求嚴格)。除非這三個之一明確成立,否則寧可建議 RAG。
報價結構:資料準備 30-40 萬、模型訓練 50-100 萬、評估與迭代 40-80 萬、部署與整合 30-60 萬。如果客戶要私有雲部署再加 50-150 萬硬體成本。年運維抓 25-35% 接案費,因為模型每 3-6 個月就要重新微調以維持表現。
AI 接案的 5 條合約紅線:估時、改稿、模型費、資料權、運維
不論你做的是哪一種 AI 專案,以下 5 條紅線必須寫進合約。業界外包合約糾紛中,多數都是這 5 點裡某一條沒寫清楚。
紅線 | 典型糾紛 | 建議條款 |
|---|---|---|
估時範圍 | 客戶說「我以為這個會做」 | 明文列舉「不在範圍內」的功能清單 |
改稿次數 | 客戶反覆要求調 prompt 改回答 | 每階段最多 N 輪修改,超過按時數計 |
模型 / API 費用 | 「不是說一次報價嗎?」 | 年 API 費獨立列項,可由客戶直接付 |
資料所有權 | 換廠商時拿不到訓練資料 | 訓練資料、模型權重、prompt 庫所有權歸客戶 |
上線後運維 | 「上線後應該不用維護吧」 | 3 個月內免費 bug 修復、之後按運維合約計費 |
把合約寫清楚不是不信任客戶,是讓雙方對齊預期。接案合約怎麼寫 有更完整的 8 條接案族通用條款,搭配本篇 5 條 AI 專屬紅線一起看。
Q我自己沒做過 AI,可以接這種專案嗎?
看複雜度。RAG 知識庫類型有完整的開源框架(LangChain、LlamaIndex),中等程度的全端工程師花 2-3 個月學習能上手。Voice agent、fine-tuning 需要更深的 ML 基礎,建議先當分包再轉主包。一開始選類型 ①、③ 起步,先建立 portfolio 再接複雜的。
Q客戶說預算 50 萬要做 AI agent 流程自動化,能接嗎?
看流程複雜度。如果是「3 個 happy path、2 個系統整合」勉強能做(純 PoC),但要明文寫「不含邊界案例處理」「不含正式上線運維」。如果客戶要的是生產級系統,50 萬絕對不夠,要嘛拒接、要嘛拆成多階段先做 PoC(30-50 萬),證明效益後再爭取追加預算。
QAPI 費用要怎麼跟客戶解釋?
建議用「水電費」比喻——AI 系統運作每次都要燒 API token,就像伺服器每月要付電費。最透明的做法是讓客戶用自己的 OpenAI / Anthropic 帳號付款,你只收建置 + 維運費。這樣客戶看得到每月實際用量、不會覺得被你抽成。
Q客戶要求 100% 準確率怎麼辦?
明確告訴客戶 100% 準確率在 AI 領域不存在。連 GPT-4 / Claude Opus 在最佳場景準確率也只到 95-97%。合約寫「目標準確率 X%」(X 通常 85-92),並設「失敗轉真人」的兜底機制。把這件事提前講清楚,避免上線後爭執。
Q我接的案子算「AI 接案」還是「軟體外包」?
看核心價值來自哪。如果案子的 60%+ 工時花在 AI 模型選型、prompt 工程、準確率調校,算 AI 接案,報價區間參考本文。如果只是「用 AI 寫程式」加速開發、最終交付物是傳統 Web/App,那是軟體外包,套用一般工程師接案行情。
如果你正在評估 AI 專案的廠商或報價
業界自 2024 年起,6 種 AI 專案類型陸續落地——從 RAG 知識庫、Agent 流程到 voice agent 都有實際案例。如果你正在收 AI 專案報價、不確定報價合不合理;或者你是接案族想學怎麼開 AI 案的報價單,可以聊聊。
兩個入口:AI 諮詢服務(含廠商評估、報價合理性檢視、合約紅線建議)、找外包做 AI 系統的 7 個坑(採購方視角的避坑清單)。30 分鐘免費諮詢:foreverwebs.com/contact。
AUTHOR
自由揚AntonyLin
想了解更多?看看我們的相關服務
相關文章

Anthropic Project Glasswing 企業擴張完整解析:中小企業 AI 資安自動化採購 5 個訊號 + 60 天評估清單

客製化 PDM / PLM 產品生命週期管理系統開發完整指南:6 個關鍵決策、3 個報價區間、5 個常見地雷

客製化獸醫 / 動物醫院管理系統開發完整指南:6 個關鍵決策、3 個報價區間、5 個常見地雷

客製化醫美診所看診療程管理系統開發完整指南:6 個關鍵決策、3 個報價區間、5 個常見地雷

NeMo Agent Toolkit 多框架整合實戰:LangGraph、AutoGen、CrewAI、Semantic Kernel 統一接管的中小企業避免框架鎖定 5 個訊號 + 60 天評估清單

留言(0)
尚無留言,成為第一個留言的人吧!