

最近我們在內部 AI 流程的 routing 表上吵了一架——要不要把 Google Gemini 3.5 Pro 加進去。同事一句話總結:「Google 把 AI Ultra 從 $200 砍到 $100、又把 Pro 系列丟出來對標 Claude Opus 4.8 跟 GPT-5.4,我們真的撐得住不加嗎?」這個討論最後變成今天這篇——把 6 月這波 Gemini 3.5 Pro 發布拆給中小企業老闆與 IT 採購評估者看,到底該加進來、該觀望、還是該等下一輪。
先把今天最大的訊號講白:Google 這次不是再做一個「跟 Claude 比一比」的新模型,而是用價格槓桿把高階 AI 訂閱方案的天花板拉低一倍。對中小企業而言這代表:原本只有兩條路(Claude Pro/Max、ChatGPT Team/Enterprise),現在第三條路用同樣的錢能拿到接近頂級的 reasoning 表現。但「能拿到」不等於「值得換」——這篇要做的是把「換 / 留 / 混搭」三條路的決策框架攤開。
Gemini 3.5 Pro 這波發布到底動了什麼
根據 Google I/O 2026 公告與後續定價更新,Gemini 3.5 Pro 主要做了三件事:旗艦級 reasoning 模型訂閱(AI Ultra)從每月 $200 降到 $100,新增 $20 入門訂閱(AI Lite),並把 Gemini 3.5 Pro 本身定位為「對標 Claude Opus 4.8 與 GPT-5.4」的長 context + 多模態主力模型。背後的真正動作是價格槓桿——Google 願意用 50% 的價格砍下去,因為他們手上有 TPU、有 YouTube + Google Docs + Gmail 的資料閉環,邊際成本扛得起。
我們的判斷是這波降價打到的是 OpenAI,不是 Anthropic。中小企業如果原本是用 ChatGPT Team/Plus 為主力,這波要重新算帳;如果原本走 Claude Pro/Max 主力,反而 Google 對你不痛——因為 Anthropic 的市場區隔仍然是「能跑 production agent + Claude Code 工具鏈整合」,這兩塊 Gemini 3.5 Pro 目前還跟不上。
Gemini 3.5 Pro vs Claude Opus 4.8 vs GPT-5.4 快速對照
項目 | Gemini 3.5 Pro | Claude Opus 4.8 | GPT-5.4 |
|---|---|---|---|
月費(最高階訂閱) | $100(AI Ultra) | $200(Max) | $200(ChatGPT Pro) |
API per-token (input) | $1.25/MTok | $5/MTok | $3/MTok |
API per-token (output) | $10/MTok | $25/MTok | $15/MTok |
Context window | 2M tokens | 1M tokens | 400K tokens |
多模態(圖 / 影 / 音) | 原生 + YouTube 接入 | 圖 + 高解析 | 圖 + 語音 |
工具鏈成熟度 | Vertex AI / Workspace 內建 | Claude Code + MCP | ChatGPT + Codex Cloud |
台灣商用支援 | Google Cloud TW | API 直接,無在地辦公室 | Microsoft Azure / 直接 |
這張表只是「規格快照」,真正的選型決策得回到第 2 段「你的 routing 表現在長什麼樣」。我們建議用同一條 production 流程跑 A/B 評測,不要看 benchmark——benchmark 跟你公司的 RAG schema、工具呼叫慣例、prompt cache 命中率幾乎無關。
中小企業老闆該關注的 5 個採購訊號
我們把這波發布拆成 5 個對中小企業老闆採購決策有實際影響的訊號。每一個都對應到一個「該不該動 routing 表」的判斷依據。
訊號 1:你目前的主力 AI 訂閱是 ChatGPT 系列
這個訊號最強。Google 把 $100 AI Ultra 推出來,幾乎就是直接對打 ChatGPT Team / Enterprise。如果你公司每月在 OpenAI 上花 $25–$60 / seat,又主要用在「長文件閱讀 + 表單萃取 + 簡單問答」這類意圖,Gemini 3.5 Pro 用同樣甚至更低的錢就能完成同一件事,且 context 大 5 倍。建議把 routing 表中 70% 流量先試打 Gemini,留 30% Claude 給 production agent。
訊號 2:你公司的資料閉環本來就在 Google Workspace
Gmail、Google Docs、Sheets、Drive 已經是日常 → Gemini 3.5 Pro 內建的 Workspace integration 對你是真的省事。但這也是 vendor lock-in 訊號最強的地方——一旦把整個 prompt cache、Workspace 私有資料、@-mention 機制都搬上去,未來想換到 Claude 或 GPT-5 的搬遷成本會跳高。詳細搬遷對策可以參考 中小企業客製化系統「資料遷移」完整指南。
訊號 3:你在做的是 production AI agent / 自動化流程
這個訊號是反向的——Gemini 3.5 Pro 雖然 reasoning 表現追上 Claude Opus 4.8,但 production agent 的工具鏈(function calling 穩定度、stop sequence 控制、MCP 接入)仍然落後一個世代。如果你在跑 LangGraph / CrewAI / AutoGen 等 agent 框架 接 Claude,建議先觀望 6 個月——讓 Gemini Agent SDK 跑穩了再評估。production 環境一旦切換主模型,整條 prompt 都要重新 tune,這個成本通常被低估。
訊號 4:你的 AI 月帳單已開始失控
Gemini 3.5 Pro API 端 input $1.25/MTok 跟 Claude Opus 4.8 的 $5/MTok 比,4 倍價差。如果你公司每月在 LLM API 上花超過 $1,000 美金,且資料敏感度允許用 Google Cloud(不在禁採名單上、不涉及機敏個資),切過去 routing 至少省 40-60%。中小企業 AI Token 成本治理框架 那一篇有完整的試算範本,可以拿來算自己現況。
訊號 5:你需要超長 context(>1M tokens)
Gemini 3.5 Pro 的 2M context window 是目前主流 LLM 中最大的——對「整本程式碼閱讀」「整份 ERP 系統文件 RAG」「全公司一年 email 摘要」這類用例,這個容量是 Claude Opus 4.8 的 2 倍、GPT-5.4 的 5 倍。但 caveat 是:實測 1.5M-2M context 區間 attention 仍然會掉,建議把長 context 用法切成 chunked retrieval + summarize,不要直接灌進去。
我們自己在跑什麼 routing
順帶說一下我們公司自己的 routing 表現況——我們內部跑 20+ 個 AI 流程,從寫稿、code review、客戶提案、報表整理到 SaaS 客服機器人。實際的 routing 是:Claude Opus 4.8 跑 production agent + 寫文章 + Claude Code 整合(佔 60% 預算);GPT-5.4 跑 Codex 與圖像生成(佔 25%);剩下 15% 留給 Gemini 系列做超長 context summarize 與多語翻譯。
這波 Gemini 3.5 Pro 上線後我們做的調整是:把原本的 Gemini 3.5 Flash routing 流量提升一倍(從 7% 到 15%),但 production agent 的主模型不動。理由很簡單——我們公司現在賺到的營收主要靠 Claude Code + 內部 agent skill library 接案,這套工具鏈 6 個月內離不開 Claude。
我們不認同的兩個常見說法
市場上對這波 Gemini 3.5 Pro 發布有兩個說法我們不認同。第一個是「Google 這次終於追上 Claude,可以全換」——這個說法的盲點是把 reasoning benchmark 等同於 production 表現。真實生產環境裡,function calling 穩定度、tool use 一致性、stop sequence 控制這些「小事」才是決定一個 agent 跑不跑得起來的關鍵,而這些目前 Gemini 仍然輸 Claude 一截。
第二個是「降價代表 Google 的 AI 商業模式有問題」——這個說法低估了 Google 的策略。Google 不是用 LLM 本身賺錢,是用 LLM 把 Workspace / Cloud / Android 訂閱黏住。$100 AI Ultra 對 Google 來說是流量入口,對 OpenAI 才是價格戰。3 年後贏的不會是價格最低的廠商,而是把「LLM 變成業務基礎設施」黏進最多企業 IT stack 的廠商。
60 天評估清單
如果你看完上面 5 個訊號至少中了 2 個,這份 60 天評估清單可以拿來照表操課。我們設計這份清單時假設你的公司是 20-200 人 SMB、有 IT 主管或外包技術顧問。
Day 1-15:盤點現況
- 列出目前所有 AI 訂閱項目(seat 數、月費、用途)
- 盤點過去 3 個月最高使用率的 5 個 AI 流程,記下「目前用哪個模型 + token 消耗」
- 查資料敏感度——這些流程是否涉及不能上 Google Cloud 的個資 / 機敏
- 對齊禁採中國品牌規範(你的雲端後台、CDN、資料庫供應商有沒有命中)
Day 16-30:A/B 測試
- 把 5 個流程中最不敏感的 2 個拿來跑 A/B(Claude vs Gemini 3.5 Pro)
- 評估維度:回答品質、回應時間、token 成本、function calling 成功率
- 至少跑 100 次 sample,不要只試 3-5 次
- 結果記入「routing 決策表」,標清楚哪個流程適合切換、哪個維持
Day 31-45:合約與資料合規
- 如果要切過去,請 Google Cloud 業務報價(中小企業議價空間通常 5-15%)
- 簽 DPA(資料處理協議),確認你的 prompt 與輸出不會被拿去訓練
- 如果有醫療、金融、個資相關資料,補簽 BAA / DPIA
- 對應到 AI 廠商議價談判完整指南 與 AI 軟體採購供應商盡職調查 SOP 兩篇拉清單跑過一輪。
Day 46-60:分階段上線 + 退場計畫
- 先把 20% 流量切過去(影子部署,雙跑比對結果)
- 監控 7 天,沒問題就升到 50%
- 再 7 天升到 70% 或維持,剩下 30% 留給其他模型做 fallback
- 簽合約時務必保留「90 天無痛切換」條款(資料匯出、API 不被 deprecated)
ℹ️聊聊你的 AI 採購評估
看完這份清單,如果你也在想「我們公司到底要不要把 Gemini 3.5 Pro 加進 routing」——我們很樂意 聽你聊聊現況,一起看看你目前的 5 個主力 AI 流程哪些可以切過去、哪些要先觀望。
我們怎麼看 Gemini 3.5 Pro 這波
ℹ️我們怎麼看
三大 LLM 巨頭的價格戰才剛開始,3 年後贏的不會是「便宜 50%」這種戰術級玩家,而是「把 LLM 接成業務基礎設施」黏進最多企業 IT stack 的廠商。對中小企業老闆而言,現在不需要急著押注哪一家——但要做的事很具體:把你公司「最值得讓 AI 接手的 5 條業務流程」畫出來,然後用 60 天的 A/B 測試找出每條流程的最佳 routing。模型會繼續換代,「找到你公司值得自動化的流程」這件事,是真正不會折舊的資產。
ℹ️我們做過這件事
順帶說一下,這篇講的多模型 routing 我們公司自己每天都在跑——目前內部就有 20+ 個 AI 流程在工作中,Claude / GPT / Gemini 三家並用。這個架構不是憑空寫的,是我們真的因為一個月帳單 vs benchmark 結果反覆吵架後跑出來的。 例如我們做過一家在地中小企業客戶的客服 AI 工作流(化名),原本全壓 Claude,月帳單 $1,800 USD;切到 Claude + Gemini routing 後降到 $1,100,回答品質維持。 看到這裡,如果你也在想「這套 routing 評估放在我們公司會是什麼樣子」——我們很樂意 聽你聊聊現在的實際情況,一起看看哪些做得起來、能從哪一塊開始。
QGemini 3.5 Pro 跟 Gemini 3.5 Flash 差在哪?我中小企業該用哪個?
Gemini 3.5 Pro 是旗艦級 reasoning 模型,適合需要深度推理、長 context、production agent 的場景;Gemini 3.5 Flash 是輕量級,價格只有 1/3,適合高頻、低複雜度任務(如客服 FAQ、文件分類、簡單摘要)。中小企業多數場景 Flash 就夠用,只有當 Flash 跑不動才升級到 Pro。
QGemini 3.5 Pro 跟 Claude Opus 4.8 比,哪個更適合做 production agent?
目前 Claude Opus 4.8 仍然領先。Production agent 對 function calling 穩定度、tool use 一致性、stop sequence 控制要求極高,這三點 Claude 仍然優於 Gemini 一個世代。但 Gemini 3.5 Pro 的 2M context 是優勢——如果你的 agent 需要超長文件 retrieval,可以考慮混搭。
Q我公司用 Google Workspace,是不是直接全換 Gemini 比較划算?
短期成本上有優勢,但要注意 vendor lock-in。一旦把整個 prompt cache、Workspace 私有資料、@-mention 整合都搬上 Gemini,未來想換到 Claude 或 GPT-5 的搬遷成本會非常高。建議至少留 20-30% routing 給其他模型,維持談判籌碼。
QGemini 3.5 Pro 在台灣有 SLA 保證嗎?資料會傳到哪?
Google Cloud 在台灣有亞太區資料中心(彰化),如果你在 Vertex AI 上指定 asia-east1 region,資料不會出境。SLA 部分 Google Cloud 提供 99.9% uptime 保證。但 Workspace 整合的 Gemini 預設可能用全球 region,要透過 Workspace admin console 設定 data residency。簽合約時務必把 region 鎖定條款寫進 DPA。
Q我們公司有 10 個 seat 的 ChatGPT Team($25/seat/月),切到 Gemini AI Ultra 划算嗎?
看用途。10 seat × $25 = $250/月,跟 Gemini AI Ultra $100/seat 的單價比,反向更貴。但如果你公司只需要 2-3 個重度使用者拿頂級模型,其他 7-8 個拿 $20 AI Lite 就夠,總成本能砍掉一半。建議用本文的 60 天評估清單先盤點實際使用率,再決定 seat 數配置。
AUTHOR
自由揚AntonyLin
想了解更多?看看我們的相關服務
相關文章

企業內網 AI 助理自架完整指南:Open WebUI / LibreChat / AnythingLLM 三條路徑 + Claude API 接入 — 中小企業老闆「不被 SaaS 鎖死」的 5 個訊號與 4 條合約替代方案

客製化系統「程式碼審計」完整指南:上線前 6 個必查項、5 個 red flag、3 個第三方審計報價區間 — 中小企業老闆驗收外包工程廠商的最後一道保險

進銷存自己做完整指南:Excel / Google Sheet / Airtable / Notion 4 條 DIY 路徑與 5 個崩塌訊號

現成 ERP / 套裝 SaaS 為什麼總是不符需求?中小企業老闆完整決策框架——5 個根因、7 維度判斷表、4 階段評估流程

等 AI 跌價的真實成本算給你看:中小企業老闆 6 個情境試算 + 4 個進場時機判斷 + 4 大隱形帳

留言(0)
尚無留言,成為第一個留言的人吧!