
QA / E2E 測試自動化採購完整指南:Playwright / Cypress / Selenium / 自架 4 條路徑 — 中小工程團隊 6 個決策、5 條合約紅線、3 個報價區間
在我們做客製化系統諮詢的過程中,最常被中小企業老闆問的一個問題不是「要不要做測試」,而是「測試要做到什麼程度才划算」。多數老闆默默接受「QA 工程師 1 個月 8-12 萬」這個 baseline,但 2026 的真實局面是:Playwright / Cypress / Selenium 這些 E2E 自動化工具 + Claude / Codex 寫 test case,已經可以把 5 人 QA 團隊壓縮到 1.5 人 + 自動化 pipeline。
Stack Overflow 2026 Developer Survey 顯示,台灣中型工程組織導入 Playwright 的滲透率從 2024 年 12% 跳到 2026 Q1 的 41%。但「導入」不等於「跑得起來」——我們看過太多公司買了工具、寫了 50 條 test,三個月後 test runner CI 從 8 分鐘漲到 45 分鐘、紅燈天天響、最後全部 skip。本文回答 4 個決策:要 SaaS 還是自架、要哪個框架、要不要 AI 寫 test、要不要外包 QA。
為什麼 2026 年是 QA 自動化的轉折點
3 個訊號同時到位:第一,Playwright 在過去 18 個月吃掉 Cypress + Selenium 的市場(npm 月下載量 2024 Q4 超越 Cypress,2026 Q2 已是 3 倍)。第二,Claude / Codex 寫 Playwright test case 的成功率突破 80%,意味著「QA 工程師寫 test」這件事的勞動密度降了 5-10 倍。第三,2026 SaaS 漲價潮迫使中小企業重新審視「人力 vs 工具」的 ROI——一個 QA 工程師年成本 NT$ 120-180 萬,自動化 SaaS 月費 NT$ 1-3 萬。
我們公司內部就有一條工作流是「PR 自動 QA」,每個前端 PR 都會跑 Playwright test,發現迴歸後 AI agent 直接在 PR 留 comment 指出哪幾個 selector 壞了。這條跑了 6 個月,把前端 review LOC/週 -20%、incident 修復時數 -40%。
Playwright / Cypress / Selenium / 自架 4 條路徑全景
四條路徑差別不在「能不能跑」(都能),差別在「3 年後團隊願不願意繼續維護」。下表是 6 維度對比。
維度 | Playwright | Cypress | Selenium | 自架 Puppeteer + 自寫 |
|---|---|---|---|---|
語言支援 | TS/JS/Python/Java/.NET | 僅 TS/JS | 幾乎全部 | 僅 TS/JS |
瀏覽器 | Chromium/WebKit/Firefox | Chromium 強、其他弱 | 全部 | Chromium 強 |
上線時間 | 2-4 週 | 2-4 週 | 6-12 週(chromedriver 維護) | 1-2 週 |
年授權成本 | 免費(開源) | 免費(Cypress Cloud $75/月起) | 免費 | 免費 |
3 年 TCO(含 QA 1.5 人) | NT$ 280-380 萬 | NT$ 320-420 萬 | NT$ 420-580 萬 | NT$ 220-300 萬 |
AI Coding 友善度 | 極高(Claude / Codex 訓練密度最高) | 高 | 中 | 低 |
我們的判斷是:2026 起新案直接走 Playwright,舊案 Selenium 不要硬遷(遷移成本 > 3 個月人力),可以兩個並行跑、新功能用 Playwright、舊功能 Selenium 自然退場。Cypress 仍然是「2-5 人前端團隊」的好選擇,但 5 人以上 Playwright 性價比更高。
中小企業老闆採購 QA 自動化的 6 個決策
決策 1:先 unit / integration / E2E 哪一層
資源有限時,先做 E2E 而不是 unit。理由:E2E 直接守業務流程(下單、付款、報價),壞了立刻丟訂單;unit test 壞了通常只是工程師內部痛。我們對 5-15 人團隊的建議是:先 10 條 E2E 守關鍵 user flow、再依痛感慢慢補 unit。
決策 2:CI 上跑全套 vs 只跑 smoke + 夜間跑全套
Playwright 跑 100 條 test 大約 8-15 分鐘,每個 PR 都跑會把 CI bill 拉高。建議:PR 跑 smoke(10-15 條最關鍵),夜間 cron 跑全套,週末跑跨瀏覽器 matrix。
決策 3:要不要用 AI 寫 test case
Claude / Codex 寫 Playwright test 的成功率 80%+ 但有 catch:寫出來的 test 容易 brittle(依賴 CSS class name)。我們的做法是:AI 寫初稿、QA 工程師加 data-testid 加固。這樣 QA 工程師時間從「寫 test」變成「review + 加固」,是 3-5 倍效率提升。
決策 4:要不要採購 visual regression(Percy / Chromatic / Applitools)
Visual regression 月費 NT$ 8-30 萬,對「2 週內要做品牌改版」或「電商有大量產品圖」的團隊值得;對純功能型 SaaS(dashboard、管理後台)價值低。先做 6 個月不用 visual regression,看痛點再加。
決策 5:要不要外包 QA 給 SaaS(如 mabl、Functionize)
「無程式碼 QA SaaS」聽起來很美——業務員自己錄 test。但實況是:3-6 個月後 test 開始大量壞、業務員不會修、又回去找工程師。中小企業老闆要把這個當「marketing 工具」評估,不是 QA 工具。
決策 6:QA 工程師頭銜與職涯路徑
2026 年純手動 QA 工程師職缺正在快速消失,但「Test Automation Engineer / SDET」職缺 +180%。老闆給 QA 升職路徑時,應該往「測試策略架構師」方向設計——這正是我們之前寫過的 QA 工程師 AI 焦慮完整解方 這條路。
3 個報價區間:NT$ 80 萬 / 250 萬 / 450 萬(3 年 TCO)
區間 | 適合規模 | 代表組合 | 3 年 TCO | 年 release 數量 |
|---|---|---|---|---|
輕量 | 5-15 人工程團隊 | Playwright + GitHub Actions + 0.5 QA | NT$ 80-150 萬 | < 50 次 |
標準 | 15-40 人工程團隊 | Playwright + Cypress Cloud + 1.5 QA | NT$ 200-320 萬 | 50-200 次 |
完整 | 40-100 人工程團隊 | Playwright + visual regression + 3 QA | NT$ 350-520 萬 | 200+ 次 |
ℹ️我們做過這件事
目前內部就有 20+ 個 AI 流程在工作中,其中一條是「前端 PR 自動 QA」——Playwright 測試 + Claude agent 解讀紅燈原因 + 自動在 PR 留 comment。我們自己驗證過:在 5-12 人前端團隊內,這套組合可以把 QA 工程師從 2 人縮減到 0.5-1 人,省下 2-3 人/年人力。
在我們 30+ 個企業客製化系統落地的諮詢經驗中,測試自動化是上線後 90 天內最容易讓老闆「砍預算」的環節——測試對短期業務沒影響,但 18 個月後 incident 大爆發時又回頭來補。如果你正在規劃 QA 自動化導入,可以從 AI 系統開發(/services/ai-system) 或 客製化系統開發(/services/customize-web) 開始聊起。
5 條 QA SaaS 採購合約紅線
- test code 歸客戶所有:很多 SaaS 把錄製的 test 鎖在自家 platform,終止合約後拿不走——簽前確認 test 可 export 成 Playwright / Cypress 標準格式
- 「無程式碼」陷阱:SaaS 廠商主打的 record-and-replay 功能 6 個月後通常會壞 30-50%,要把「test 維護工時」估進 TCO 而不只是月費
- 視覺回歸 baseline 歸誰:Percy / Applitools 的 visual baseline 圖片庫終止後是否能匯出,要寫死
- CI 整合 SLA:合約寫死「test runner platform 掛掉時 CI 不擋 deploy」,避免 SaaS 故障時整個 release pipeline 停
- team seat 結構:避開「per developer」計費的廠商,後端工程師不寫 test 也要付錢——選 per QA 或 flat-rate
ℹ️我們怎麼看:QA 自動化的下一個 3 年
我們的判斷是:3 年後 QA 工程師會分化成兩條路——「測試策略架構師」管覆蓋率、優先序、合約 SLA;「test agent 維運工程師」管 AI 寫的 test runner、紅燈 triage。Playwright + AI Coding 已經是新案 default,Cypress 在前端純 SPA 案還有 2-3 年生存空間。
給中小企業老闆的判斷工具是:問廠商一句「你的 QA SaaS 有沒有開 API 讓 Claude / Cursor agent 自己讀紅燈報告、自己提 PR 修 test?」答得出來的就值得繼續談,答不出來等 6 個月再回來看。
下載:QA 自動化採購 checklist + Playwright 入門 30 條範例
如果你正在評估 QA 採購,可以先讀 中小企業 AI / 軟體採購供應商盡職調查 SOP(/blog/smb-ai-software-vendor-due-diligence-sop-12-checks-5-red-flags-4-exit-clauses) 跑一輪 due diligence、再讀 AI Coding 工具導入後工程團隊 KPI 重設指南(/blog/smb-ai-coding-team-kpi-redesign-6-broken-old-metrics-5-new-kpis-3-contract-clauses) 對齊 QA / Dev 兩邊 KPI。
不該做 QA 自動化的 3 種情況
- MVP 還沒到 product-market fit:每週改 5 次 UI,test 寫一條壞兩條,不如 6 個月後再開始
- 團隊沒有 QA owner:QA test 沒人維護的下場是 6 個月後全 skip,浪費 license 費用
- release cadence < 每月 1 次:手動測一輪 4 小時就夠了,自動化 TCO 反而更貴
QPlaywright vs Cypress 怎麼選?
5-15 人前端團隊兩個都好,Cypress 學習曲線稍低;15 人以上 Playwright 性價比顯著高(語言支援廣 + 瀏覽器全 + 無 license 限制)。後端跨服務 E2E 直接 Playwright,Cypress 不適合。
Q用 Claude / Codex 寫 test 真的省嗎?
省 3-5 倍人力,但前提是要有 1 個 QA owner 把 AI 寫的初稿做 review + 加固(data-testid、stable selector)。沒有 owner 直接讓 AI 寫到 production,6 個月後一定壞。
Q沒 QA 工程師可以做嗎?
可以,由 senior 前端工程師兼差。但工時要在 sprint planning 預留 15-20%、不能用「下班後寫」這種方式撐——撐 3 個月就放棄。
QCypress Cloud / Mabl / Functionize 哪個值得買?
Cypress Cloud 月費 NT$ 2-8 萬,對 Cypress 用戶值得;Mabl / Functionize 主打無程式碼,6 個月後 test 維護成本反彈,不推薦中小企業採購。
Qtest 失敗率太高(flaky test)怎麼辦?
三個層次處理:1) selector 用 data-testid 不用 CSS class;2) 加 retry(Playwright 內建 retry: 2);3) 把 flaky test 隔離成另一條 pipeline 不擋 deploy。三個都做之後 flaky rate 可以從 15-20% 壓到 < 3%。
Q外包 QA 給 SaaS / 顧問公司可行嗎?
短期可行(3-6 個月衝刺),長期不行——QA test 是組織知識(哪條 flow 重要、哪個 edge case 客戶會踩),外包後組織自己不知道。建議外包 build phase(前 3 個月寫好 50 條 test),自己接 maintain phase。
AUTHOR
自由揚John
留言(0)
尚無留言,成為第一個留言的人吧!