Microsoft MAI-Thinking-1 35B 推理模型發表會封面

Microsoft 2026 capex $190B + AI 記憶體儲存價格飆升完整解析:中小企業 AI 採購 TCO、token 成本、6 個月囤約 5 訊號

自由揚AntonyLin
11 分鐘閱讀
複製引文

上週我們在內部 90 天 AI 預算 review 上抓到一條讓人坐直的數字——Microsoft 揭露 2026 年 capex 衝上 $190 billion、其中 $25 billion 增量明確來自 AI 記憶體與儲存元件漲價。這不是新聞稿背景音,是「整個 AI 算力供應鏈的成本曲線進入新區間」的硬數字。我們公司每天跑 20+ 條 AI 工作流,這條訊號會直接影響我們未來 6 個月怎麼跟客戶談 AI 系統的 token 預算。

這篇是給中小企業老闆與採購主管的:把 $190B capex、$25B 記憶體溢價、Vera Rubin / Trainium 算力定價這三件事拆成「對你 H2 token 預算的真實意義」,並給 5 個 TCO 重抓訊號 + 90 天囤約 / 撐約策略。

根據 CNBC 報導 Microsoft FY26 capex 指引,$190B 的增幅中「$25B 直接歸因於 memory 與 storage 元件價格飆升」——這是 HBM3e、HBM4 與 NAND 整體緊缺造成的。同期 Reuters 揭露 SK hynix HBM 緊縮、Samsung 投產 HBM4 還要到 2027 H1。供應端的緊縮會傳導到 token 端嗎?這篇是這個問題的拆解。

$190B capex 拆解:哪一塊跟中小企業 token 成本有關

Microsoft FY26 capex $190B 看起來是「跟我無關的天文數字」,但裡面有兩塊跟中小企業 AI 採購 TCO 直接相關。其他幾塊跟你無關,先拆乾淨。

Capex 區塊

規模(估)

對中小企業 token 成本的傳導路徑

Nvidia GB300 / Vera Rubin 採購

$80-90B

直接決定 Azure OpenAI、Anthropic via Bedrock 的 token 底層算力成本,傳導 6-12 個月

HBM3e / HBM4 記憶體 + NAND 儲存元件溢價

$25B(新增)

Azure OpenAI 與 Azure ML 的 token 定價有 12-18 個月內 8-15% 上調空間

資料中心新建(含電力、冷卻、土地)

$40-50B

影響 Azure Region 擴張節奏,跟 token 成本的相關性低,跟「資料合規 region 選擇」較相關

既有設施維運與升級

$20-25B

對 token 成本無直接影響

AI 模型訓練專案 capex(含內部研究)

$15-20B

Microsoft 自家 MAI-Thinking-1 等模型訓練,會稀釋對 OpenAI 的依賴,未來 12 個月可能推「Azure 自有模型 + 便宜 tier」

結論是:最容易傳導到中小企業 token 成本的是「HBM 漲價 + Vera Rubin 採購結構」這兩塊,6-18 個月內會看到 Azure OpenAI 與多家透過 Azure 出口的 AI 服務漲價 8-15%。如果你目前 70%+ AI 預算壓在 Azure OpenAI,這個訊號要嚴肅看待。

5 個 TCO 重抓訊號:3 個以上中就要動

不是每家中小企業都會被 Microsoft capex 訊號影響。這 5 個訊號是「該不該重抓 AI TCO」的判斷面板。

訊號 1:你目前 50%+ AI 預算在 Azure OpenAI 或 Azure ML

Azure 出口的 token 定價對 HBM / NAND 漲價傳導最直接。我們最近三個月看到 5 家客戶的 Azure OpenAI 月帳單已經出現 2-4% 的「跨月波動」(同樣 prompt、同樣模型),這是定價系統開始預備調整的訊號。預算重壓 Azure 的客戶建議優先做 fallback。

訊號 2:你的 token 預算 60%+ 壓在 flagship 模型

HBM 漲價對「大模型推論」傳導最強——因為大模型推論需要更多記憶體頻寬。flagship 模型(GPT-5.5、Claude 4.7 Opus、Gemini 2.5 Pro)會比 mini / nano tier 漲得多。中小企業 token 預算應該重新算「flagship vs mini」配比,建議從 60% flagship 降到 30-40%。

訊號 3:你的合約都是「月約 pay-as-you-go」

月約的 token 單價會跟著 HBM 漲價直接傳導,年約有 6-12 個月的「定價穩定窗口」。但年約一旦簽,就被綁住。這節跟訊號 4 一起讀。

訊號 4:你目前還沒簽 2026-2027 年約

現在到 9 月(OpenAI IPO、Microsoft FY26 capex 指引消化期)是「簽長約鎖定價格」的窗口。9 月後預期 Azure 與 OpenAI 都會推「新合約價格表 + 漲價條款」。我們在 OpenAI $730B 估值 + 9 月 IPO 解析 講過 OpenAI IPO 前的合約彈性窗口,這篇是 Microsoft / Azure 側的同類訊號。

訊號 5:你的 fallback 廠商評估還沒做

如果你目前只用 Azure 或只用 OpenAI 一家,HBM 漲價會 100% 傳導給你。如果你有 Claude(via Anthropic API 或 AWS Bedrock)+ Gemini 雙 fallback,可以做「動態 routing」把成本平均化。fallback 廠商要先有,才能談 routing 策略。

ℹ️我們公司自己每天就在跑

我們公司日常每天跑 20+ 條 AI 工作流,目前配比是 Azure OpenAI 35% / Anthropic API 30% / 自架 Llama(CPU 推論)20% / Gemini 15%。Microsoft capex 訊號出來後,我們把 Azure OpenAI 那 35% 重新切到「30% 月約 pay-as-you-go + 5% 預先綁年約」,等 9 月後看新合約再決定要不要把 35% 改成 50% Azure 或 20% Azure。這種「不全壓單一廠商、保留 routing 彈性」是我們對 HBM 緊縮週期的標準動作。

token 成本 6 個月預測:哪些會漲、哪些會穩、哪些反而會降

HBM 漲價不是「所有 AI 服務都跟著漲」的單調傳導,會有結構性分化。

服務類別

6 個月價格預測

原因

Azure OpenAI GPT-5.x flagship

漲 8-15%

HBM 直接傳導 + Vera Rubin 採購成本攤提

Azure OpenAI GPT-5 mini / nano

穩或微降 0-5%

推「便宜 tier」搶 market share、稀釋 OpenAI 議價力

Anthropic API(直接)

穩 ±3%

Anthropic 跟 Google + Broadcom 算力同盟分散風險

Anthropic via AWS Bedrock

微漲 3-8%

AWS Trainium 自家成本曲線 + Bedrock markup

Google Gemini API(Vertex AI)

穩或微降 0-5%

Google 自家 TPU 不靠 HBM、捕捉跨廠遷移流量

自架 Llama / Mistral(GPU 推論)

漲 10-20%

GPU 漲價對自架推論直接影響,但是 mid-tier 客戶仍可能比 SaaS 便宜

自架 Llama / Mistral(CPU 推論、量化模型)

CPU 推論不受 HBM 影響,量化模型品質夠用的場景反而會被推上去

90 天囤約策略:什麼時候簽什麼合約

  1. Day 1-15:盤點目前 12 個月 AI 月支出,標出 flagship vs mini 配比、月約 vs 年約比例、廠商集中度。
  2. Day 16-30:跑「HBM 漲價 12% 對年度 token 成本的衝擊試算」(base case + worst case)。
  3. Day 31-45:跟 Azure / OpenAI / Anthropic 業務談「現在到 9 月簽年約的折扣表」——把 SLA、退役通知、單方終止條款全部寫進備忘錄。
  4. Day 46-60:選 1-2 家做「年約鎖定」(覆蓋 30-50% token 預算),其餘保留 pay-as-you-go 彈性。
  5. Day 61-90:跑 fallback 廠商 POC(如果還沒有),確保 routing 切換時間 < 4 小時、prompt 兼容性測過。

下載:H2 AI 採購 TCO 重抓 Excel 模板

我們把上面 90 天清單 + flagship vs mini 配比試算 + HBM 漲價情境模擬做成 Excel 模板,文末填 email 索取。請參考 foreverwebs.com

我們的棱角:HBM 緊縮不是末日訊號,是廠商分化機會

我們不認同「HBM 漲價 = AI 採購全面變貴 = 中小企業導入 AI 要踩煞車」的說法。過去 18 個月每次有「token 漲價」「GPU 短缺」訊號出來,市場都會出現一波「AI 採購寒冬」的警示文,但實際發生的事情都是廠商分化——便宜 tier 反而推得更兇、自架方案的 ROI 變得更甜。

我們的判斷是:HBM 緊縮對「中小企業 AI 採購」是中性偏正面的訊號。flagship 模型漲價會讓 mid-tier 模型(mini / nano、自架量化模型)的相對 CP 值變得更高。中小企業的真正風險不是「token 漲價」,是「沒有 fallback 廠商,被單一廠商鎖定後跟著漲」。所以正確反應不是「停止導入 AI」,而是「重新校準 flagship vs mini 配比 + 加 fallback 廠商」。

我們的具體取捨:把 30% 的 flagship 預算切到 mid-tier(mini / Claude Haiku、Gemini Flash),把節省下來的成本拿來做 fallback 工程整合。3 年後贏的不會是「能買到最便宜 token 的人」,而是「能讓 token 預算在 5 家廠商之間流動的工程團隊」。

對中小企業老闆與採購主管的實際 framing

決策面向

個人視角(不建議)

中小企業老闆 / 採購主管視角(正確)

主要 KPI

「flagship 越強越好」「token 越便宜越好」

「年度 AI TCO 控制在預算內 ± 5%」「廠商集中度 < 60%」

決策層級

個人試用、月帳單看一下

採購 + IT + 法務三邊 quarterly review,加上 HBM 緊縮這類大環境訊號

預期投入

$20-100/月個人訂閱

Token 預算 NT$50 萬-1,000 萬/年 + fallback 工程 NT$50 萬-300 萬

風險容忍度

今天不行就換

簽 12-24 個月合約,HBM 緊縮週期可能 18-24 個月,要在合約裡寫退場條款

CTA 落點

ChatGPT Plus 試用

客製化 AI 系統 TCO 諮詢、跨廠商 routing 規劃

延伸閱讀:跟這篇相關的 AI 採購文章

需要重抓 AI TCO 與 fallback 廠商策略

如果你是中小企業老闆、IT 主管,這次 HBM 漲價 + Microsoft $190B capex 的訊號讓你「不確定 H2 預算要不要重抓」,可以直接聊。我們做過 30+ 企業客製化系統落地,超過一半涉及多廠商 AI routing。先聊聊你的工作流、廠商集中度、合約週期,再決定 90 天行動清單怎麼跑。預約 AI 顧問諮詢 → /services/ai-consult

ℹ️我們怎麼看

Microsoft $190B capex 與 HBM 緊縮是「算力供應從 single-source 過渡到 multi-source」的訊號。3 年後贏的不會是「能買到最便宜 token 的人」,而是「能讓 token 預算在 5 家廠商之間自由流動的工程團隊」。對中小企業老闆而言,這代表現在不要急著鎖定單一年約,但要開始問自己:「我能不能 4 小時內把 30% 的 AI 流量從 Azure OpenAI 切到 Anthropic?」答案是「不能」就是你接下來 90 天最高優先的工程任務。

ℹ️我們同時跑 4 家 AI 廠商

我們公司日常每天跑 20+ 條 AI 工作流,目前同時用 Azure OpenAI、Anthropic API、自架 Llama、Gemini 四家。從 prompt engineering、cross-provider routing、output schema 驗證到客戶系統落地,累積了 30+ 企業客製化案例的廠商分散經驗。想評估 H2 AI TCO 重抓策略,/services/ai-consult

QHBM 漲價會讓 ChatGPT Plus / Claude Pro 個人訂閱漲價嗎?

短期(6 個月)不會明顯漲,但「使用量上限」可能被收緊(同樣月費,token 上限縮)。長期(12-18 個月)月費可能漲 10-20%。

Q現在簽 Azure OpenAI 年約還划算嗎?

現在到 9 月是「簽年約鎖定低價」的窗口。但合約彈性條款(單方終止、SLA 寫死、廠商違約退費)一定要寫進去。9 月後預期 Azure 會推「新年約 + 漲價條款」,到時候議價空間會明顯縮。

Q中小企業要做 multi-provider routing 嗎?

年 token 預算 NT$50 萬以上的客戶建議做。50 萬以下可以先做「prompt abstraction + 兩家 SaaS 雙訂閱」,等量級到了再做正式 routing。

Q自架 Llama 在 HBM 緊縮週期值得嗎?

視場景。CPU 推論 + 量化模型(Q4 / Q5)的場景值得,因為不受 HBM 漲價影響。GPU 推論場景反而會被 GPU 漲價影響,要看是否有「固定算力需求 + 高頻使用」才划算。

Q我用 Anthropic API 不用 Azure,是不是就安全?

短期相對安全(Anthropic 跟 Google + Broadcom 綁算力同盟分散),但長期 HBM 緊縮會傳導到整個業界。建議仍要做 fallback 廠商準備。

QMicrosoft 自家 MAI-Thinking-1 會稀釋 OpenAI 議價力嗎?

短期還不會(MAI 系列模型還在 catch-up),中長期會。預期 12-18 個月 Microsoft 會推「Azure 自有模型 + 便宜 tier」搶 ChatGPT Business 客戶,這對中小企業是好消息——多一個議價籌碼。

分享文章

AUTHOR

自由揚AntonyLin

留言(0)

尚無留言,成為第一個留言的人吧!

需要網站系統架設或軟體開發?

無論是品牌官網、客製化系統還是應用程式,我們的團隊擁有豐富經驗,歡迎聯繫我們,讓專業為您的事業加分。