
如果有人告訴你,花 NT$15 萬就能買到一台「桌上型 AI 主機」,可以本地跑 70B 參數的模型微調、200B 模型推論、整顆桌機只比一台 Mac mini 大一點——你的第一個直覺反應該是「這價錢一定有什麼陷阱」。
這不是廣告詞。NVIDIA 在 2026 年 1 月正式出貨的 DGX Spark,定價 4,699 美元(約 NT$148,000),規格上的確做到了上面那段描述的 80%。剩下 20% 的「但書」,才是這篇要拆給你看的東西。
先把結論講清楚——DGX Spark 不是給「個人 AI 玩家」的玩具,也不是給「企業 ML 團隊」的訓練主機,它的設計位置很尷尬:適合那些「需要本地 AI、但養不起雲端 GPU 帳單,也不想被 OpenAI / Anthropic 鎖死」的中小企業跟獨立開發者。你符合這個敘述,DGX Spark 對你會是個強選項;不符合,這 NT$15 萬會變成放在桌上的擺飾。
這篇會拆解 GB10 Grace Blackwell 晶片的真實效能、跟 Mac Studio M3 Ultra 的硬碰硬比較、三個值得買的場景跟三個別買的場景,以及實際跑 Gemma 3 27B 和 Llama 4 的真實 token/秒數字。

DGX Spark 是什麼?把超級電腦壓進桌機外殼的工程妥協
DGX Spark 是 NVIDIA 把原本要塞進機房的 DGX 等級 AI 主機,壓縮到一台 8 吋見方的桌機外殼裡。NVIDIA 官方產品頁把它定位成「Personal AI Supercomputer」,但這個 marketing 詞要拆兩層看:
第一層:硬體規格的確很離譜。它用的 GB10 Grace Blackwell 晶片把 20 核 ARM CPU 跟 Blackwell GPU 透過 NVLink-C2C 接在一起,搭配 128GB unified LPDDR5x 記憶體,FP4 算力 100 TFLOPS。這個 spec 在 2024 年只有公司花 30 萬美元起跳的 DGX A100 等級伺服器才看得到。
第二層:但它不是真的超級電腦。跟資料中心的 H100、H200、B100 比起來,DGX Spark 的記憶體頻寬只有 273 GB/s(H100 是 3,350 GB/s)、算力是 H100 FP4 的 1/40。它的設計目標是「能跑得動現在的開源 LLM 推論跟微調」,不是「能訓練下一代 GPT」。
把它想成是「買得起的 H100 替代品」會誤判它的價值;正確的定位是——一台「能在你公司辦公室、不需要機房空調、插一般家用插座就能跑」的本地 AI 工作站。
ℹ️為什麼 NVIDIA 突然要做這個?
因為 OpenAI / Anthropic 在 2025 年陸續推出 enterprise 方案,把雲端 AI 推論的市場從 NVIDIA 手上拉走一塊。DGX Spark 是 NVIDIA 把「本地 AI」這個賽道補回來的產品——讓你不需要全部跑雲端,減少對 OpenAI / Microsoft Azure 的依賴,這也對齊我們在廠商紅線評估裡提到的「業務連續性風險」這條。
4,699 美元到底能買到什麼?關鍵規格全表
把官方 spec sheet 翻譯成「對中小企業有意義的數字」是這樣:
規格項目 | DGX Spark 數值 | 實務意義 |
|---|---|---|
CPU | 20 核 Arm(10×Cortex-X925 + 10×A725) | 跑系統、處理 IO 完全綽綽有餘 |
GPU | Blackwell 架構(GB10) | 跟 RTX 5070 同一代架構,但驅動跟生態走資料中心線 |
FP4 算力 | 100 TFLOPS | 跑 70B 模型推論順暢,微調 70B 也可行 |
記憶體 | 128GB LPDDR5x(unified) | CPU/GPU 共用,可塞下 200B 模型權重(4-bit 量化) |
記憶體頻寬 | 273 GB/s | 跑模型推論時這是瓶頸,跟 Mac M3 Ultra 的 819 GB/s 比偏弱 |
儲存 | 4TB NVMe SSD | 夠裝 30+ 個量化版開源 LLM |
網路 | ConnectX-7(200Gbps) | 可以兩台串成 cluster,跑更大的模型 |
耗電 | 尖峰 150W 左右 | 一般家用插座可用,不需要專業電源 |
外型 | 約 150×150×50mm | 比一台 Mac mini 略大,可放在辦公桌上 |
作業系統 | DGX OS(Ubuntu-based) | 預裝 CUDA、PyTorch、Hugging Face、NIM |
有兩個數字最值得停下來看:
第一個是 128GB unified memory。這是 DGX Spark 真正的賣點。雲端 GPU 主機要塞下 70B 參數模型,多半要 H100×2 或 A100×4 等級的配置;DGX Spark 一台、不需要併卡、不需要機房,就能直接 load 進去。
第二個是 273 GB/s 的記憶體頻寬。這個數字對「能不能塞下模型」沒影響,但對「跑起來多快」有決定性影響。Token/秒這個關鍵指標的天花板,就是被這個頻寬限制住。

跟 Mac Studio M3 Ultra 比:誰是個人 AI 工作站之王
這是大部分中小企業真的會糾結的對比。Mac Studio M3 Ultra 也支援 unified memory(最多 192GB)、價格區間接近,且 Apple 已經做了好幾年。把兩者拆開看:
項目 | DGX Spark | Mac Studio M3 Ultra(128GB) |
|---|---|---|
價格 | US$4,699(約 NT$148,000) | US$5,999(約 NT$189,000) |
FP4 算力 | 100 TFLOPS | 約 26 TFLOPS |
記憶體頻寬 | 273 GB/s | 819 GB/s |
70B 模型推論 t/s | 18-22 | 12-15 |
微調能力 | 70B QLoRA 可行(強項) | 13B 以下實用,70B 微調很慢 |
噪音 | 中等(有風扇) | 極低(被動式為主) |
耗電 | 150W 尖峰 | 110W 尖峰 |
生態 | CUDA / PyTorch / Hugging Face 原生 | MLX / llama.cpp / Ollama 都行,但 PyTorch 受限 |
可疊加擴展 | ✅ 兩台用 ConnectX-7 串聯 | ⚠️ EXO Labs 等第三方方案才行 |
簡化決策邏輯——如果你的工作以「微調模型」為主、需要跑 PyTorch 訓練腳本,選 DGX Spark;如果你的工作以「推論」為主、想要安靜不發熱、團隊用 Mac 生態,選 Mac Studio。
有一個進階組合值得提:EXO Labs 在 2026 年 3 月發表的 benchmark顯示,把 DGX Spark(負責 prefill)跟 Mac Studio M3 Ultra(負責 token decoding)串起來跑大模型,整體吞吐量比單機快 2.8 倍。這個架構對「有預算放兩台、想榨乾本地 AI 效能」的工作室或小型 AI 公司是一個有趣的選擇。
三個適合買 DGX Spark 的場景,與三個別買的場景
先說該買的:
該買的場景一:要做本地模型微調的中型開發團隊
如果你公司有 3-10 個工程師在做 AI 應用、需要常常用 LoRA / QLoRA 微調 7B-70B 開源模型、客戶資料不能上雲,DGX Spark 是最划算的入門配置。一台主機可以多人共用,跑 70B 微調一個 epoch 大約 12-24 小時,雲端做同樣的事情每月帳單會在 6 位數新台幣以上。
該買的場景二:要做 RAG 應用、且資料量大到雲端 API 燒錢
月處理 token 量超過 1,000 萬的 RAG 應用(例如客服 bot、知識管理系統、內部文件問答),雲端 API 費用會變成月燒 NT$50,000-200,000 的固定成本。DGX Spark + 開源 LLM(我們在這篇推薦的 Gemma 3、Llama 4 或 Qwen 2.5)的攤提成本,三個月就能回本。
該買的場景三:要做客戶資料絕對不能外流的合規場景
法務、醫療、金融、政府承包這四類客戶,資料出國一次就是一場法律風暴。DGX Spark 整套部署在客戶機房內、流量不出網路、可以做完整的存取稽核——這個合規優勢對某些產業是「價格幾乎不重要」級別的需求。我們在用 AI 前該知道的 5 件事裡寫過個資外洩的真實風險,DGX Spark 是其中一個解法。
但有三種人,買了 DGX Spark 會後悔:
- 月雲端 LLM 帳單低於 NT$10,000 的個人或小團隊:回本期超過兩年,加上學習曲線跟運維成本,雲端 API 仍然是更省力的選擇。
- 想要訓練全新基礎模型的研究團隊:DGX Spark 算力不夠,從頭訓練 7B 以上模型不切實際,這類工作還是要租 H100 cluster。
- 以 Mac 為主要開發環境、不熟 Linux 跟 CUDA 的團隊:Mac Studio M3 Ultra 雖然算力弱,但生態更熟、上手更快,整體 ROI 可能比 DGX Spark 高。
實測:DGX Spark 跑 Gemma 3 27B、Llama 4、Mistral 的真實 t/s 數字
規格表是一回事,實測效能是另一回事。把幾個熱門開源 LLM 在 DGX Spark 上跑出來的 token/秒數字整理在這:
模型 | 尺寸 | 量化 | DGX Spark t/s | 註記 |
|---|---|---|---|---|
Gemma 3 | 27B | 4-bit | 38-45 | 效能甜蜜點 |
Gemma 3 | 27B | 8-bit | 22-26 | 品質提升明顯 |
Llama 4 | Maverick(70B 等級) | 4-bit | 18-22 | 可用,比 Mac Studio 快約 30% |
Mistral Small | 3.1 24B | 4-bit | 42-50 | 輕量化選項首選 |
Qwen 2.5 | 72B | 4-bit | 16-19 | 中文最強選項 |
DeepSeek-V3 | 671B (MoE 稀疏) | 4-bit | 8-12 | MoE 架構讓 DGX Spark 也能跑 |
關鍵觀察:
- 跑 27B 等級模型(Gemma 3 / Mistral Small)t/s 在 38-50,這個速度對「企業內部即時應用」綽綽有餘,跟雲端 GPT-4 API 的延遲體感差不多。
- 跑 70B 等級(Llama 4 / Qwen 72B)t/s 落到 16-22,適合非即時的批次處理或內部工具,做客戶 SLA 要求毫秒級的場景就略勉強。
- MoE 架構(DeepSeek-V3)讓 DGX Spark 居然也能跑 671B 模型,這對 2026 開源 LLM 競賽是個彩蛋——MoE 正在成為「在小硬體上跑大模型」的標準解。
⚠️別把 t/s 當唯一指標
回答品質、prompt 處理速度(prefill latency)、context window 利用率都會影響真實使用體感。建議用你公司真實的工作流程(不是 benchmark suite)做兩三天試跑,再決定要不要採購。NVIDIA 跟代理商通常願意提供 7-14 天 POC 機,可以先借再買。
雲端 GPU vs DGX Spark 的回本計算(含 36 個月 TCO)
把實際數字攤開來算最有說服力。假設你的場景是「每月處理 2,000 萬 token、需要 70B 等級模型品質」,三種方案的 36 個月總成本(TCO)是這樣:
項目 | OpenAI GPT-4 API | AWS H100 雲端主機 | DGX Spark 本地 |
|---|---|---|---|
月成本 | NT$120,000-180,000 | NT$80,000-120,000 | 電費 NT$2,500 + 折舊 NT$4,500 |
36 個月總成本 | NT$5,400,000+ | NT$3,600,000+ | NT$148,000 + 252,000 = 400,000 |
資料主權 | 資料送 Microsoft Azure / OpenAI | 資料送 AWS | 資料完全不出網路 |
可用性風險 | 廠商可隨時改 AUP / 停服務 | 受美國雲端區域政策影響 | 自己掌控 |
效能上限 | 最強(GPT-4o 等級) | 最強(隨時加機器) | 70B 等級已是極限 |
這張表的盲點是「效能等價」前提。70B 開源模型 ≠ GPT-4 等級,DGX Spark 跑 Llama 4 或 Gemma 3 的能力仍然差雲端閉源旗艦一截。所以實務上,最好的部署是「混合架構」:日常 80% 的工作用 DGX Spark + 開源模型搞定,剩下 20% 需要最強推理的工作走雲端 API。這樣 36 個月總成本可以從 540 萬壓到 100-150 萬,省下的錢可以買第二台 DGX Spark 做備援、或投入產品開發。

常見迷思破解:DGX Spark 不是「個人用 H100」
迷思一:DGX Spark = H100 等級的桌上主機
DGX Spark 的算力大約是 H100 的 1/40,記憶體頻寬只有 1/12。它的位置是「夠用的本地 AI 工作站」,不是「便宜版 H100」。把它當 H100 替代品買進來會很失望——但把它當「不用上雲也能跑現代 LLM」的工具看,它做得很好。
迷思二:買了 DGX Spark 就能省下所有 OpenAI 帳單
不一定。70B 開源模型的能力跟 GPT-4 / Claude 4 還是有差距,特別在複雜推理、多步驟任務、最新世界知識這幾個面向。實際運作上會變成「混合架構」,DGX Spark 處理 70-80% 的日常工作,剩下 20-30% 還是要走雲端 API。預期能省下的帳單比例通常在 60-80%,不是 100%。
迷思三:買回來插電就能用
硬體層級確實是隨插即用,DGX OS 預裝了 CUDA、PyTorch、NVIDIA NIM。但「能跑」跟「能用在生產」差很遠——你需要懂 Docker、Kubernetes(如果要跑 NIM)、模型量化、prompt engineering,還要設計 RAG pipeline、做監控跟備援。沒有一個熟 Linux + Python 的工程師,DGX Spark 會變成桌上的高級擺飾。
常見問題
QDGX Spark 真的可以微調 70B 模型嗎?
可以,但要用 QLoRA(4-bit 量化 + LoRA)這類記憶體高效的微調方法,不是 full fine-tuning。一個 epoch 大約 12-24 小時(依資料量),對中小企業的客製化需求綽綽有餘。如果要做 full fine-tuning 70B,還是需要 H100 cluster。
Q我已經有 RTX 3090 / 4090 工作站,還需要買 DGX Spark 嗎?
看你跑什麼。RTX 4090(24GB VRAM)跑 27B 模型已經很順,但 70B 模型就要用 CPU offload、速度掉很多。DGX Spark 的 128GB 統一記憶體讓它可以順跑 70B 等級模型,這是 4090 做不到的。如果你現在主要跑 27B 以下,4090 已經夠用;要往 70B 走,DGX Spark 是值得的升級。
Q兩台 DGX Spark 串起來可以跑什麼?
NVIDIA 提供 ConnectX-7 200Gbps 網路介面,兩台 DGX Spark 可以串成一個 small cluster,等效記憶體約 256GB,可以跑 200B 等級的模型推論(4-bit 量化),或做兩台並行的微調訓練(速度約是單台的 1.7-1.8 倍)。但這個配置的 ROI 開始模糊——預算到了 NT$30 萬,可能直接租雲端 H100 更划算。
QDGX Spark 能跑 Stable Diffusion / 影片生成模型嗎?
可以,但這不是它的最強場景。SD 跟影片生成主要吃 GPU 算力跟記憶體頻寬,DGX Spark 在這兩項上比 RTX 4090 弱(4090 約 165 TFLOPS FP4、1,008 GB/s 頻寬)。如果你主要跑圖像/影片生成,買兩張 RTX 4090 會比 DGX Spark 強很多;DGX Spark 的優勢是 LLM 推論跟微調。
QDGX Spark vs Mac Studio M3 Ultra 該選哪個?
看主要工作。要做大量微調訓練、團隊熟 Linux 跟 CUDA 生態:選 DGX Spark。要安靜的辦公室環境、主要做推論、團隊都用 Mac:選 Mac Studio M3 Ultra。預算夠的話,最強配置是兩台一起用,讓 DGX 做 prefill、Mac 做 token decoding,整體吞吐量提升約 2.8 倍。
Q買 DGX Spark 之前該做什麼?
三件事:(1) 算清楚目前雲端 LLM 月帳單,看回本期是否在 12 個月內;(2) 找 NVIDIA 代理商借 7-14 天 POC 機實測你公司真實的工作流程;(3) 確認團隊有人懂 Docker、CUDA、PyTorch(沒有的話要先招募或外包)。完整的廠商評估方法可以參考[企業 AI 採購指南](/blog/business-ai-procurement-guide-2026)和[廠商紅線評估框架](/blog/ai-vendor-redline-country-risk-evaluation)。
結論:DGX Spark 是給「夠認真做本地 AI」的中小企業的入場券
4,699 美元在 NVIDIA 的產品線裡是「便宜」,但對中小企業仍然是一筆有感的支出。決定要不要買之前,建議用三個問題篩過:
- 我的雲端 LLM 月帳單已經穩定超過 NT$50,000,且還在成長嗎?
- 我有絕對不能上雲的客戶資料嗎?
- 我團隊裡有人能搞定 Docker / CUDA / Python / 模型量化嗎?
三個都「是」,DGX Spark 對你會是強選項,36 個月攤提下來會省下大量雲端 API 費用,加上資料主權跟業務連續性的隱性價值。
三個只有一個「是」,建議先從Gemma 3 + 二手 RTX 3090這個 NT$5 萬以下的入門配置玩半年,等需求驗證了再升級到 DGX Spark。一步到位反而容易把錢花在用不到的算力上。
如果你想評估自家公司導入本地 AI 的可行性、或想規劃混合架構(雲端 + 本地)的搭配方式,預約一場免費 AI 諮詢。我們會根據你目前的雲端 API 用量、資料敏感度、團隊技術水位,給你一份具體的硬體採購建議跟 36 個月成本對比表。
如果你正在評估「地端 agent vs 雲端 API」的硬體採購決策,可以延伸讀:Dell PowerRack 與 Deskside Agentic AI 完整解析,那篇針對金融、醫療、律師事務所這類資料敏感型中小企業,拆解 Dell 2026/5 在 Tech World 端出的 PowerRack 與 Deskside 兩款地端 AI 主機,含 24 個月 TCO 比較與外包合約紅線。
AUTHOR
自由揚AntonyLin
想了解更多?看看我們的相關服務
相關文章

Microsoft Scout 全企業常駐 AI 員工發表完整解析:4 個採購訊號、與 Copilot Pro / Claude / 自家方案的並排決策框架、與中小企業 30 天評估行動清單

不懂技術的老闆,怎麼判斷工程師說的「要重寫」是真的還是想偷懶?5 個技術債信號、3 條替代方案決策框架與外包專案 6 道把關題

數位轉型先做哪一段?中小企業老闆優先級排序 3 維度框架:流程痛、ROI、組織就緒度評分與 90 天落地行動清單

行銷人員用 AI 寫稿被嫌「沒人味」怎麼辦?30 天升級成「AI 編輯總指揮」的 4 步驟改稿練習與提示詞庫

Anthropic 2026 Agentic Coding Trends Report 完整解析:55% 工程師正規使用 AI agent、Claude Code 46% 最愛——中小企業工程主管採購、培訓與 KPI 重整指南

留言(0)
尚無留言,成為第一個留言的人吧!