Nvidia RTX Spark: Windows PC 的全新統一記憶體架構

Nvidia RTX Spark: Windows PC 的全新統一記憶體架構

Nvidia 正在為 Windows PC 提議一種全新的 CPU 系統,旨在將 AI 工作負載從雲端移至本地裝置。該系統的主要技術優勢在於其統一記憶體架構,允許 CPU 與 GPU 共用單一 128GB 的記憶體池,從而減少透過 PCIe bus 傳輸數據的需求,並能夠執行更大的本地 AI 模型。

硬體規格

提議的系統將高效能運算能力與共享記憶體池整合,以針對 AI 與遊戲工作負載進行優化:

  • GPU Compute: 高達 6,144 個頂尖的 CUDA cores。
  • CPU Configuration: 總共 20 個核心,包含 10 個基於 Cortex-X925 的效能核心與 10 個效率核心。
  • Memory: 128GB 的統一共享記憶體。
  • Instruction Sets: Cortex-X925 核心支援六個 128-bit SIMD 執行單元 (SVE2)。

統一記憶體架構的影響

統一記憶體是此提案中的核心架構轉變,反映了 Apple Silicon 所採取的路徑。透過消除 CPU 與 GPU 的獨立記憶體池,系統可以根據即時需求優化資源利用率,並透過使用單一記憶體類型來降低系統組裝的整體成本。

雖然統一記憶體通常比專用的 GDDR GPU 記憶體慢,但它提供了足以在本地執行 AI 模型的頻寬。

技術討論強調,對於許多消費級工作負載與本地 AI 使用場景,專用 GPU 記憶體的高頻寬往往未被充分利用,因此使用大型共享池來處理大型模型權重更為實際。

本地與混合 AI 工作流

轉向本地硬體被視為 Nvidia 與 Microsoft 提供「不限量的智慧」的一項戰略舉措。此架構支援兩種主要的 AI 部署模型:

  1. Local AI: 完全在裝置上執行模型,以實現隱私、安全性與成本效益,並避免按 token 計費的雲端定價。
  2. Hybrid AI: 一種代理式工作流 (agentic workflow),由大型雲端模型協調任務,並將較小、特定領域的任務委派給本地模型 (例如 Gemma 4:12b 或 Qwen-27b) 以降低延遲。

技術評論與競爭格局

業界觀察家與開發者針對該系統相對於現有硬體的定位提出了幾點看法:

效能比較

某些分析師認為,與現有的高階矽晶片相比,該硬體並非「猛獸」。批評者指出,記憶體頻寬 (約 300GB/s) 顯著低於 Apple M5 Max (614GB/s),且僅略高於 AMD Strix Halo (256GB/s)。此外,,有人指出 GPU 效能與 RTX 5070 mobile 相當,對於進階用戶來說可能並非顯著的飛躍。

指令集效率

關於 Cortex-X925 使用的 SVE2 指令集效率存在爭議。一些開發者建議,近期 AMD 處理器中發現的 AVX-512 指令集更為優越,因為它們可以處理更多數據且更具通用性。

市場定位

批評者認為,此系統的真正價值不在於原始運算能力,而是在於能夠在省電的整合式系統上執行 CUDA——Nvidia 的專有並行運算平台。這使其成為在 ARM 架構的 Windows 筆記型電腦市場中,Apple M-series 與 Qualcomm Snapdragon X Elite 的直接競爭對手。

安全性與相容性考量

統一記憶體引入了特定的安全挑戰。由於 CPU 與 GPU 共用記憶體池,存在側向通道攻擊 (side-channel attacks) 的風險增加,其中一個處理器可能會潛在性地危害另一方的記憶體。這使得記憶體安全型軟體設計與 Rust 等語言對於這些系統的安全性變得更加關鍵。

此外,社群對於這些系統是否會支援 GNU/Linux 有極大的興趣,因為對於開發者而言,如此強大的硬體實用性通常取決於非 Windows 作業系統的可取得性。

Sources