DeepSeek DSpark 推論優化實現 60–85% 的生成加速

DeepSeek 的 DSpark 將生成速度提升高達 85%

DeepSeek 宣布開源發佈 DSpark，這是一套推論時優化技術的集合，與基準實作相比，能將大型語言模型 (LLM) 的生成速度提升 60% 至 85%。此加速效果降低了提供 LLM 服務的延遲與運算成本，使即時應用程式更具實用性。

這些組件已在 GitHub 上以開源授權發佈，允許開發者直接將其整合到現有的推論管線中。

根據 DSpark 論文（連結於公告中），作者在多個熱門的 LLM 上評估了這些優化技術。報告顯示在以下範圍內皆可觀察到 60%–85% 的生成時間減少：

論文中包含了詳細的表格，比較了基準執行時間與經 DSpark 增強後的執行時間，證實了在不犧牲輸出品質的情況下，能獲得一致的加速效果。

更快的 token 生成速度直接轉化為：

對於大規模部署大型模型的組織而言，這些益處尤為關鍵，因為微小的效率提升都能帶來實質性的節省。

該儲存庫包含了針對 PyTorch 與 TensorFlow 等熱門框架的範例腳本，簡化了採用過程。

雖然 Hacker News 的討論尚未產生評論，但該公告已吸引了顯著的關注，反映在其 HN 的高分值上。DSpark 的開源性質邀請社群進行貢獻與進一步調校，未來可能將加速效果擴展到更多模型架構與硬體加速器。

DeepSeek 的 DSpark 為 LLM 生成提供了 實質性的 60%–85% 加速，提供了一條通往更高效推論的開源路徑。透過降低延遲與成本，DSpark 有助於縮短尖端語言模型與現實世界、生產級應用程式之間的差距。