Claude Mythos 與 AI 驅動網路安全現狀
Claude Mythos 與 AI 驅動網路安全現狀
Claude Mythos 的發布及其隨後的監管限制,引發了關於網路安全未來的激烈辯論。雖然該模型能夠進行自動化的漏洞搜尋與利用(zero-days),但對於安全專業人員而言,核心的啟示是:基本的防禦策略仍然是最有效的對策。AI 驅動的攻擊增加了漏洞發現的效率,但它們並不會繞過對成熟安全態勢的需求。
Claude Mythos:能力與局限性
Claude Mythos 是第一個在「專家級任務」中取得成功,並完成「The Last One」的 AI 模型,後者是一個測試從偵察到網路接管完整攻擊鏈的網路靶場(cyber-range)。其相對於先前模型的主要優勢在於,它不僅能識別漏洞,還能透過建立有效的漏洞利用程式(exploits)來證明其可利用性,從而顯著降低了誤報率。
儘管具備這些能力,Mythos 的影響力仍受到幾個因素的限制:
- 高昂的營運成本: 尋找單個漏洞(例如一個 27 年前的 OpenBSD bug)可能需要透過 scaffold 進行數千次運行,耗費約 20,000 美元的 token。這使得高端 AI 漏洞利用成為資金雄厚的行為者所使用的工具,而非一般攻擊者。
- 漸進式的進展: 基準測試顯示,像 GPT-5.4 和 Opus 4.6 這樣的模型在進階 CTF 挑戰中並不落後太多,這表明能力的提升是線性的而非指數級的跳躍。
- 環境雜訊: 目前的 AI 模型在偵察和橫向移動(pivoting)期間通常仍顯得「雜亂且笨拙」,這使得它們容易被成熟企業環境中的主動防禦者和安全工具偵測到。
競爭格局與監管干預
AI 網路安全競賽的特點是高調發布產品,隨後便遭遇政府干預。在 Mythos 及其強化了安全防護的版本 Fable 5 發布後,美國政府封鎖了非美國公民的存取權限,最終將存取權限限制在經過審核的美國機構群體中。
相關的發展還包括:
- OpenAI 的做法: OpenAI 已發布 GPT-5.5-Cyber 和 Codex Security 插件,透過「Daybreak」和「Patch the Planet」等專案專注於防禦者端。最近,OpenAI 推出了 Sol、Terra 和 Luna 模型系列,這些模型偏向於防禦。
- 開源替代方案: DeepSeek、Gemma 4 和 Qwen 3.6 等模型已在某些基準測試中展示了發現大約一半 Mythos 所發現漏洞的能力,這表明 AI 輔助的漏洞發現正趨於民主化。
AI 時代的策略性防禦優先事項
由於 AI 增加了漏洞發現的速度,組織必須優先考慮降低漏洞被利用的可能性。以下策略至關重要:
1. 上下文感知漏洞管理
CVE 發布率的增加是一個在 Mythos 出現之前就已存在的趨勢。目標應該是進行上下文感知的優先級排序。組織不應僅依賴通用的漏洞評分,而應使用 LLM 來分析漏洞是否對業務至關重要、是否容易被觸及,或是受到補償性控制措施的保護。
2. 攻擊面縮減
減少可用目標的數量是最有效的防禦。這包括:
- Distroless Containers: 使用極簡化鏡像(例如 Google 的 distroless 專案、Docker Hardened Images 或 Talos Linux)來移除不必要的二進位檔。
- Server Core: 利用精簡版的 Windows Server 來最小化佔用空間。
3. 深度防禦與欺騙技術
在「網路安全洋蔥」中增加層次可以減緩入侵者。有效的層次包括:
- 上下文感知代理: 實施前置驗證閘道,以確保攻擊者無法觸及漏洞服務。
- 蜜罐與 Canary Tokens: 由於 AI 模型在方法論上往往具有重複性且直白,它們比人類攻擊者更容易觸發誘餌系統。
4. Zero Trust 架構
應用「明確驗證、使用最小權限存取、並假設已遭入侵」的原則至關重要。Zero Trust Network Access (ZTNA) 確保即使某個軟體具有未經身份驗證的遠端程式碼執行 (RCE) 漏洞,攻擊者也無法在未經事先驗證的情況下觸及該服務。
行業觀點與反論點
技術專家強調,雖然前沿模型(frontier models)功能強大,但它們並不會解決技術債和配置錯誤等底層的系統性問題。
「絕大多數的安全問題都與錯誤的配置、錯誤的做法、意外以及運氣不佳有關……公司的技術債是最大的安全威脅。」
此外,有人認為,對於前沿模型所帶來的威脅,最永續的長期解決方案是轉向使用記憶體安全語言(memory-safe languages),以消除 AI 特別擅長發現的整類漏洞(例如 use-after-free bugs)。