Anthropic 指控阿里巴巴進行非法模型蒸餾

Anthropic 指控阿里巴巴進行非法模型蒸餾

Anthropic 指控阿里巴巴進行大規模模型蒸餾

Anthropic 正式指控阿里巴巴及其 AI 實驗室 Alibaba Qwen 透過非法手段從 Claude AI 模型中提取能力。在寄給美國參議院銀行委員會的一封信中,Anthropic 將此行動描述為針對該公司已知規模最大的此類攻擊,旨在加速中國達到 Anthropic 先進的 "Mythos Preview" 模型的能力。

攻擊的規模與執行方式

根據 Anthropic 的說法,該行動發生在 2026 年 4 月 22 日至 6 月 5 日之間。該行動涉及:

  • 規模: 與 Claude 的對話次數超過 2,880 萬次。
  • 基礎設施: 使用了近 25,000 個欺詐帳號以規避限制。
  • 方法: 模型蒸餾(Model distillation),即透過強大模型的輸出結果來訓練一個較小、能力較弱的模型,以模仿其性能。

這是在 Anthropic 於 2026 年 2 月提出的先前指控之後,當時它發現了其他中國實驗室進行的類似蒸餾行動,包括 DeepSeek(超過 150,000 次對話)、Moonshot AI(超過 340 萬次)以及 MiniMax(超過 1,300 萬次)。

地緣政治與監管影響

這些指控發生在美中之間關於 AI 知識產權與國家安全的高度緊張局勢下。2026 年 4 月,白宮指控中國在工業規模上竊取美國的 AI 知識產權。

政府回應與限制

  • 阿里巴巴的地位: 阿里巴巴在 2026 年 6 月被列入五角大廈的中國軍事企業名單中,該公司目前正在對此認定提出挑戰。
  • 貿易黑名單: 雖然一個跨部門政府委員會認為 DeepSeek 構成國家安全風險,但據報導美國商務部已暫緩將該公司列入貿易黑名單,以避免與北京之間緊張局勢升級。
  • 模型限制: 2026 年 6 月 12 日,由於擔心 Mythos 和 Fable 模型可能被中國軍事情報部門使用,美國商務部對 Anthropic 的最新 Mythos 和 Fable 模型實施了限制。因此,Anthropic 全球範圍內禁用了這些模型的存取權。

技術與產業觀點

產業觀察家與技術評論者針對蒸餾的性質以及 AI 訓練數據的倫理問題提出了幾點看法。

蒸餾的機制

一些技術分析師將蒸餾區分為兩種主要類型:

  1. 黑盒蒸餾(Black Box Distillation): 一種「龐大且笨拙」的方法,透過強大模型生成的簡單問答對來訓練模型。
  2. RLAIF (Reinforcement Learning from AI Feedback): 一種更具針對性的方法,其中一個模型直接引導另一個模型的訓練,這在許多商業微調工作流程中很常見。

「Token 再銷售」經濟

報告指出,存在一個複雜的中國轉售商生態系統,這些轉售商以 70-90% 的折扣提供 Claude tokens。這些轉售商據稱使用集體帳號與支付欺詐來提供存取權,並以用戶日誌與推理軌跡(reasoning traces)作為補貼成本,隨後將其作為訓練數據出售給中國的 AI 實驗室。

倫理與法律辯論

技術社群中的許多人認為,鑑於大型語言模型(LLM)的訓練性質,Anthropic 的投訴被視為偽善。

"Crawl the whole Internet to build a gargantuan sized LLM and then complain you're being copied..."

批評者認為,因為 LLM 是在沒有明確同意或補償的情況下,利用大量人類生成的內容數據集進行訓練,所以蒸餾一個模型的輸出結果,在根本上與原始訓練過程非常相似。其他人則認為,Anthropic 的公開抗議是為了爭取政府保護並進加強對晶片出口管制,以維持競爭優勢。

Sources