Anthropic 指控阿里巴巴進行非法模型蒸餾

Anthropic 指控阿里巴巴進行大規模模型蒸餾

Anthropic 正式指控阿里巴巴及其 AI 實驗室 Alibaba Qwen 透過非法手段從 Claude AI 模型中提取能力。在寄給美國參議院銀行委員會的一封信中，Anthropic 將此行動描述為針對該公司已知規模最大的此類攻擊，旨在加速中國達到 Anthropic 先進的 "Mythos Preview" 模型的能力。

攻擊的規模與執行方式

根據 Anthropic 的說法，該行動發生在 2026 年 4 月 22 日至 6 月 5 日之間。該行動涉及：

規模： 與 Claude 的對話次數超過 2,880 萬次。
基礎設施： 使用了近 25,000 個欺詐帳號以規避限制。
方法： 模型蒸餾（Model distillation），即透過強大模型的輸出結果來訓練一個較小、能力較弱的模型，以模仿其性能。

這是在 Anthropic 於 2026 年 2 月提出的先前指控之後，當時它發現了其他中國實驗室進行的類似蒸餾行動，包括 DeepSeek（超過 150,000 次對話）、Moonshot AI（超過 340 萬次）以及 MiniMax（超過 1,300 萬次）。

地緣政治與監管影響

這些指控發生在美中之間關於 AI 知識產權與國家安全的高度緊張局勢下。2026 年 4 月，白宮指控中國在工業規模上竊取美國的 AI 知識產權。

政府回應與限制

阿里巴巴的地位： 阿里巴巴在 2026 年 6 月被列入五角大廈的中國軍事企業名單中，該公司目前正在對此認定提出挑戰。
貿易黑名單： 雖然一個跨部門政府委員會認為 DeepSeek 構成國家安全風險，但據報導美國商務部已暫緩將該公司列入貿易黑名單，以避免與北京之間緊張局勢升級。
模型限制： 2026 年 6 月 12 日，由於擔心 Mythos 和 Fable 模型可能被中國軍事情報部門使用，美國商務部對 Anthropic 的最新 Mythos 和 Fable 模型實施了限制。因此，Anthropic 全球範圍內禁用了這些模型的存取權。

技術與產業觀點

產業觀察家與技術評論者針對蒸餾的性質以及 AI 訓練數據的倫理問題提出了幾點看法。

蒸餾的機制

一些技術分析師將蒸餾區分為兩種主要類型：

黑盒蒸餾（Black Box Distillation）： 一種「龐大且笨拙」的方法，透過強大模型生成的簡單問答對來訓練模型。
RLAIF (Reinforcement Learning from AI Feedback)： 一種更具針對性的方法，其中一個模型直接引導另一個模型的訓練，這在許多商業微調工作流程中很常見。

「Token 再銷售」經濟

報告指出，存在一個複雜的中國轉售商生態系統，這些轉售商以 70-90% 的折扣提供 Claude tokens。這些轉售商據稱使用集體帳號與支付欺詐來提供存取權，並以用戶日誌與推理軌跡（reasoning traces）作為補貼成本，隨後將其作為訓練數據出售給中國的 AI 實驗室。

倫理與法律辯論

技術社群中的許多人認為，鑑於大型語言模型（LLM）的訓練性質，Anthropic 的投訴被視為偽善。

"Crawl the whole Internet to build a gargantuan sized LLM and then complain you're being copied..."

批評者認為，因為 LLM 是在沒有明確同意或補償的情況下，利用大量人類生成的內容數據集進行訓練，所以蒸餾一個模型的輸出結果，在根本上與原始訓練過程非常相似。其他人則認為，Anthropic 的公開抗議是為了爭取政府保護並進加強對晶片出口管制，以維持競爭優勢。

Anthropic 指控阿里巴巴進行非法模型蒸餾

Anthropic 指控阿里巴巴進行非法模型蒸餾

Anthropic 指控阿里巴巴進行大規模模型蒸餾

攻擊的規模與執行方式

地緣政治與監管影響

政府回應與限制

技術與產業觀點

蒸餾的機制

「Token 再銷售」經濟

倫理與法律辯論

Sources