AutoGrad 與貝葉斯大腦：Jeff Beck 博士談 AI 的未來

核心論點：智慧不是函數近似

真正的人工智慧不能僅靠擴大 transformer 或改進函數近似來實現。智慧必須根植於與人類認知相同的領域：物理的、宏觀的世界。Jeff Beck 博士提出從龐大、單一的神經網路轉向「大量小模型」的方式——模組化、以物件為中心的貝葉斯模型，透過發現的力相互作用，類似生物大腦處理現實的方式。

AutoGrad vs. Transformers：真正改變 AI 的是什麼

雖然業界將當前 AI 熱潮歸功於 transformer 架構，Beck 博士卻認為真正的催化劑是 自動微分 (AutoGrad)。

AutoGrad 把 AI 開發從理論數學問題轉變為工程問題。透過自動化梯度計算，研究人員得以快速實驗不同的架構、非線性與記憶結構，而不必手動推導學習規則。這種工程上的轉變使模型得以超大規模擴展，進而帶來 transformer 的成功感。Beck 博士指出，其他架構（例如 Mamba——一種狀態空間模型）在規模化後也能達到類似功能，暗示由 AutoGrad 促成的擴展比特定的 transformer 架構本身更為關鍵。

貝葉斯大腦與主動推理

Beck 博士主張人類大腦是一個貝葉斯推理引擎，持續對世界提出假設並加以測試。這一點得到「最佳線索組合」行為實驗的支持：人類能以驚人的效率結合可靠與不可靠的感官資訊（例如視覺與聽覺線索）。

貝葉斯方法的關鍵原則：

假設檢驗：大腦使用以特定假設為條件的生成模型來描述世界。
資訊過濾：大部分腦活動用於決定什麼資訊可以被忽略，以避免資訊過載。
主動推理：基於 Karl Friston 的工作，該框架將資訊理論與統計物理結合，描述代理如何最小化驚訝（surprisal）以維持自身存在。

落腳問題：物理優於語言

當前大型語言模型（LLM）的一個根本缺陷是它們以語言為落腳點。Beck 博士認為語言是思考的劣質模型，因為心理學中的自我報告資料極不可靠；人們常以與實際決策過程不一致的方式解釋自己的行為。

要打造像人類一樣思考的 AI，必須以 宏觀物理 為基礎。這意味著 AI 應將世界視為具有特定關係與可供性（affordances）的物件，而非像素或詞彙。智慧必須具備身體性，因為物理環境提供了「思考的原子元素」——構建更複雜概念模型的基本構件。

「大量小模型」架構

Beck 博士不主張使用單一龐大的神經網路，而是構想一個類似電玩引擎的系統。在此架構中，AI 維持一個包含數千個小型、模組化模型的庫，每個模型代表一個特定物件或物件類別（例如「書本模型」）。

模組化物件模型的優勢：

計算效率：代理只會實例化與當前環境相關的少量模型，保持稀疏性。
系統工程：透過理解物件及其相互作用的力，AI 能執行「系統工程」——將已知物件以新方式組合，創造新事物（例如將翼型與噴射引擎結合成飛機）。
泛化能力：在一個領域學到的模型（例如房子內部）可以移植到另一個領域（例如公園），因為物件本身是模組化的。

解決泛化：倉庫裡的貓

Beck 博士以「倉庫裡的貓」問題說明當前 AI 的失敗。僅在箱子與叉車上訓練的倉庫機器人，遇到貓時通常會撞上或產生幻覺。

在貝葉斯、以物件為中心的系統中，流程如下：

驚訝偵測：機器人偵測到高驚訝訊號，因為貓不符合任何既有模型。
知識獲取：機器人「打電話給朋友」（向中央伺服器查詢），下載可能符合視覺資料的物件模型。
假設檢驗：機器人測試多個候選模型（例如不同貓種），觀察貓的行為直到確定正確模型。
整合：將貓模型納入機器人本地的模型庫，以供未來使用。

透過信念交換進行對齊

Beck 博士認為傳統的強化學習（RL）對齊——使用獎勵函數——根本有缺陷，因為獎勵值往往是任意的，可能導致退化行為（「惡意精靈」問題）。

他提出一種基於 信念交換 的對齊策略。人類行為是信念與價值的組合，對齊應該涉及明確的信念交換。透過溝通與協調彼此對世界的內部模型，人類與 AI 能夠分辨分歧是源於事實誤解（信念）還是價值差異（獎勵函數），從而實現更透明且穩定的對齊形式。

AutoGrad 與貝葉斯大腦：Jeff Beck 博士談 AI 的未來

AutoGrad 與貝葉斯大腦：Jeff Beck 博士談 AI 的未來

核心論點：智慧不是函數近似

AutoGrad vs. Transformers：真正改變 AI 的是什麼

貝葉斯大腦與主動推理

貝葉斯方法的關鍵原則：

落腳問題：物理優於語言

「大量小模型」架構

模組化物件模型的優勢：

解決泛化：倉庫裡的貓

透過信念交換進行對齊

Sources