真實的侵蝕:為什麼在 AI 時代你必須查證你的來源
真實的侵蝕:為什麼在 AI 時代你必須查證你的來源
數位景觀目前正經歷一場安靜但深刻的轉型。多年來,網際網路一直是一個龐大的資訊庫,指向信譽良好的來源連結通常被視為可信度的象徵。然而,大型語言模型 (LLMs) 和生成式 AI 的興起引入了一種新現象:「AI 垃圾內容」(AI slop)——這些內容看起來很專業、聽起來很有權威感,但從根本上與現實脫節。
當我們將研究過程外包給 AI 時,我們不僅是在節省時間,我們也在冒著損害專業聲譽的風險。隨著生產大量、聽起來合理的內容之門檻降至零,實際查證的價值便會飆升。
幻覺的解剖學
AI 的失敗很少是顯而易見的。它並不總是表現為胡言亂語;相反,它經常以「幻覺」的形式出現——即對事實進行自信的斷言,但卻是微妙或完全錯誤的。一個典型的例子是最近 AI 生成的 LinkedIn 貼文,聲稱瑞典已部署「智慧機器」將烏鴉變成城市清潔工。雖然快速搜尋可以發現這僅僅是某個新創公司一次性失敗的試點計畫,但 AI 生成的敘事將其轉化為一個國家級的成功故事,並配上 AI 生成的烏鴉圖像(有些甚至有三條腿)來吸引讀者。
在技術情境中發生的幻覺更為危險。考慮一個關於程式碼審查效率的說法:"defect detection drops from 87% for PRs under 100 lines to 28% for PRs over 1,000 lines."
對於一般讀者來說,這些數字看起來精確且具科學性。然而,在調查實際來源——一份 SmartBear/Cisco 研究報告——後,可以清楚地發現這些數字在研究中根本不存在。該研究討論了 defect density 和 review pace (lines of code per hour),但從未提供所引用的特定百分比降幅。AI 只是擷取了一個通用的趨勢(較大的 PRs 較難審查),然後編造了特定的統計數據來讓觀點顯得更「權威」。
AI 在邊緣領域的失敗
LLMs 是機率引擎。當有大量訓練數據可供提取時,它們表現出色,但在「邊緣」領域——即利基專業知識、特定研究論文或低容量數據的領域——它們會遇到困難。當一個 LLM 無法在其訓練集中找到確定的答案時,它並不總是會承認無知。相反,它經常用聽起來合理的編造內容來填補空白。
這創造了一個危險的迴圈。當一篇帶有虛假統計數據的 AI 生成文章在網路上發布時,它接著會被其他 LLMs 索引。這些模型接著會引用這篇虛假文章作為可信來源,進一步放大原始的幻覺。這種「引用洗錢」(citation laundering) 確保了錯誤資訊會變成自我強化的噪音,使得人類越來越難以找到原始的真相。
便利性的代價:將可信度視為貨幣
在專業環境中,可信度是主要的貨幣。使用 AI 在幾分鐘內草擬一份技術貼文,而不是花費數小時進行研究和寫作,這種誘惑是巨大的。然而,這種便利性的代價是冒著在謊言上簽署自己名字的風險。
正如一位評論家所言,問題不僅在於 AI,還在於資訊的「監護鏈」(chain of custody)。即使在 AI 時代之前,「引用洗錢」就已經存在——記者會引用其他記者而非原始研究,隨著每一次迭代,離真相越走越遠。AI 只是將這個過程加速到了工業規模。
超越工具:查證策略
如果我們依賴 AI 來總結研究,我們我們基本上是在將我們的聲譽託付給一個黑箱。為了對抗真實的侵蝕,我們必須回歸到一種更嚴謹的資訊消費方式:
- 打破連結鏈: 不要相信摘要的摘要。追溯連結回到原始來源文件(PDF、原始數據、學術論文)。
- Verfiy the Specifics: 當你看到特定的百分比或確切的數字時,請將其視為警訊。專門針對該數字搜尋來源文件,以確保它沒有被幻覺化。
- 質疑地點: 對於將成就歸功於整個國家(例如,「瑞典建立了...」)而非特定組織的標題,要保持警惕。這通常是 AI 生成內容過度簡化的跡象。
- 承認「狗屁科學」 (Bullshit Science): 即使是人類撰寫的來源也可能存在缺陷。正如社群討論中所提到的,某些「研究」是受利益團體委託產生的,旨在產生預期的結果,這意味著即使是「真實」的來源也可能具有誤導性。
結論
寫作,其核心本質上是一種閱讀的行為。如果我們任由 AI 處理研究和寫作而不加看管,我們實際上是在自毀前程。對抗 AI 垃圾內容的唯一解藥是人類的判斷力,以及做「功課」的意願——即閱讀實際來源材料那種枯燥、手動的工作。在一個內容無限且毫不費力的時代,最有價值的技能不再是生產資訊的內容,而是查證它的能力。