醫學研究誠信與「履歷填充」危機

醫學研究誠信與「履歷填充」危機

系統性誘因推動低品質醫學研究

醫學系學生越來越多使用自動化研究工具,產出大量具誤導性或低品質的研究。此趨勢並非出於對科學發現的渴望,而是受到美國住院醫師配對過程的系統性需求所驅動;在此過程中,「研究產出」— 以出版數量而非品質衡量 — 已成為取得競爭激烈專科職位的關鍵指標。

「履歷填充」循環

發表壓力源於醫學系學生評估方式的轉變。最重要的催化劑是 USMLE Step 1 考試從計分制改為合格/不合格制。雖然此舉旨在減輕學生壓力,卻降低了住院醫師計畫可用來區分候選人的「訊號」。因此,計畫開始更重視其他指標,特別是履歷上的研究出版數量。

根據醫療專業人士與學生的社群見解:

  • 數量勝於品質: 在高度競爭的住院醫師專科(如神經外科、皮膚科或放射科),申請者呈現 40‑50 篇出版物並不罕見。
  • 指標操弄: 由於住院醫師計畫往往優先考慮研究項目數量,而非實際的科學價值,學生被激勵使用能快速產出觀察性研究或假說的工具來「玩弄系統」。
  • 「研究年」: 許多學生現在會花一整年專注於研究,以提升配對成功率,進一步使醫學訓練與臨床實踐脫鉤。

同儕審查的侵蝕

低品質投稿的激增給期刊的同儕審查流程帶來了難以承受的負擔。人們越來越擔憂,同儕審查正從科學品質控制機制轉變為篩選求職者的工具。

"住院醫師計畫已決定將部分招聘決策外包給期刊的同儕審查程序。因此,對於某些投稿,編輯與審稿人實際上並未進行科學審查,而是為醫院篩選求職者。"

此轉變削弱了同儕審查的基本假設:研究者在學術社群中本著善意行事。當學生僅為了在履歷上添一筆而發表,之後又投入臨床工作,學術社群的傳統社會與職業問責機制便失效。

對醫學知識與公共信任的風險

「胡說」研究的氾濫——常為 AI 生成或基於有缺陷的觀察資料——形成危險的回饋迴路。當誤導性研究發表於正規期刊時,其他研究者可能引用,或被 AI 大型語言模型誤解,進而將這些發現當作事實向患者傳遞。

主要風險包括:

  • AI 幻覺: 大型語言模型可能引用促銷性商業聲明或誤解的醫學期刊內容,將其當作醫學事實,給予重症患者「希望的幻象」。
  • 古德哈特定律: 此情況正是古德哈特定律的典型範例:"當一個衡量指標成為目標時,它就不再是好的衡量指標。" 將出版數量作為住院醫師配對的目標,已削弱了出版本身的價值。

提議的解決方案與反思

批評者與實務者提出了多項結構性改革以對抗此趨勢:

  • 改變評估指標: 將學術獎勵的焦點從出版數量轉向對既有論文的再現性以及對既定發現的挑戰。
  • 資金改革: 有人建議禁止使用 Medicare 培訓經費支付住院醫師期間的研究,迫使研究必須由具更嚴格監督與標準的既有資金來源支撐。
  • 透明度要求: 實施最低標準,要求研究者必須分享精確的查詢、設計選擇與分析的明確偏見,以防止挑選結果。
  • 重新分類產出: 確保透過這些工具產生的研究明確標示為「觀察性假說」供未來驗證,而非最終結論。

Sources