可疑的斷點:任意門檻如何驅動人類行為
可疑的斷點:任意門檻如何驅動人類行為
任意門檻對資料與行為的影響
政策或系統設計中的尖銳斷點——常被稱為「懸崖」——會激勵個人調整行為,以保持在特定門檻以下。這會在資料中產生「可疑的斷點」,本應平滑的分布在特定數值上出現不自然的尖峰或跌落。這些模式往往揭示人們如何操縱系統以最大化效用,甚至有時會刻意虧損金錢。
經濟與稅收政策的斷點
美國的稅收與補助政策常使用硬性的收入上限,這不僅抑制收入提升,甚至可能激勵收入下降。
《平價醫療法案》補助懸崖
在美國,《平價醫療法案》(ACA)下的健康保險補助歷來都有硬性的收入上限。例如,收入略高於補助上限(如 $55,000)的個人,與剛好低於上限($48,560)的人相比,健康保險費用每年可能多出約 $7,200。在此情況下,個人若將收入減少 $6,440 以符合補助資格,財務上會比領取較高薪資更有利。
其他福利門檻
其他美國計畫亦存在類似的斷點,包括:
- TANF(暫時援助貧困家庭)收入限制。
- Medicaid 收入限制。
- CHIP(兒童健康保險計畫)之免費與減費覆蓋上限。
為減輕這些效應,經濟學家建議使用緩慢的逐步淘汰(梯度)而非尖銳門檻,從而降低個人故意虧損或避免更高收入的誘因。
學術與職業門檻
當成功或認證需要特定數值時,資料往往在該數值之上聚集,顯示出「推動」結果的趨勢。
心理學中的 p 值
在科學出版,特別是心理學領域,產出低於 0.05 統計顯著門檻的 p 值有強大動機。對已發表論文的分析顯示,p 值恰好低於 0.05 的情況異常頻繁,暗示作者可能在調整結果、期刊更傾向接受略低於門檻的稿件,或作者避免提交略高於門檻的結果(如 0.055)。
高中畢業考試
在波蘭語畢業考試中,成績在恰好 30%(不及格門檻)處出現尖峰,而 23%~29% 之間的成績則稀少。這被歸因於語文評分的主觀性;教師常會「少給」一分以避免學生不及格,因不及格被視為對學生與學校的悲劇。此現象在數學考試中不會出現,因為客觀評分使此類「推動」幾乎不可能。
大學錄取與 Pell 獎學金
大學以 Pell 獎學金資格作為低收入學生錄取的指標,形成了新的斷點。剛好低於 Pell 門檻的學生錄取機率顯著高於剛好高於門檻的學生。這導致部分家長刻意降低應稅收入——透過傳統 IRA 或在期權上虧損——以使子女落在 Pell 獎學金門檻以下,提升錄取機會。
系統性與行為斷點
青少年運動與相對年齡效應
青少年運動常以出生年份分組。因為年初出生的孩子在身體發展上較晚出生者更具優勢,他們更容易被選入精英隊(如 UEFA 青年聯賽)。這在參與度上形成鋸齒狀模式,儘管實際場上價值(以上場時間衡量)與出生月份的相關性僅弱。
馬拉松完賽時間
數百萬馬拉松完賽時間的直方圖顯示,每半小時以及「整數」時間(如 :10、:15、:20)都有尖峰。這暗示跑者在接近整數時間時會加速衝刺,以達到更令人滿意的數字里程碑。
餐廳檢查
紐約市餐廳評分在 13 與 14 分(A 與 B 級之間)以及 27 與 28 分(B 與 C 級之間)之間出現明顯斷點。這表明檢查員可能利用裁量權將餐廳分數「推」至更高等級。
偵測詐欺與勾結
選舉統計
俄羅斯選舉資料顯示投票率與結果在「整數」數值(如 95%)處出現奇異尖峰,往往意味著造假結果,因詐騙者未費心製造平滑分布。
採購拍賣
在日本政府採購中,對第二輪投標的分析發現第二低價投標者幾乎不會將出價降低超過第一低價投標者的幅度。零點的尖銳斷點暗示投標者之間存在勾結,以確保特定公司中標而不大幅壓低價格。
技術應用:平滑懸崖
在軟硬體工程中,簡單的佇列會產生斷點:佇列滿時封包被丟棄,未滿時則不會。這對突發工作負載不公平。
Random Early Detection (RED) 是常見解決方案。透過根據佇列滿度給予進入項目被丟棄的機率,系統可平滑此二元的丟棄/不丟棄門檻,減輕由此產生的問題。