不審な不連続性:恣意的な閾値がいかに人間の行動を左右するか
不審な不連続性:恣意的な閾値がいかに人間の行動を左右するか
データと行動に対する恣意的な閾値の影響
政策やシステム設計における急激な不連続性(しばしば「クリフ(崖)」と呼ばれます)は、特定の閾値の直下に留まるように行動を操作しようとするインセンティブを個人に与えます。その結果、データに「不審な不連続性」が生じます。本来滑らかであるはずの分布が、特定の数値において不自然なスパイク(急増)やドロップ(急落)を示すのです。これらのパターンは、人々がいかにシステムを攻略し、時には意図的に損失を出すことさえして、自身の効用を最大化しようとしているかを明らかにすることがよくあります。
経済および税制政策の不連続性
米国の税制や補助金政策では、さらなる収入を得る意欲を削ぎ、実際には収入を減らすインセンティブを与えてしまうような、厳格な所得のカットオフ(境界線)が頻繁に利用されています。
ACAの補助金クリフ
米国では、Affordable Care Act (ACA) に基づく健康保険の補助金には、歴史的に厳格な所得のカットオフが存在してきました。例えば、補助金の天井(例:$55,000)をわずかに上回る個人は、天井の直下(例:$48,560)にいる人と比較して、年間で約$7,200の健康保険料の増加に直面する可能性があります。このような場合、補助金の資格を得るために、高い給与を得るよりも、収入を$6,440減らす方が経済的に有利になります。
その他の福祉の閾値
他の米国のプログラムにも、同様の不連続性が存在します:
- TANF (Temporary Assistance for Needy Families) の所得制限。
- Medicaid の所得制限。
- CHIP (Children's Health Insurance Program) の、無料または低コストの補償範囲に関する制限。
これらの影響を軽減するために、経済学者は、急激な閾値ではなく、緩やかなフェーズアウト(勾配)を用いることを提案しています。これにより、個人が意図的に損失を出したり、高収入を避けたりするインセンティブを減らすことができます。
学術および専門的な閾値
成功や資格取得のために特定の数値が必要とされる場合、データはその数値の直上にクラスター(集中)することがよくあります。これは、結果を「ナッジ(後押し)」する傾向を示しています。
心理学におけるP値
科学論文の出版、特に心理学においては、統計的有意性を示すためにp-valuesを0.05の閾値未満にする強いインセンティブがあります。出版された論文の分析によれば、0.05の直下で止まっているp-valuesの数が奇妙に多いことが示されており、これは著者が結果を操作(fudging)している可能性、ジャーナルが閾値の直下の論文を採択する可能性が高いこと、あるいは著者が閾値の直上(例:0.055)の結果を提出することを避けていることを示唆しています。
高校の卒業試験
ポーランド語の卒業試験では、データにちょうど30%(不合格の閾値)でのスコアのスパイクが見られ、23%から29%の間にはスコアがほとんど存在しません。これは、言語の採点がいかに主観的であるかに起因しています。教師は、生徒が不合格になるのを防ぐために、しばしば「足りない」点数を見つけ出して与えることがあります。不合格は生徒や学校にとって悲劇と見なされるためです。この現象は、客観的な採点が求められる数学の試験では見られません。数学では、客観的な採点により、そのような「ナッジ」はほぼ不可能です。
大学入学とPell Grant
大学が低所得学生の admission のためのプロキシ(代理指標)として Pell Grant の資格を利用している場合、新たな不連続性が生まれます。Pell Grant の閾値の直下にいる学生は、その直上にある学生よりも、入学の確率が著しく高いことがわかります。これにより、一部の親が、子供を Pell Grant の閾値以下にするために、伝統的な IRA やオプション取引で損失を出すことで、意図的に課税所得を課税所得を減らす行動をとるようになっています。
システム的および行動的な不連続性
ユーススポーツと相対的年齢効果
ユーススポーツでは、プレイヤーを誕生年でグループ化することがよくあります。年初に生まれた子供は、後半に生まれた子供よりも身体的に発達が進んでいるため、エリート・チーム(UEFA Youth League など)に選出される可能性が高くなります。これにより、誕生月に基づいた参加率の「のこぎり波」パターンが生じます。ただし、プレイヤーの実際のフィールド上での価値(出場時間で測定)は、誕生月と弱い相関しかありません。
マラソン完走時間
マラソン完走時間のヒストグラムは、あらゆる半時間ごとや「キリの良い」時間(例::10, :15, :20)にスパイクが見られます。これは、ランナーがより満足度の高い数値的なマイルストーンを達成するために、レースの終盤にスピードアップする傾向があることを示唆しています。
レストランの保健衛生検査
ニューヨーク市(NYC)のレストラン格付けは、スコアが13と14(AとBの境界線)の間、および27と28(BとCの境界の線)の間で急激な不連続性が示されています。これは、検査官が裁量権を用いて、レストランのスコアを次の高いグレードに引き上げるために「ナッジ」を行う可能性があることを示しています。
不審な不正と共謀の検出
選挙統計
ロシアの選挙データには、投票率や結果が「キリの良い」数値(例:95%)で奇妙なスパイクが見られます。これは、不正者が滑らかな分布を逐一作成する手間を惜しみ、捏造された結果であることを示すことがよくあります。
調達契約のオークション
日本の政府調達において、2回目以降の入札における分析によれば、2番目に低い入札者は、1番目に低い入札者が行った値下げの幅をほとんど超えません。この急激な不連続性は、ゼロ付近での不連続性は、入札者間の共謀が、価格を大幅に下げずに特定の企業が落札するように仕向けていることを示唆しています。
技術的応用:クリフを平滑化する
ソフトウェアやハードウェア・エンジニアリングにおいて、素朴なキュー(queue)の設計は不連続性を生りますます。キューが満杯であればパケットはドロップされます。満杯でなければ、ドロップされません。これは、バースト的なワークロードに対して不公平です。
Random Early Detection (RED) は、一般的な解決策です。勾配(gradient)として、キューの充填率に基づいて、到着するアイテムがドロップされる確率を確率的に与えることで、システムは不連続性を平滑化し、バイナリなドロップ/非ドロップの閾値による問題を軽減します。