1946年、ミネソタ州ロチェスターのメイヨー・クリニックで、医師兼統計学者のジョセフ・バークソンは不可解な現象を発見した。病院のデータによると、糖尿病患者は胆嚢炎を発症しにくいように見えた。糖尿病が胆嚢を保護するのだろうか?バークソンの答えは明確だった。いいえ、これはデータソースそのものが生み出した錯覚である。この発見は、統計学で最も陰険で危険な罠の一つを明らかにした――後に彼の名を冠して「バークソンのパラドックス」と呼ばれるようになった。
I. バークソンのパラドックスとは何か?
パラドックスの定義
バークソンのパラドックスとは、標本選択の方法が、実際には独立または正の相関にある二つの変数の間に偽の負の相関を生み出す現象を指す。[1]よりわかりやすく言えば、「フィルタリングされた」標本だけを観察するとき、実際には存在しない関連を知覚してしまう可能性がある。
この現象は「合流点バイアス」や「選択バイアス」とも呼ばれる。因果推論の用語では、「合流点」変数で条件付けすると、元来無関係な変数間に偽の関連が生じる。[2]
シンプソンのパラドックスとの区別
バークソンのパラドックスはシンプソンのパラドックスと混同されがちだが、そのメカニズムは根本的に異なる:
- シンプソンのパラドックス:データを集約する際に交絡変数がトレンドを逆転させる。問題は「いかに正しくデータを統合するか」。
- バークソンのパラドックス:標本選択メカニズムが無関係な変数間に偽の関連を生み出す。問題は「データがどこから来るか」。
因果ダイアグラムで示せば、シンプソンのパラドックスは交絡因子(共通原因)を含み、バークソンのパラドックスは合流点(共通結果)を含む。シンプソンのパラドックスでは交絡因子を統制すべきであり、バークソンのパラドックスでは合流点で条件付けすべきではない――しかし多くの場合、我々の標本はすでに条件付けされている。[3]
数学的説明:条件付き確率の罠
数学を使ってバークソンのパラドックスを理解しよう。一般集団において、二つの独立した疾患AとBがあるとする:
P(A) = pA、P(B) = pB、かつ P(A ∩ B) = pA · pB(独立性)
ここで、入院患者のみを観察するとしよう。入院条件を H = A ∪ B とする。
入院患者のうち、疾患Aを持つ人が疾患Bを持つ確率は:
P(B | A, H) = P(A ∩ B | H) / P(A | H)
計算により、次のことが示される:[4]
P(B | A, H) < P(B | H)
つまり、入院患者の中では、疾患Aを持つ人は実際には疾患Bを持つ確率が低い――一般集団ではAとBが完全に独立しているにもかかわらず!この負の相関は、選択メカニズムが生み出した純粋な錯覚である。
直感的な説明はこうだ:ある人がすでに疾患Aのために入院しているなら、なぜ入院しているかを説明するために疾患Bは「必要ない」。逆に、Aを持っていなければ、Bのために入院している可能性が高い。この「説明消去」効果がバークソンのパラドックスの核心だ。[5]
II. 古典的な医学事例
糖尿病と胆嚢炎:バークソンの原発見
1946年の古典的論文で、バークソンは初めてこの問題を体系的に記述した。[6]
彼はメイヨー・クリニックの入院データを分析し、困惑するパターンを発見した:
| グループ | 胆嚢炎発症率 |
|---|---|
| 糖尿病患者 | 低い |
| 非糖尿病患者 | 高い |
素朴に解釈すれば、糖尿病が胆嚢に対して保護効果を持つと結論づけてしまう。しかしバークソンは、この「発見」が選択バイアスによる完全な人工産物であることを指摘した。
バイアスのメカニズム
問題は、研究対象が一般集団ではなく入院患者だったことにある。「入院している」ことが研究に含まれる条件であり、入院理由は糖尿病、胆嚢炎、あるいはその両方であり得た。
- 入院患者が糖尿病を持っていれば、すでに入院の「理由」があり、入院を説明するために胆嚢炎は必要ない。
- 逆に、入院患者が糖尿病を持っていなければ、別の疾患(胆嚢炎など)のために入院している可能性が高い。
- したがって、この選択された標本では、糖尿病と胆嚢炎が負の相関を示す――しかしこれは標本選択の完全な人工産物である。
バークソンの核心的な洞察は:病院は社会の縮図ではない。病院データに基づく研究結論は、一般集団に全く一般化できない可能性がある。
呼吸器疾患と骨折
同様のバイアスは他の医学研究でも発見されている。病院で呼吸器疾患と骨折の関係を研究すれば、負の相関が見つかるかもしれない:呼吸器疾患の患者は骨折が少ない。
これは喘息が骨折を防ぐということではない!理由は以下の通りだ:
- 大部分の人は呼吸器疾患も骨折もなく、病院の標本に現れない。
- 病院の標本に入る人は、少なくとも一つの問題を持っていなければならない。
- 呼吸器疾患で入院しているなら、入院を説明するために骨折は「必要ない」。逆もまた然り。
肥満パラドックス:現代の論争
近年、疫学において困惑する発見が現れている。特定の慢性疾患患者群(心臓病や腎臓病患者など)では、肥満の個人の死亡率が実際にはより低い――これは「肥満パラドックス」として知られる。[7]
多くの研究者がバークソンのパラドックスが働いていると疑っている。その論理は次の通りだ:
- 肥満も他のリスク因子も、心臓病を引き起こし得る。
- 肥満の心臓病患者は、その疾患を発症するのに他のリスク因子を多く「必要としない」かもしれない。
- 標準体重の心臓病患者は、疾患を発症するためにより多くの他のリスク因子(遺伝、喫煙など)を必要とするかもしれない。
- したがって、心臓病患者という選択されたグループの中では、肥満の個人は全体的なリスク因子がより少ない可能性がある。
2016年にJournal of the American Medical Associationに掲載された研究は、選択バイアスを統制すると肥満パラドックスがほぼ消失することを示した。[8]この事例は、トップレベルの医学雑誌においてもバークソンのパラドックスが潜んでいる可能性があることを想起させる。
III. 日常生活におけるバークソンのパラドックス
「なぜ美しい人は思いやりがないのか?」――恋愛市場のパラドックス
これはバークソンのパラドックスの最も身近な例かもしれない。多くの人がこう嘆く:「なぜ容姿の良い人は性格が悪いのか?」あるいは「なぜ才能ある人は付き合いにくいのか?」
交際に値するかどうかが二つの独立した特性に依存するとしよう:身体的魅力(A)と好ましい性格(B)。一般集団では、これらは独立かもしれない――魅力的な人が良い性格を持つ確率は他の誰とも変わらない。
しかし、交際候補を「フィルタリング」すると:
- 通常、少なくとも一つの長所がある人としか付き合わない(身体的に魅力的か好ましい性格)。
- フィルタリングされたグループでは、非常に魅力的な人はすでに交際の「基準」を満たしており、素晴らしい性格は必要ない。
- あまり魅力的でない交際相手が交際プールにいるということは、特に良い性格を持っている可能性が高い。
結果:実際に交際する人々の中では、容姿と性格が負の相関を示す――しかしこれは選択メカニズムによるものであり、母集団における実際のパターンではない。[9]
この例は、世界に対する我々の観察がしばしば遭遇する標本によって制限されていることを示している。常に「魅力的な人は性格が悪い」と感じるなら、問題は世界にあるのではなく、フィルタリングされた標本に遭遇しているという事実にあるのかもしれない。
ハリウッド映画:なぜ高予算映画は評価が低いのか?
批評家や観客はしばしばこう嘆く:数億ドルの投資をした映画がなぜ低予算の独立系映画より評価が低いのか?お金をかけるほど質が下がるのか?
これもまたバークソンのパラドックスだ。劇場公開される映画はある「品質基準」を通過しなければならない――脚本が十分に良いか、スターが十分に大きいか、特殊効果が十分に目を引くか、制作予算が十分に高いか。
- 高予算映画は予算だけで公開を確保でき、特に良い脚本は必要ない。
- 公開にこぎつけた低予算映画は、通常、例外的に良い脚本や他の卓越した資質が必要だ。
したがって、「公開された映画」というフィルタリングされたグループでは、コストと品質が負の相関を示す。しかし、これまで制作されたすべての映画(劇場にたどり着けなかった低予算の失敗作を含む)を見ることができれば、この相関は消失するだろう。
学術界:トップジャーナルの奇妙な引用分布
トップジャーナルに掲載された論文の引用分布がときに奇妙に見えるのはなぜか?「低インパクト」のトピックがどうしてエリートジャーナルに掲載されるのか?
論文がトップジャーナルに掲載されるには、ある「卓越性の基準」を満たす必要がある――研究トピックが極めて重要か、方法論が革新的か、データがユニークか、分析が特に洗練されているか。
- 論文のトピックがすでにトレンドの問題(自然と多くの引用を集める)であれば、方法論的革新のハードルは低くなるかもしれない。
- 論文のトピックが比較的ニッチであれば、トップジャーナルに掲載された事実は、方法論や分析が特に優れていることを意味する。
結果:トップジャーナルでは、トレンドトピックと方法論的革新が負の相関を示す。人気のあるトピックを研究する研究者が革新性に劣るからではなく、選択メカニズムの産物だ。[10]
ソーシャルメディア:なぜインフルエンサーの生活は完璧に見えるのか?
Instagramやソーシャルメディアをスクロールすると、インフルエンサーは皆完璧な生活を送っているように見える:美しく裕福で、面白くて幸せそうだ。これは本当に現実を反映しているのか?
「インフルエンサー」になること自体が強力な選択メカニズムである。ソーシャルメディアで大きなフォロワーを獲得するには、ある「魅力の基準」を満たす必要がある――容姿、富、ライフスタイル、ユーモア――少なくとも一つが特に際立っていなければならない。
一般集団では、これらの特性は独立しているかもしれない。しかし「インフルエンサー」という高度にフィルタリングされたグループでは:
- インフルエンサーの容姿が平凡であれば、その人気は例外的に面白いコンテンツや特に魅力的なライフスタイルに由来する可能性が高い。
- インフルエンサーが非常に容姿が良ければ、フォロワーを獲得するために他の側面が同様に優れている必要はない。
しかし全体として、あなたの視野に入る人々はすべて、何らかの次元で「基準を超えた」人々だ。あなたが見ているのはトップのフィルタリングされた標本であり、母集団の真の分布ではない。これがソーシャルメディアの閲覧が不安や不満を引き起こす理由の一部を説明している。
IV. 「逆境から偉人が生まれる」の統計的説明
「逆境から偉人が生まれる」は古くからの言い伝えで、貧しい背景の人々が偉大な成功を収めやすいことを示唆している。同様の観察には「成功者の中では困難な背景を持つ人が不釣り合いに多い」や「多くのトップCEOが貧しい家庭で育った」がある。
これは真実なのか?それともバークソンのパラドックスが働いているのか?
選択バイアス:「成功した」標本だけを見ている
成功が二つの要因に依存するとしよう:先天的優位性(P:家庭背景や社会的資源など)と個人能力(T:知性、忍耐力、運など)。P + Tがある閾値を超えると「成功」する。
- 恵まれた背景の人(高いP)は、平均的な個人能力だけで成功できる。
- 恵まれない背景の人(低いP)は、成功するために例外的に高い個人能力が必要。
「成功した」グループだけを観察すると:
- 裕福な家庭出身の成功者は能力の分布が広い――平均から例外的まで。
- 貧しい家庭出身の成功者はほぼ全員が卓越した能力を持つ――なぜなら、恵まれない背景を補えるのは例外的な能力だけだから。
したがって、「成功者」というフィルタリングされたグループでは、家庭背景と個人能力が負の相関を示す。貧しい背景出身の成功者はより高い平均能力を持ち、「逆境から偉人が生まれる」という印象を生み出す。
しかしこれは、貧しい家庭が成功者を「生み出しやすい」ことを意味しない!全母集団を見れば、裕福な家庭出身の子供はやはりより高い平均的成果を収めている。平均的な能力で成功しなかった、貧しい背景出身の大多数の人々は我々の目に入らないだけだ。
メディアの物語による増幅効果
このバイアスはメディアによってさらに増幅される。「裕福な子息が家業を継ぐ」話は引きつけないが、「貧しい子供が純粋な決意で頂点に上り詰める」話は感動的な定番だ。メディアが逆境からの成功物語を好んで報じる傾向が、「逆境から偉人が生まれる」という印象をさらに強化する。
真の教訓は:フィルタリングされたグループを観察するとき、我々が見るパターンはフィルタリング・メカニズムの完全な産物である可能性があり、因果関係ではない。
V. 歴史的背景:ジョセフ・バークソンという人物
数学から医学へ
ジョセフ・バークソン(1899-1982)は独特な学者だった――医学と統計学の両方の訓練を受けていた。[11]
バークソンはニューヨーク市に生まれ、ニューヨーク市立大学で物理学の学位を取得し、コロンビア大学で物理学の修士号を取得した。しかし関心は徐々に医学に移り、最終的にジョンズ・ホプキンス大学で医学博士号を取得した。
1931年にバークソンはメイヨー・クリニックに加わり、生物統計学・医療統計学部門の長となった。1973年の退職まで40年以上この職にあった。当時メイヨー・クリニックは世界最大級の医療機関の一つであり、豊富な患者データがバークソンの統計研究に理想的な素材を提供した。
1946年論文の誕生
メイヨー・クリニックのデータを分析する中で、バークソンは多くの一見矛盾した関連を発見した。当時の研究者は「四分表」(2x2分割表)を用いて疾患間の関係を分析することが多かったが、バークソンはこのアプローチに根本的な問題があることに気づいた。
1946年、彼は画期的な論文をBiometrics Bulletinに発表した。[6]この論文でバークソンはバイアス現象を記述するだけでなく、その存在の数学的証明と具体的な数値例も提示した。
注目すべきは、バークソンがこの問題を抽象的な数学的設定で発見したのではなく、実際の臨床データ分析で説明不可能な異常パターンに遭遇し、その問題を選択バイアスに遡って追跡したことだ。この「実践を通じて問題を発見する」研究アプローチは、今日でも科学的発見の重要なモデルであり続けている。
その後の発展と影響
バークソンのパラドックスの影響は医療統計学をはるかに超えている。因果推論理論の発展、特にジューディア・パールらによる有向非巡回グラフ(DAG)の体系的研究により、バークソンのパラドックスは「合流点バイアス」の特殊なケースとして理解されるようになった。[3]
因果ダイアグラムの枠組みでは、ある変数が二つの他の変数の「共通結果」(合流点)であるとき、この変数で条件付けすると元来独立していた変数間に偽の関連が生じる。この理論的枠組みは、研究者がさまざまな形態の選択バイアスを特定し回避するのに役立っている。
今日、バークソンのパラドックスは疫学方法論コースの必修トピックであり、すべての医学研究者が理解すべき基本概念だ。[12]
VI. バークソンのパラドックスを回避する方法
1. 「標本はどこから来たか?」と問う
これが最も重要な質問だ。いかなる統計的結論を受け入れる前に、まず問うべきこと:
- この研究の標本はどのように選ばれたか?
- どのような人がこの標本に入り、どのような人が除外されるか?
- 標本に入る条件は研究対象の変数と関連しているか?
標本選択メカニズムが研究変数と関連していれば、バークソンのパラドックスの可能性に注意すべきだ。
2. ランダムサンプリングの重要性
バークソンのパラドックスが生じるのは、標本がターゲット母集団からランダムに抽出されていないからだ。理想的には、研究はランダムサンプリングを用いて標本がターゲット母集団を代表するようにすべきだ。
もちろん、ランダムサンプリングが常に実行可能なわけではない――誰が入院するかをランダムに割り当てることはできない。そのような場合、研究者は標本の制限を明示的に認め、結論を過度に一般化することを避けなければならない。
3. 因果ダイアグラムを描く
ジューディア・パールが提唱する因果ダイアグラムは、バークソンのパラドックスを特定するための強力なツールだ。[13]データを分析する前に、自分が信じる因果関係図を描く:
- すべての合流点変数を特定する
- 意図せず合流点で条件付けしていないかを確認する
- もしそうなら、それが結論にどう影響するかを考慮する
4. 感度分析を行う
選択バイアスを完全に排除できない場合は、感度分析を行う:バイアスが存在すると仮定した場合、結論を変えるにはどの程度の大きさが必要か?わずかなバイアスで結論が覆るなら、その結論は頑健ではない。[14]
5. データソースを批判的に考える
最終的に、バークソンのパラドックスを回避するには批判的思考が必要だ。データを盲目的に信用せず、データがどのように生成されたか、その制限は何か、どのようなバイアスが存在し得るかを考慮する。
覚えておくべきこと:データはそれ自体では語らない。データは正しい枠組みの中で解釈されなければならない。
結論:見えないものを見る
バークソンのパラドックスが教えてくれることは、統計技術をはるかに超えている。それは認識論における深い教訓だ――世界に対する我々の理解は、常に観察できる標本によって制限されている。
病院では患者を見る。恋愛市場では交際意欲のある人に会う。成功者リストでは成功した人の話を読む。見えないものが、見えるものよりもしばしば重要だ。
病気にならなかった健康な人々、恋愛市場に決して入らなかった人々、決して成功しなかった普通の人々――彼らの存在が我々の観察するパターンを形作っているが、彼らは決して我々の視野に現れなかった。
バークソンの1946年の洞察は、常に問うべきことを思い出させてくれる:「このデータから誰が欠けているか?」この質問への答えこそ、データが真に意味するものを理解する鍵であることが多い。
データ爆発のこの時代、我々はかつてないほど表面的なパターンに惑わされやすい。バークソンのパラドックスを理解することは、より良いデータ分析者になるだけでなく、より慎重な観察者になることでもある――世界の、そして自分自身の認知の限界の。
参考文献
- Berkson, J. (1946). Limitations of the application of fourfold table analysis to hospital data. Biometrics Bulletin, 2(3), 47-53.
- Hernán, M. A., Hernández-Díaz, S., & Robins, J. M. (2004). A structural approach to selection bias. Epidemiology, 15(5), 615-625.
- Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press, Chapter 6.
- Westfall, J., & Yarkoni, T. (2016). Statistically controlling for confounding constructs is harder than you think. PloS One, 11(3), e0152719.
- Elwert, F., & Winship, C. (2014). Endogenous selection bias: The problem of conditioning on a collider variable. Annual Review of Sociology, 40, 31-53.
- Berkson, J. (1946). Limitations of the application of fourfold table analysis to hospital data. Biometrics Bulletin, 2(3), 47-53. This paper was the first systematic description of what would later be known as "Berkson's Paradox."
- Banack, H. R., & Kaufman, J. S. (2014). The obesity paradox: Understanding the effect of obesity on mortality among individuals with cardiovascular disease. Preventive Medicine, 62, 96-102.
- Stokes, A., & Preston, S. H. (2015). Smoking and reverse causation create an obesity paradox in cardiovascular disease. Obesity, 23(12), 2485-2490.
- Fithian, W., Elmore, R., & Li, S. (2015). Bias in the estimation of false discovery rates from contingency tables. The Annals of Applied Statistics, 9(4), 1921-1948.
- Rohrer, J. M. (2018). Thinking clearly about correlations and causation: Graphical causal models for observational data. Advances in Methods and Practices in Psychological Science, 1(1), 27-42.
- Salsburg, D. (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. W. H. Freeman. Chapter 19 discusses Berkson's contributions.
- Rothman, K. J., Greenland, S., & Lash, T. L. (2008). Modern Epidemiology (3rd ed.). Lippincott Williams & Wilkins, Chapter 9.
- Pearl, J., & Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect. Basic Books, Chapter 6.
- VanderWeele, T. J., & Ding, P. (2017). Sensitivity analysis in observational research: Introducing the E-value. Annals of Internal Medicine, 167(4), 268-274.