原因の確率

教科書では「研究」「発展」などに分類され,端っこの方に追いやれている話題です.授業でも扱わないことが多いので,無視して先に進む人も多いと思いますが,これは実はとても面白い話題です.今回はこの話題について触れてみます.

Aさんはがん検査を受けた.その結果は「要精密検査」であった.この検査は,実際にがんの人が要精密検査とされる確率が\(90\%\)で,実際にはがんではないのに要精密検査とされる確率が\(10\%\)であるような検査である.検診を受ける人の1000人に1人は実際にがんにかかっているとすると,Aさんが実際にがんである確率はいくらか.

Aさんを自分に置き換えて考えてみましょう.検査を受けたら「要精密検査」で,実際にがんの人が要精密検査とされる確率が\(90\%\)と言われたら,「ああ自分はがんなんだ…」と考え落ち込むのではないでしょうか.が,落ち着むのは尚早です.今置かれた状況をよく見ると「『要精密検査』という結果が与えられたときの,実際にがんである確率」ですから,これは条件付き確率です.では,実際に計算して自分ががんである確率を求めてみましょう!(注意:条件付き確率ベイズの定理についての知識が必要になります.未習の人はこれらの記事を先に読んでみてください.)条件付き確率の定義より,

\[P(\text{実際にがん}|\text{要精密検査})=\frac{P(\text{実際にがん}\cap\text{要精密検査})}{P(\text{要精密検査})}\]

まず,分子から求めてみます.確率の乗法定理より,
\[P(\text{実際にがん}\cap\text{要精密検査})=P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})\]
です.問題文より,
\[P(\text{実際にがん})=\frac{1}{1000},\quad P(\text{要精密検査}|\text{実際にがん})=\frac{90}{100}\]
です.ですから分子は\[\frac{1}{1000}\times\frac{90}{100}\]となります.

次に分母.\(P(\text{要精密検査})\)つまり「『要精密検査』とされる確率」です.「『要精密検査』とされる」という状況には2通りあります.すなわち,

          • 「実際にがんで,『要精密検査』」
          • 「実際にはがんではないのに,『要精密検査』」

という2通りの場合です.それぞれ

          • \(P(\text{実際にがん}\cap \text{要精密検査})\)
          • \(P(\text{実際はがんではない}\cap \text{要精密検査})\)

と表されますから,結局分母は\[P(\text{実際にがん}\cap \text{要精密検査})+P(\text{実際はがんではない}\cap \text{要精密検査})\]と表されます(全確率の定理).さらに,確率の乗法定理より,この式は
\[P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})+P(\text{実際はがんではない})P(\text{要精密検査}|\text{実際はがんではない})\]と表されます.前の項は前半で求めました.\(\frac{1}{1000}\times \frac{90}{100}\).後ろの項は,問題文より,
\[P(\text{実際はがんではない})=\frac{999}{1000},\quad P(\text{要精密検査}|\text{実際はがんではない})=\frac{10}{100}\]ですから\(\frac{999}{1000}\times\frac{10}{100}\).ですから分母は
\[\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}\]となります.したがって,求める確率\(P(\text{実際にがん}|\text{要精密検査})\)は,
\[
\begin{align*}
P(\text{実際にがん}|\text{要精密検査})&=\frac{\frac{1}{1000}\times\frac{90}{100}}{\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}}\\
&=\frac{1\times 90}{1\times 90 +999\times 10}\\
&=\frac{9}{9+999}\\
&=\frac{1}{112}\approx 0.00893
\end{align*}
\]となります.なんと,「要精密検査」と言われ実際にがんである確率はたったの\(0.00893\),つまり\(1\%\)にも満たない,ということです!

このように,確率は時として人間の直感を大きく裏切ります.しかし,論理によってはじき出された結果である以上,人間の感情としてどう感じようとそれは受け入れざるを得ない.そこが数学の面白さ・頼もしさのひとつだと思います.

ベイズの定理

ベイズの定理\[P(B_i|A)=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P( B_j|A)}\quad(i=1,2,\cdots)\]

(証明)
\[
\begin{align*}
P(B_i|A)&=\frac{P(B_i\cap A)}{P(A)}&\cdots~(1)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A\cap B_j)}&\cdots~(2)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P(B_j|A)}&\cdots~(3)
\end{align*}
\]
\((1)\)は条件付き確率の定義そのものです.\((2)\)の分子は確率の乗法定理より,分母は全確率の定理によります.\((2)\)の分母に再び確率の乗法定理を用いると\((3)\)となります.(証明終)

この「ベイズの定理」は,証明の過程を見て貰えば分かる通り,条件付き確率の定義式確率の乗法定理全確率の定理を用いて変形したものに過ぎません.なので,この式は「根っこはあくまで条件付き確率の定義式だ」という認識のもと,あとは(その条件付き確率の定義式を)問題に応じて便宜変形する,というような使い方をすればよいと思います(つまり「条件付き確率」の定義を納得しており,「確率の乗法定理」と「全確率の定理」を知ってさえいればベイズの定理そのものを覚える必要はない,ということ).

このベイズの定理を用いて,次の問題を解いてみます.早稲田大の問題です.

ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し,表を見ないで箱の中にしまった.そして残りのカードをよくきってから3枚抜き出したところ,3枚ともダイヤであった.このとき箱の中のカードがダイヤである確率を求めよ.
(早稲田・文)

「抜き出された1枚がダイヤ」という事象を\(A\),「3枚ともダイヤ」という事象を\(B\)とおきます.すると,求める確率は\(P(A|B)\)と表せます.これをベイズの定理を用いて計算してみましょう.
\[
\begin{align*}
P(A|B)&=\frac{P(A\cap B)}{P(B)}\\
&=\frac{P(A)P(B|A)}{P(B\cap A)+P(B\cap \overline{A})}\\
&=\frac{P(A)P(B|A)}{P(A\cap B)+P(\overline{A}\cap B)}\\
&=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}\\
&=\frac{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}+\frac{{}_{39} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{13} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}\\
&=\frac{10}{49}
\end{align*}
\]
となります.