原因の確率

教科書では「研究」「発展」などに分類され,端っこの方に追いやれている話題です.授業でも扱わないことが多いので,無視して先に進む人も多いと思いますが,これは実はとても面白い話題です.今回はこの話題について触れてみます.

Aさんはがん検査を受けた.その結果は「要精密検査」であった.この検査は,実際にがんの人が要精密検査とされる確率が\(90\%\)で,実際にはがんではないのに要精密検査とされる確率が\(10\%\)であるような検査である.検診を受ける人の1000人に1人は実際にがんにかかっているとすると,Aさんが実際にがんである確率はいくらか.

Aさんを自分に置き換えて考えてみましょう.検査を受けたら「要精密検査」で,実際にがんの人が要精密検査とされる確率が\(90\%\)と言われたら,「ああ自分はがんなんだ…」と考え落ち込むのではないでしょうか.が,落ち着むのは尚早です.今置かれた状況をよく見ると「『要精密検査』という結果が与えられたときの,実際にがんである確率」ですから,これは条件付き確率です.では,実際に計算して自分ががんである確率を求めてみましょう!(注意:条件付き確率ベイズの定理についての知識が必要になります.未習の人はこれらの記事を先に読んでみてください.)条件付き確率の定義より,

\[P(\text{実際にがん}|\text{要精密検査})=\frac{P(\text{実際にがん}\cap\text{要精密検査})}{P(\text{要精密検査})}\]

まず,分子から求めてみます.確率の乗法定理より,
\[P(\text{実際にがん}\cap\text{要精密検査})=P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})\]
です.問題文より,
\[P(\text{実際にがん})=\frac{1}{1000},\quad P(\text{要精密検査}|\text{実際にがん})=\frac{90}{100}\]
です.ですから分子は\[\frac{1}{1000}\times\frac{90}{100}\]となります.

次に分母.\(P(\text{要精密検査})\)つまり「『要精密検査』とされる確率」です.「『要精密検査』とされる」という状況には2通りあります.すなわち,

          • 「実際にがんで,『要精密検査』」
          • 「実際にはがんではないのに,『要精密検査』」

という2通りの場合です.それぞれ

          • \(P(\text{実際にがん}\cap \text{要精密検査})\)
          • \(P(\text{実際はがんではない}\cap \text{要精密検査})\)

と表されますから,結局分母は\[P(\text{実際にがん}\cap \text{要精密検査})+P(\text{実際はがんではない}\cap \text{要精密検査})\]と表されます(全確率の定理).さらに,確率の乗法定理より,この式は
\[P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})+P(\text{実際はがんではない})P(\text{要精密検査}|\text{実際はがんではない})\]と表されます.前の項は前半で求めました.\(\frac{1}{1000}\times \frac{90}{100}\).後ろの項は,問題文より,
\[P(\text{実際はがんではない})=\frac{999}{1000},\quad P(\text{要精密検査}|\text{実際はがんではない})=\frac{10}{100}\]ですから\(\frac{999}{1000}\times\frac{10}{100}\).ですから分母は
\[\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}\]となります.したがって,求める確率\(P(\text{実際にがん}|\text{要精密検査})\)は,
\[
\begin{align*}
P(\text{実際にがん}|\text{要精密検査})&=\frac{\frac{1}{1000}\times\frac{90}{100}}{\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}}\\
&=\frac{1\times 90}{1\times 90 +999\times 10}\\
&=\frac{9}{9+999}\\
&=\frac{1}{112}\approx 0.00893
\end{align*}
\]となります.なんと,「要精密検査」と言われ実際にがんである確率はたったの\(0.00893\),つまり\(1\%\)にも満たない,ということです!

このように,確率は時として人間の直感を大きく裏切ります.しかし,論理によってはじき出された結果である以上,人間の感情としてどう感じようとそれは受け入れざるを得ない.そこが数学の面白さ・頼もしさのひとつだと思います.

ベイズの定理

ベイズの定理\[P(B_i|A)=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P( B_j|A)}\quad(i=1,2,\cdots)\]

(証明)
\[
\begin{align*}
P(B_i|A)&=\frac{P(B_i\cap A)}{P(A)}&\cdots~(1)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A\cap B_j)}&\cdots~(2)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P(B_j|A)}&\cdots~(3)
\end{align*}
\]
\((1)\)は条件付き確率の定義そのものです.\((2)\)の分子は確率の乗法定理より,分母は全確率の定理によります.\((2)\)の分母に再び確率の乗法定理を用いると\((3)\)となります.(証明終)

この「ベイズの定理」は,証明の過程を見て貰えば分かる通り,条件付き確率の定義式確率の乗法定理全確率の定理を用いて変形したものに過ぎません.なので,この式は「根っこはあくまで条件付き確率の定義式だ」という認識のもと,あとは(その条件付き確率の定義式を)問題に応じて便宜変形する,というような使い方をすればよいと思います(つまり「条件付き確率」の定義を納得しており,「確率の乗法定理」と「全確率の定理」を知ってさえいればベイズの定理そのものを覚える必要はない,ということ).

このベイズの定理を用いて,次の問題を解いてみます.早稲田大の問題です.

ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し,表を見ないで箱の中にしまった.そして残りのカードをよくきってから3枚抜き出したところ,3枚ともダイヤであった.このとき箱の中のカードがダイヤである確率を求めよ.
(早稲田・文)

「抜き出された1枚がダイヤ」という事象を\(A\),「3枚ともダイヤ」という事象を\(B\)とおきます.すると,求める確率は\(P(A|B)\)と表せます.これをベイズの定理を用いて計算してみましょう.
\[
\begin{align*}
P(A|B)&=\frac{P(A\cap B)}{P(B)}\\
&=\frac{P(A)P(B|A)}{P(B\cap A)+P(B\cap \overline{A})}\\
&=\frac{P(A)P(B|A)}{P(A\cap B)+P(\overline{A}\cap B)}\\
&=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}\\
&=\frac{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}+\frac{{}_{39} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{13} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}\\
&=\frac{10}{49}
\end{align*}
\]
となります.

条件付き確率の直観的理解

条件付き確率の定義事象\(A\),事象\(B\)に対して,確率\[\frac{P(B\cap A)}{P(A)}\]を\(A\)が与えられたときの\(B\)の条件付き確率と呼び,\(P(B|A)\)と書く.

この定義をみても,正直しっくりこないという人は多いと思います.今回はこの条件付き確率の定義の直観的理解を目指してみようと思います.

まず,次の問題を考えてみましょう.

問題
100人の生徒に,次の2つの質問をした.「さんまの内臓を食べるか食べないか」「エビフライのしっぽは食べるか食べないか」.すると,次のような結果を得た.この100人の中から,1人を選び出す.このとき,次の問いに答えよ.

    1. 選び出された生徒が,サンマの内臓を食べる確率
    2. 選び出された生徒が,エビフライのしっぽを食べる確率
    3. 選び出された生徒が,サンマの内臓もエビフライのしっぽも食べる確率
    4. 選び出された生徒が,サンマの内臓は食べるが,エビフライのしっぽは食べない確率
    5. 選び出された生徒が「自分はサンマの内臓は食べますよ~」と発言した.このとき,その生徒がエビフライのしっぽも食べる確率

(解答)

    1. 表をみると全生徒\(100\)人の中でサンマの内臓を食べる人数は\(45\)人ですから,求める確率は\(\frac{45}{100}\)
    2. 表を見ると全生徒\(100\)人の中でエビフライの尻尾を食べる人数は\(67\)人ですから,求める確率は\(\frac{67}{100}\)
    3. 表を見ると全生徒\(100\)人の中でサンマの内臓もエビフライの尻尾も食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{100}\)
    4. 表を見ると全生徒\(100\)人の中でサンマの内臓は食べるが,エビフライの尻尾は食べない人数は\(10\)人ですから,求める確率は\(\frac{10}{100}\)

…と簡単に求められると思います.ここまでウォーミングアップ.問題は5.です.

実際に想像してみましょう.自分の目の前に一人生徒が来た.この生徒がエビフライの尻尾を食べるかどうかを予測したい.そこで,確率を求めようと表を眺めます.この時点では選び出されたその生徒がエビフライの尻尾を食べる確率は\(\frac{67}{100}\)です.図で視覚化すると,

という感じでしょうか.この時点では確率は2.とおんなじです.

しかしここで!その生徒が「自分はサンマの内臓は食べますよ~美味しいですよね~」と喋り,我々がその発言を聞いてしまったとしましょう.すると状況は一変してしまいます.なぜなら,目の前にいる生徒が「サンマの内臓を食べない」という可能性がなくなるから,図中の内臓を食べない(内臓×)という部分が消え失せ,結果として図が下のように変化してしまう(縮んでしまう)からです.

「サンマの内臓を食べる」という発言を聞いてしまった以上,この右側の縮んでしまった図のもとで確率を考え直さねばなりません:全体の人数が\(35+10=45\)で,そのうち尻尾を食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{45}\left(=\frac{7}{9}\right)\)となります.図で視覚化すると,以下のようになります.

このように,「情報が入ることで,図(全事象)が縮む」というのが理解のポイントです.

ではいよいよ上の話を数式に翻訳してみましょう.
題意の確率「『(選び出された生徒が)内臓を食べる』という情報を耳にしたとき,その生徒が尻尾も食べる確率」を\[P(\text{尻尾}|\text{内臓})\]と書くことにしましょう.この確率は,上の議論により
\[
\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}
\]
と書けることになります(下図参照).

したがって,\[P(\text{尻尾}|\text{内臓})=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\]
さらに,分母分子を全体の人数\(n(\text{全体})(=100)\)で割ると
\[
\begin{align*}
P(\text{尻尾}|\text{内臓})&=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\\
&=\frac{\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{全体})}}{\frac{n(\text{内臓})}{n(\text{全体})}}=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\end{align*}
\]
となります.したがって,
\[
P(\text{尻尾}|\text{内臓})=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\]
と書けます.さらに,「内臓(内臓を食べる)」という事象を\(A\),「尻尾(尻尾を食べる)」という事象を\(B\)とおけば
\[
P(B|A)=\frac{P(B\cap A)}{P(A)}
\]
となり最初の定義式を得ます.

以上をまとめると,条件付き確率の定義式の直観的イメージは次のようだといえそうです:

    • 情報が入ったことで,全事象が縮んでしまう(事象\(\overline{A}\)が消え,事象\(A\)だけ残る).
    • 縮んだあとの事象\(A\)のもとでの確率を考えることになるから,分母には\(P(A)\)がくる.
    • 分子には,事象\(\overline{A}\)が消えてしまい事象\(A\)だけに縮んでしまった,そのもとでの事象\(B\),すなわち事象\(B\cap A\)の確率\(P(B\cap A)\)がくる.

定義式\(P(B|A)=\frac{P(B\cap A)}{P(A)}\)は上の図のイメージ,すなわち「全事象が縮んだあとの確率計算」という認識をもっておくことが直観的理解のコツ,ということです.

ちなみに,\(P(B|A)\)は高校教科書では\(P_A(B)\)と表現していることに注意してください.どちらも同じ意味で,正しい記法です.が,個人的には\(P(B|A)\)の方をおすすめします.記述の際に書きやすいし,何より気持ち的に\(A\)が\(B\)の『後側』にあることから「\(A\)が\(B\)『背景』にあるんだよ」というニュアンスが伝わりやすいからです.