余事象の独立性

事象\(\mathrm{A,~B}\)が独立であるとき,\(\mathrm{A^c,~B^c}\)は独立です.また,事象\(\mathrm{A,~B,~C}\)が独立であるとき,\(\mathrm{A^c,~B^c,~C^c}\)は独立です.証明は高校数学でもお馴染みの公式をガチャガチャやれば出来ます.では,一般の場合はどうでしょうか?

\(\mathrm{A_1,~A_2,~\cdots,~A_n}\)を事象の列とする.
\[\mathrm{A_1,~A_2,~\cdots,~A_n}~\text{が独立}~\Longrightarrow \mathrm{A_1^c,~A_2^c,~\cdots,~A_n^c}~\text{が独立}\]

証明
\[\mathrm{A_1,~A_2,~\cdots,~A_n}~\text{が独立}~\Longrightarrow \mathrm{A_1^c,~A_2,~\cdots,~A_n}~\text{が独立}\cdots{(\ast)}\]が示せればよい.実際,もしこれが言えたとすると,
\[
\begin{align*}
\mathrm{A_1,~A_2,~\cdots,~A_n}~\text{が独立}~&\Longrightarrow \mathrm{A_1^c,~A_2,~\cdots,~A_n}~\text{が独立}\\
&\Longleftrightarrow \mathrm{A_2,~A_3~\cdots,~A_n,~A_1^c}~\text{が独立}\\
&\Longrightarrow \mathrm{A_2^c,~A_3~\cdots,~A_n,~A_1^c}~\text{が独立}\\
&\Longleftrightarrow \mathrm{A_3,~A_4,~\cdots,~A_n,~A_1^c,~A_2^c}~\text{が独立}\\
&\Longrightarrow \mathrm{A_3^c,~A_4,~\cdots,~A_n,~A_1^c,~A_2^c}~\text{が独立}\\
&\Longleftrightarrow \mathrm{A_4,~A_5,~\cdots,~A_n,~A_1^c,~A_2^c,~A_3^c}~\text{が独立}\\
&\Longrightarrow ~\cdots\\
&\Longleftrightarrow \mathrm{A_1^c,~A_2^c,~A_3^c,~\cdots,~A_n^c}~\text{が独立}\\
\end{align*}
\]
とできます.\((\ast)\)を示します.
\[
\begin{align*}
P(\mathrm{A_2\cap A_3\cap \cdots \cap A_n})=&P(\mathrm{\Omega \cap A_2\cap A_3\cap \cdots \cap A_n})\\
=&P(\mathrm{(A_1\cup A_1^c) \cap A_2\cap A_3\cap \cdots \cap A_n})\\
=&P(\mathrm{(A_1 \cap A_2\cap A_3\cap \cdots \cap A_n)\cup (A_1^c \cap A_2\cap A_3\cap \cdots \cap A_n}))\\
=&P(\mathrm{A_1 \cap A_2\cap A_3\cap \cdots \cap A_n)+P(A_1^c \cap A_2\cap A_3\cap \cdots \cap A_n})\\
\end{align*}
\]
したがって,
\[P(\mathrm{A_2\cap A_3\cap \cdots \cap A_n)=P(A_1 \cap A_2\cap A_3\cap \cdots \cap A_n)+P(A_1^c \cap A_2\cap A_3\cap \cdots \cap A_n})\]を得ます.仮定より,\(\mathrm{A_1,~A_2,~\cdots~,A_n}\)の独立性から,\[\mathrm{P(A_2)P(A_3) \cdots P(A_n)=P(A_1)P(A_2)P(A_3) \cdots P(A_n)+P(A_1^c \cap A_2\cap A_3\cap \cdots \cap A_n})\]とでき,さらに変形すると\[\mathrm{P(A_1^c \cap A_2\cap A_3\cap \cdots \cap A_n)=(1-P(A_1))P(A_2)P(A_3) \cdots P(A_n)}\]したがって\[\mathrm{P(A_1^c \cap A_2\cap A_3\cap \cdots \cap A_n)=P(A_1^c)P(A_2)P(A_3) \cdots P(A_n)}\]となり,\((\ast)\)が証明できました(証明終)

原因の確率

教科書では「研究」「発展」などに分類され,端っこの方に追いやれている話題です.授業でも扱わないことが多いので,無視して先に進む人も多いと思いますが,これは実はとても面白い話題です.今回はこの話題について触れてみます.

Aさんはがん検査を受けた.その結果は「要精密検査」であった.この検査は,実際にがんの人が要精密検査とされる確率が\(90\%\)で,実際にはがんではないのに要精密検査とされる確率が\(10\%\)であるような検査である.検診を受ける人の1000人に1人は実際にがんにかかっているとすると,Aさんが実際にがんである確率はいくらか.

Aさんを自分に置き換えて考えてみましょう.検査を受けたら「要精密検査」で,実際にがんの人が要精密検査とされる確率が\(90\%\)と言われたら,「ああ自分はがんなんだ…」と考え落ち込むのではないでしょうか.が,落ち着むのは尚早です.今置かれた状況をよく見ると「『要精密検査』という結果が与えられたときの,実際にがんである確率」ですから,これは条件付き確率です.では,実際に計算して自分ががんである確率を求めてみましょう!(注意:条件付き確率ベイズの定理についての知識が必要になります.未習の人はこれらの記事を先に読んでみてください.)条件付き確率の定義より,

\[P(\text{実際にがん}|\text{要精密検査})=\frac{P(\text{実際にがん}\cap\text{要精密検査})}{P(\text{要精密検査})}\]

まず,分子から求めてみます.確率の乗法定理より,
\[P(\text{実際にがん}\cap\text{要精密検査})=P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})\]
です.問題文より,
\[P(\text{実際にがん})=\frac{1}{1000},\quad P(\text{要精密検査}|\text{実際にがん})=\frac{90}{100}\]
です.ですから分子は\[\frac{1}{1000}\times\frac{90}{100}\]となります.

次に分母.\(P(\text{要精密検査})\)つまり「『要精密検査』とされる確率」です.「『要精密検査』とされる」という状況には2通りあります.すなわち,

          • 「実際にがんで,『要精密検査』」
          • 「実際にはがんではないのに,『要精密検査』」

という2通りの場合です.それぞれ

          • \(P(\text{実際にがん}\cap \text{要精密検査})\)
          • \(P(\text{実際はがんではない}\cap \text{要精密検査})\)

と表されますから,結局分母は\[P(\text{実際にがん}\cap \text{要精密検査})+P(\text{実際はがんではない}\cap \text{要精密検査})\]と表されます(全確率の定理).さらに,確率の乗法定理より,この式は
\[P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})+P(\text{実際はがんではない})P(\text{要精密検査}|\text{実際はがんではない})\]と表されます.前の項は前半で求めました.\(\frac{1}{1000}\times \frac{90}{100}\).後ろの項は,問題文より,
\[P(\text{実際はがんではない})=\frac{999}{1000},\quad P(\text{要精密検査}|\text{実際はがんではない})=\frac{10}{100}\]ですから\(\frac{999}{1000}\times\frac{10}{100}\).ですから分母は
\[\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}\]となります.したがって,求める確率\(P(\text{実際にがん}|\text{要精密検査})\)は,
\[
\begin{align*}
P(\text{実際にがん}|\text{要精密検査})&=\frac{\frac{1}{1000}\times\frac{90}{100}}{\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}}\\
&=\frac{1\times 90}{1\times 90 +999\times 10}\\
&=\frac{9}{9+999}\\
&=\frac{1}{112}\approx 0.00893
\end{align*}
\]となります.なんと,「要精密検査」と言われ実際にがんである確率はたったの\(0.00893\),つまり\(1\%\)にも満たない,ということです!

このように,確率は時として人間の直感を大きく裏切ります.しかし,論理によってはじき出された結果である以上,人間の感情としてどう感じようとそれは受け入れざるを得ない.そこが数学の面白さ・頼もしさのひとつだと思います.

全確率の定理

A君が友人とストリートファイターⅡ(スーファミ)で友人Bと対戦している.A君が勝つ確率は?

という問題があったとしましょう.こんな問題を見たらどう思いますか?(勝つか負けるか,2分の1だ!は間違いですよ~)当然,こう思うと思います「そらA君が誰使うかによるだろ」と.では,どんな場合があるでしょうか.リュウを使う場合,ケンを使う場合,ガイルを使う場合,春麗を使う場合….いろいろ考えられます.そして,ストⅡは2人同時に操作はできません(そのラウンドで1人のプレイヤーがリュウとケンと同時に操作し味方2人状態で戦うことはできません!).つまり同時に起こることはありませんから,これらの場合は互いに排反です.したがって,求める確率は
\[
\begin{align*}
P(\text{A君が勝つ})=&P(\text{A君が勝つ}\cap\text{リュウを使う})+P(\text{A君が勝つ}\cap\text{ケンを使う})\\
&+P(\text{A君が勝つ}\cap\text{エドモンド本田を使う})+P(\text{A君が勝つ}\cap\text{春麗を使う})\\
&+P(\text{A君が勝つ}\cap\text{ブランカを使う})+P(\text{A君が勝つ}\cap\text{ザンギエフを使う})\\
&+P(\text{A君が勝つ}\cap\text{ガイルを使う})+P(\text{A君が勝つ}\cap\text{ダルシムを使う})
\end{align*}
\]
「A君が勝つ」という事象を\(A\),「リュウを使う」という事象を\(B_1\),「ケンを使う」という事象を\(B_2\),「エドモンド本田を使う」という事象を\(B_3\),・・・,「ダルシムを使う」という事象を\(B_8\)とおくことにすれば,上の式は
\[
\begin{align*}
P(A)=&P(A\cap B_1)+P(A\cap B_2)+P(A\cap B_3)+P(A\cap B_4)\\
&+P(A\cap B_5)+P(A\cap B_6)+P(A\cap B_7)+P(A\cap B_8)\\
&=\displaystyle \sum^{8}_{i=1}P(A\cap B_i)
\end{align*}
\]すなわち\[P(A)=\displaystyle \sum^{8}_{i=1}P(A\cap B_i)\]と書けることがわかります.これを一般化すると,

全確率の定理\[P(A)=\displaystyle \sum^{\infty}_{i=1}P(A\cap B_i)\]

であると言えそうです.これを全確率の定理と呼びます.

ところで「ストリートファイター」ってゲーム自体今はどれくらい知名度あるんだろう?僕の時代は知らない人はいないくらいに流行っていました(スクリューパイルドライバーが出せたらまさにヒーロー).なので馴染みやすいかなと思って例に挙げましたが….調べると今はストリートファイター5まであるみたいですね.プレイアブルキャラは40人(!)らしいですから,この場合は\[P(A)=\displaystyle \sum^{40}_{i=1}P(A\cap B_i)\]ですね^^;

確率の乗法定理

条件付き確率の定義より,\[P(B|A)=\frac{P(B\cap A)}{P(A)}\]
両辺に\(P(A)\)を掛けることによって,\[P(A \cap B)=P(A)P(B|A)\]が得られます.(\(P(B \cap A)=P(A\cap B)\)としました)これを確率の乗法定理といいます.

確率の乗法定理(その1)\[P(A \cap B)=P(A)P(B|A)\]

日本語に翻訳すると「事象\(A\)と事象\(B\)が同時に起こる確率は,事象\(A\)の確率と,事象\(A\)の影響を受けた事象\(B\)の確率(条件付き確率)との積に等しい」ということで,少し確率の問題に慣れた人であればいつも無意識にやっている計算だと思います.例題で確認してみます.
当たりくじ3本を含む10本のくじの中から,引いたくじはもとに戻さないで,1本ずつ2回続けてくじを引く.2本とも当たる確率を求めよ.また,2回目が当たる確率いくらか.

1回目が当たるという事象を\(A\),2回目が当たるという事象を\(B\)とします.

2本とも当たる確率)
求める確率は\(P(A\cap B)\)です.確率の乗法定理より,\(P(A \cap B)=P(A)P(B|A)\)ですから,\(P(A)\)と\(P(B|A)\)を求めましょう.\(P(A)=\frac{3}{10}\)なのは問題ないでしょう.\(P(B|A)\)を求めます.これは「1回目が当たったという事実のもとで2回目が当たる確率」ですから,「引いたくじはもとに戻さない(当たりが1枚減る)」ことに注意せねばなりません.1回目に当たりを引けば,その後全体の枚数は9枚,当たりは2枚になりますから,\(P(B|A)=\frac{2}{9}\)です.したがって求める確率は\[P(A \cap B)=P(A)P(B|A)=\frac{3}{10}\cdot\frac{2}{9}=\frac{1}{15}\]となります.

2回目が当たる確率)
求める確率は\(P(B)\)です.まず気をつけて欲しいのは,求めようとしているのは確率\(P(B)\)であって確率\(P(B|A)\)ではない,ということ.すなわち,確率を求めようとしている今この時,まだ1回目は引いてもいない!何もしていない!ということです.まだなにもしていない,くじの前で黙って腕を組んだまま2回目を予想している(\(P(B)\)を求めようとしている)…そんなイメージです.1回目は引いてもいないし眼中にもありません.2回目だけを見つめています.以上に留意して,実際に\(P(B)\)を求めてみましょう.確率の定義に従います.2回目に起こりうるすべての場合の数は?2回目において,10枚のくじのどれが引きやすくどれが引きにくいなどということはありません(同様に確からしい).よって10通り.題意に適する場合の数は?当たり3枚のうちどれが引きやすくどれが引きにくいということはやはりありません.よって3通り.したがって求める確率は,\[P(B)=\frac{3}{10}\]となります.\(P(B|A)\neq P(B)\)であることに注目してください.

次の問題です.

当たりくじ3本を含む10本のくじの中から,1本ずつ2回続けてくじを引く.2本とも当たる確率を求めよ.ただし,引いたくじはもとに戻すものとする.また,2回目に当たる確率はいくらか.

2本とも当たる確率)
求める確率は\(P(A\cap B)\)です.確率の乗法定理より,\(P(A \cap B)=P(A)P(B|A)\)ですから,\(P(A)\)と\(P(B|A)\)を求めましょう.\(P(A)=\frac{3}{10}\)なのは問題ないでしょう.\(P(B|A)\)を求めます.これは「1回目が当たったという事実のもとで2回目が当たる確率」なわけですが,今回は引いたくじをもとに戻しています.ですから,2回目の状況は1回目の状況となんら変化がないことになります.したがって,\(P(B|A)=\frac{3}{10}\)となります.よって,求める確率は\[P(A \cap B)=P(A)P(B|A)=\frac{3}{10}\cdot\frac{3}{10}=\frac{9}{100}\]となります.

2回目が当たる確率)
求める確率は\(P(B)\)です.前問同様に考えます.2回目に起こりうるすべての場合の数は?2回目において10枚のくじのどれもが同様に確からしい.よって10通り.題意に適する場合の数は?当たり3枚のうちどれもがやはり同様に確からしい.よって3通り.したがって求める確率は,\[P(B)=\frac{3}{10}\]となります.前問と全く同じです.

さて,今回は\(P(B|A)\),\(P(B)\)はどちらも\(\frac{3}{10}\)ですから\(P(B|A)=P(B)\)です.この,\[P(B|A)=P(B)\]が成り立つとき,事象\(A\)と事象\(B\)は独立であるといいます.この式を「翻訳」すると,「\(B\)の確率は\(A\)が起きたかどうかなんて関係ない」と,すなわち「事象\(A\)と事象\(B\)が互いに影響を及ぼしていない」と読み取ることができます.

以上の準備のもと,次の定理が成り立ちます.

確率の乗法定理(その2)事象\(A\)と事象\(B\)が独立,すなわち\(P(B|A)=P(B)\)のとき\[P(A \cap B)=P(A)P(B)\]

高校教科書では上の話を,「2つの試行同士が互いに影響を与えない」ことを「独立」であると定義し,そのもとで確率の乗法定理(その2)を紹介しています.そしてこの話とは別の話題として(大分後になってから)「条件付き確率」から「確率の乗法定理(その2)」を導く,という順序で説明しています.なので,確率の乗法定理が2回(しかもそのあいだかなり間を挟んでから)登場することになり,それらにどのような関係があるのかがいまいち見えづらいのではないでしょうか.

しかし,上でみたように\[\text{条件付き確率の定義}\rightarrow\text{確率の乗法定理その1}\rightarrow\text{「独立」の定義}\rightarrow\text{確率の乗法定理その2}\]という流れで理解すると,高校教科書では「別々のもの」として載っている2つの確率の乗法定理が同じもの(その1を特殊化したものがその2)であることが明解で,論理的にはしっくりくると個人的に思います.

もっとも,実用上においては(実際問題を解く上では)どちらの理解でも大差はないと思いますが…

ベイズの定理

ベイズの定理\[P(B_i|A)=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P( B_j|A)}\quad(i=1,2,\cdots)\]

(証明)
\[
\begin{align*}
P(B_i|A)&=\frac{P(B_i\cap A)}{P(A)}&\cdots~(1)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A\cap B_j)}&\cdots~(2)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P(B_j|A)}&\cdots~(3)
\end{align*}
\]
\((1)\)は条件付き確率の定義そのものです.\((2)\)の分子は確率の乗法定理より,分母は全確率の定理によります.\((2)\)の分母に再び確率の乗法定理を用いると\((3)\)となります.(証明終)

この「ベイズの定理」は,証明の過程を見て貰えば分かる通り,条件付き確率の定義式確率の乗法定理全確率の定理を用いて変形したものに過ぎません.なので,この式は「根っこはあくまで条件付き確率の定義式だ」という認識のもと,あとは(その条件付き確率の定義式を)問題に応じて便宜変形する,というような使い方をすればよいと思います(つまり「条件付き確率」の定義を納得しており,「確率の乗法定理」と「全確率の定理」を知ってさえいればベイズの定理そのものを覚える必要はない,ということ).

このベイズの定理を用いて,次の問題を解いてみます.早稲田大の問題です.

ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し,表を見ないで箱の中にしまった.そして残りのカードをよくきってから3枚抜き出したところ,3枚ともダイヤであった.このとき箱の中のカードがダイヤである確率を求めよ.
(早稲田・文)

「抜き出された1枚がダイヤ」という事象を\(A\),「3枚ともダイヤ」という事象を\(B\)とおきます.すると,求める確率は\(P(A|B)\)と表せます.これをベイズの定理を用いて計算してみましょう.
\[
\begin{align*}
P(A|B)&=\frac{P(A\cap B)}{P(B)}\\
&=\frac{P(A)P(B|A)}{P(B\cap A)+P(B\cap \overline{A})}\\
&=\frac{P(A)P(B|A)}{P(A\cap B)+P(\overline{A}\cap B)}\\
&=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}\\
&=\frac{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}+\frac{{}_{39} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{13} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}\\
&=\frac{10}{49}
\end{align*}
\]
となります.

条件付き確率の直観的理解

条件付き確率の定義事象\(A\),事象\(B\)に対して,確率\[\frac{P(B\cap A)}{P(A)}\]を\(A\)が与えられたときの\(B\)の条件付き確率と呼び,\(P(B|A)\)と書く.

この定義をみても,正直しっくりこないという人は多いと思います.今回はこの条件付き確率の定義の直観的理解を目指してみようと思います.

まず,次の問題を考えてみましょう.

問題
100人の生徒に,次の2つの質問をした.「さんまの内臓を食べるか食べないか」「エビフライのしっぽは食べるか食べないか」.すると,次のような結果を得た.この100人の中から,1人を選び出す.このとき,次の問いに答えよ.

    1. 選び出された生徒が,サンマの内臓を食べる確率
    2. 選び出された生徒が,エビフライのしっぽを食べる確率
    3. 選び出された生徒が,サンマの内臓もエビフライのしっぽも食べる確率
    4. 選び出された生徒が,サンマの内臓は食べるが,エビフライのしっぽは食べない確率
    5. 選び出された生徒が「自分はサンマの内臓は食べますよ~」と発言した.このとき,その生徒がエビフライのしっぽも食べる確率

(解答)

    1. 表をみると全生徒\(100\)人の中でサンマの内臓を食べる人数は\(45\)人ですから,求める確率は\(\frac{45}{100}\)
    2. 表を見ると全生徒\(100\)人の中でエビフライの尻尾を食べる人数は\(67\)人ですから,求める確率は\(\frac{67}{100}\)
    3. 表を見ると全生徒\(100\)人の中でサンマの内臓もエビフライの尻尾も食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{100}\)
    4. 表を見ると全生徒\(100\)人の中でサンマの内臓は食べるが,エビフライの尻尾は食べない人数は\(10\)人ですから,求める確率は\(\frac{10}{100}\)

…と簡単に求められると思います.ここまでウォーミングアップ.問題は5.です.

実際に想像してみましょう.自分の目の前に一人生徒が来た.この生徒がエビフライの尻尾を食べるかどうかを予測したい.そこで,確率を求めようと表を眺めます.この時点では選び出されたその生徒がエビフライの尻尾を食べる確率は\(\frac{67}{100}\)です.図で視覚化すると,

という感じでしょうか.この時点では確率は2.とおんなじです.

しかしここで!その生徒が「自分はサンマの内臓は食べますよ~美味しいですよね~」と喋り,我々がその発言を聞いてしまったとしましょう.すると状況は一変してしまいます.なぜなら,目の前にいる生徒が「サンマの内臓を食べない」という可能性がなくなるから,図中の内臓を食べない(内臓×)という部分が消え失せ,結果として図が下のように変化してしまう(縮んでしまう)からです.

「サンマの内臓を食べる」という発言を聞いてしまった以上,この右側の縮んでしまった図のもとで確率を考え直さねばなりません:全体の人数が\(35+10=45\)で,そのうち尻尾を食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{45}\left(=\frac{7}{9}\right)\)となります.図で視覚化すると,以下のようになります.

このように,「情報が入ることで,図(全事象)が縮む」というのが理解のポイントです.

ではいよいよ上の話を数式に翻訳してみましょう.
題意の確率「『(選び出された生徒が)内臓を食べる』という情報を耳にしたとき,その生徒が尻尾も食べる確率」を\[P(\text{尻尾}|\text{内臓})\]と書くことにしましょう.この確率は,上の議論により
\[
\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}
\]
と書けることになります(下図参照).

したがって,\[P(\text{尻尾}|\text{内臓})=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\]
さらに,分母分子を全体の人数\(n(\text{全体})(=100)\)で割ると
\[
\begin{align*}
P(\text{尻尾}|\text{内臓})&=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\\
&=\frac{\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{全体})}}{\frac{n(\text{内臓})}{n(\text{全体})}}=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\end{align*}
\]
となります.したがって,
\[
P(\text{尻尾}|\text{内臓})=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\]
と書けます.さらに,「内臓(内臓を食べる)」という事象を\(A\),「尻尾(尻尾を食べる)」という事象を\(B\)とおけば
\[
P(B|A)=\frac{P(B\cap A)}{P(A)}
\]
となり最初の定義式を得ます.

以上をまとめると,条件付き確率の定義式の直観的イメージは次のようだといえそうです:

    • 情報が入ったことで,全事象が縮んでしまう(事象\(\overline{A}\)が消え,事象\(A\)だけ残る).
    • 縮んだあとの事象\(A\)のもとでの確率を考えることになるから,分母には\(P(A)\)がくる.
    • 分子には,事象\(\overline{A}\)が消えてしまい事象\(A\)だけに縮んでしまった,そのもとでの事象\(B\),すなわち事象\(B\cap A\)の確率\(P(B\cap A)\)がくる.

定義式\(P(B|A)=\frac{P(B\cap A)}{P(A)}\)は上の図のイメージ,すなわち「全事象が縮んだあとの確率計算」という認識をもっておくことが直観的理解のコツ,ということです.

ちなみに,\(P(B|A)\)は高校教科書では\(P_A(B)\)と表現していることに注意してください.どちらも同じ意味で,正しい記法です.が,個人的には\(P(B|A)\)の方をおすすめします.記述の際に書きやすいし,何より気持ち的に\(A\)が\(B\)の『後側』にあることから「\(A\)が\(B\)『背景』にあるんだよ」というニュアンスが伝わりやすいからです.

モンティ・ホール問題

みんな大好きモンティ・ホール問題.

プレーヤーの前に閉じた3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。ここでプレーヤーはドアを変更すべきだろうか?

この有名な問題にはいろいろな考え方があるようですが,ここでは条件付き確率の問題とみて(ベイズの定理を使って)考えてみましょう!

与えられた3つのドアにA,B,Cと名前をつけます.

まず「プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる」とあるので,ここではプレーヤーが部屋Aを選び,モンティが部屋Bのドアを開けたとしましょう.

ここで,プレーヤーに選択権が与えられるわけです.最初の選択(部屋A)を変えずにいるか,それとも部屋Cに選択を変えるか.選び方によって確率は変わるのか,変わらないのか.変わるのであれば,どちらを選択するのが賢明か…?

計算してみましょう.モンティが部屋\(B\)を開けるという事象を「\(B\text{開}\)」,実際に部屋\(X\)に車があるという事象を「\(X\text{車}\)」と書くことにします.

まず,部屋を変えない場合

求めたい確率は「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Aに車がある確率」ですから,\(P(A\text{車}|B\text{開})\)となります.計算してみましょう.

\[
\begin{align*}
P(A\text{車}|B\text{開})&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開})}&\cdots(1)\\
&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}&\cdots(2)\\
&=\frac{\frac{1}{2}}{\frac{1}{2}+1}&\cdots(3)\\
&=\frac{1}{3}
\end{align*}
\]

\((1)\)は条件付き確率の定義そのものです.

\((2)\)の分母について:\(B\text{開}\)という状況,すなわち「モンティが部屋\(B\)を開ける」という状況を詳しく見ると次の3通りが考えられます

      • 車が部屋\(A\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(C\)にあって,モンティが部屋\(B\)を開ける

このうち真ん中「車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける」はありえません(モンティはヤギの部屋を開けるわけですから).したがって\[P(B\text{開})=P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})\]となります(全確率の定理).

\((3)\)で\(P(A\text{車}\cap B\text{開})=\frac{1}{2}\)である理由:まず,プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられません.そして今車は部屋\(A\)にありますから,部屋\(B\)と部屋\(C\)にはヤギがいることになります.つまりモンティには部屋\(B\)を開けるか,部屋\(C\)を開けるか2つの選択肢があります.したがって確率は\(\frac{1}{2}\)となります.

\((3)\)で\(P(B\text{開}\cap C\text{車})=1\)である理由:プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられず,また部屋\(C\)には実際に車があるのでモンティは部屋\(C\)も開けられません.所以,モンティが開けられるのは部屋\(B\)しかありません.したがって確率は1となります.

以上に気を付けて計算すると確率は\(\dfrac{1}{3}\)になります.

次に,部屋を変える場合

求めたい確率は,「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Cに車がある確率」ですから,\(P(C\text{車}|B\text{開})\)となります.同じように計算してみましょう.

\[
\begin{align*}
P(C\text{車}|B\text{開})&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開})}\\
&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}\\
&=\frac{1}{\frac{1}{2}+1}=\frac{2}{3}
\end{align*}
\]

よって確率は\(\dfrac{2}{3}\)となります.

結局,部屋を変えたほうがよい(当たる確率が倍になる!)ことが分かります!

ここで用いた考え方は「ベイズの定理」と呼ばれます.このベイズの定理を使うと,とくに難しい局面もないままに単純な計算のもと欲しい確率が手に入ってしまいます.

 

 

© 2024 佐々木数学塾, All rights reserved.