否定をとることの難しさと論理式の有用性

背理法で示す方針の場合,与えられた命題を否定する必要がありますが,これが意外と難しいケースがあります.

\(xy\)平面内の相異なる4点\(P_1,~P_2,~P_3,~P_4\)とベクトル\(\overrightarrow{v}\)に対し,\(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする.このとき,\(k\)と異なるすべての\(m\)に対し\[\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\]が成り立つような点\(P_k\)が存在することを示せ.(京都大・文)

この問題の場合,与えられた命題は

「\(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする.このとき,\(k\)と異なるすべての\(m\)に対し\(\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\)が成り立つような点\(P_k\)が存在する」

です.この否定をとればいいわけですが,どこからどう手をつければいいのかいまいちわからない,できたとしてもなんだか不安….そこで,ここでは論理記号を用いて捉えてみます.与えられた命題を次の4つの部分に分けて翻訳していきます.

      1. \(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする.
      2. このとき,
      3. \(k\)と異なるすべての\(m\)に対し\(\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\)が成り立つ
      4. ような点\(P_k\)が存在する

1.「\(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする」は
\[k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\]

2.「このとき」は\[\Longrightarrow\]

3.「\(k\)と異なるすべての\(m\)に対し\(\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\)が成り立つ」は\[\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]\]

4.「ような点\(P_k\)が存在する」は
\[\exists P_k\]

ですから,以上を繋げると,
\[\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\Longrightarrow\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]\]
となります.これの否定を考えます.
\[\overline{\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\Longrightarrow\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]}\]

ここで,一般に
\[
\begin{align*}
&(A\rightarrow B)\Longleftrightarrow \overline{A}\lor B
\end{align*}
\]
ですから,
\[\overline{A\rightarrow B}\Longleftrightarrow \overline{\overline{A} \lor B}\Longleftrightarrow A \land \overline{B}\]
です.したがって,
\[
\begin{align*}
&\overline{\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\Longrightarrow\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]}\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \overline{\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]}\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[\overline{m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0}\big]\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[m\neq k \land \overline{\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0}\big]\\ \Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}\geq0\big]\\ \Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[(m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}>0)\lor(m\neq k \land\overrightarrow{P_kP_m}\cdot\overrightarrow{v}=0)\big]\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\big[\exists m(m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}>0)\lor\exists m(m\neq k \land\overrightarrow{P_kP_m}\cdot\overrightarrow{v}=0)\big]\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m(m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}>0)
\end{align*}
\]
となります.

もとの問題の解説では他の解法があったのですが,別解としての上記のように否定をとり矛盾を示す方針が載っていました.が,その「否定をとる」という作業の時点で既に難しく,ならば論理式で記述したらどうなるかなと思い考えてみました.見た目こそ厳ついものの,論理式の扱いに慣れさえすればとても分かりやすく明解です.

シグマ計算の工夫

教科書には次の式が公式として載っています.\[\sum^n_{k=1}ar^{n-1}=\frac{a(1-r^n)}{1-r}\]これは「公式」なのだから覚えるべきなのでしょうか?

結論から言えば,これは覚えるべき式ではありません.次のように考えましょう:

\[\sum\text{の後ろが\(r^{n}\)の形をしている}\]
ことからこれは等比数列の和であることが見て取れます.ここが最大のポイント.
等比数列の和の公式を思い出しましょう.等比数列の和の公式で必要な情報は,初項,公比,項数,の3つの情報でした.それらさえ分かればいい.\(\sum^n_{k=1}ar^{n-1}\)から読み取ってみましょう.

初項は?\(ar^{n-1}\)に\(n=1\)を代入すればよいでしょう.\(ar^{1-1}=ar^{0}=a\)です.

公比は?これは式の形からただちに\(r\)と分かります.

項数は?\(\sum^n_{k=1}\),すなわち項は\(1\)から\(n\)までありますから\(n\)個です.

したがって,等比数列の和の公式にこれらを代入し,\[\frac{a(1-r^n)}{1-r}\]が得られます.

練習に次の問題をやってみましょう.

\[(1)~\sum^{10}_{k=6}2\cdot 3^k\hspace{40mm}(2)~\sum^{2n-1}_{k=m}5^{2k-1}\]

\((1)\)

初項は?\(2\cdot 3^k\)に\(k=1\)と代入すればよいでしょう.\(2\cdot 3^1=6\)です.

公比は?式の形から,\(3\)です.

項数は?\(10-6+1=5\)です.

したがって,求める和は\[\frac{6(1-3^5)}{1-3}=\frac{6(3^5-1)}{2}=3^6-3=726\]となります.

\((2)\)

初項は?\(5^{2k-1}\)に\(k=m\)と代入すればよいでしょう.\(5^{2m-1}\)です.

公比は?\(5^{2k-1}=5^{2k}\cdot5^{-1}=\frac{1}{5}25^k\)であることに注意して,\(25\)です.

項数は?\((2n-1)-m+1=2n-m\)です.

したがって,求める和は\[\frac{5^{2m-1}(1-25^{2n-m})}{1-25}=\frac{5^{2m-1}(25^{2n-m}-1)}{24}\]となります.

以上,解答の過程に着目して欲しいのですが「\(\sum ar^{n-1}\)の公式」など必要ありませんし,覚えていても上ような形に添わないため使い物にすらなりません.

一般に,教科書が「公式」だと言っているから必ず覚えてなくてはならない,という訳では決してありません.教科書で「覚えろ」と言わんばかりの記述であっても,それが本当に覚える価値のある式なのか,それとも導出過程さえ押さえればいい式なのか,自分の頭で考え,疑う癖をつけることは数学を学ぶ上では非常に大事です.

原因の確率

教科書では「研究」「発展」などに分類され,端っこの方に追いやれている話題です.授業でも扱わないことが多いので,無視して先に進む人も多いと思いますが,これは実はとても面白い話題です.今回はこの話題について触れてみます.

Aさんはがん検査を受けた.その結果は「要精密検査」であった.この検査は,実際にがんの人が要精密検査とされる確率が\(90\%\)で,実際にはがんではないのに要精密検査とされる確率が\(10\%\)であるような検査である.検診を受ける人の1000人に1人は実際にがんにかかっているとすると,Aさんが実際にがんである確率はいくらか.

Aさんを自分に置き換えて考えてみましょう.検査を受けたら「要精密検査」で,実際にがんの人が要精密検査とされる確率が\(90\%\)と言われたら,「ああ自分はがんなんだ…」と考え落ち込むのではないでしょうか.が,落ち着むのは尚早です.今置かれた状況をよく見ると「『要精密検査』という結果が与えられたときの,実際にがんである確率」ですから,これは条件付き確率です.では,実際に計算して自分ががんである確率を求めてみましょう!(注意:条件付き確率ベイズの定理についての知識が必要になります.未習の人はこれらの記事を先に読んでみてください.)条件付き確率の定義より,

\[P(\text{実際にがん}|\text{要精密検査})=\frac{P(\text{実際にがん}\cap\text{要精密検査})}{P(\text{要精密検査})}\]

まず,分子から求めてみます.確率の乗法定理より,
\[P(\text{実際にがん}\cap\text{要精密検査})=P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})\]
です.問題文より,
\[P(\text{実際にがん})=\frac{1}{1000},\quad P(\text{要精密検査}|\text{実際にがん})=\frac{90}{100}\]
です.ですから分子は\[\frac{1}{1000}\times\frac{90}{100}\]となります.

次に分母.\(P(\text{要精密検査})\)つまり「『要精密検査』とされる確率」です.「『要精密検査』とされる」という状況には2通りあります.すなわち,

          • 「実際にがんで,『要精密検査』」
          • 「実際にはがんではないのに,『要精密検査』」

という2通りの場合です.それぞれ

          • \(P(\text{実際にがん}\cap \text{要精密検査})\)
          • \(P(\text{実際はがんではない}\cap \text{要精密検査})\)

と表されますから,結局分母は\[P(\text{実際にがん}\cap \text{要精密検査})+P(\text{実際はがんではない}\cap \text{要精密検査})\]と表されます(全確率の定理).さらに,確率の乗法定理より,この式は
\[P(\text{実際にがん})P(\text{要精密検査}|\text{実際にがん})+P(\text{実際はがんではない})P(\text{要精密検査}|\text{実際はがんではない})\]と表されます.前の項は前半で求めました.\(\frac{1}{1000}\times \frac{90}{100}\).後ろの項は,問題文より,
\[P(\text{実際はがんではない})=\frac{999}{1000},\quad P(\text{要精密検査}|\text{実際はがんではない})=\frac{10}{100}\]ですから\(\frac{999}{1000}\times\frac{10}{100}\).ですから分母は
\[\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}\]となります.したがって,求める確率\(P(\text{実際にがん}|\text{要精密検査})\)は,
\[
\begin{align*}
P(\text{実際にがん}|\text{要精密検査})&=\frac{\frac{1}{1000}\times\frac{90}{100}}{\frac{1}{1000}\times \frac{90}{100}+\frac{999}{1000}\times\frac{10}{100}}\\
&=\frac{1\times 90}{1\times 90 +999\times 10}\\
&=\frac{9}{9+999}\\
&=\frac{1}{112}\approx 0.00893
\end{align*}
\]となります.なんと,「要精密検査」と言われ実際にがんである確率はたったの\(0.00893\),つまり\(1\%\)にも満たない,ということです!

このように,確率は時として人間の直感を大きく裏切ります.しかし,論理によってはじき出された結果である以上,人間の感情としてどう感じようとそれは受け入れざるを得ない.そこが数学の面白さ・頼もしさのひとつだと思います.

全確率の定理

A君が友人とストリートファイターⅡ(スーファミ)で友人Bと対戦している.A君が勝つ確率は?

という問題があったとしましょう.こんな問題を見たらどう思いますか?(勝つか負けるか,2分の1だ!は間違いですよ~)当然,こう思うと思います「そらA君が誰使うかによるだろ」と.では,どんな場合があるでしょうか.リュウを使う場合,ケンを使う場合,ガイルを使う場合,春麗を使う場合….いろいろ考えられます.そして,ストⅡは2人同時に操作はできません(そのラウンドで1人のプレイヤーがリュウとケンと同時に操作し味方2人状態で戦うことはできません!).つまり同時に起こることはありませんから,これらの場合は互いに排反です.したがって,求める確率は
\[
\begin{align*}
P(\text{A君が勝つ})=&P(\text{A君が勝つ}\cap\text{リュウを使う})+P(\text{A君が勝つ}\cap\text{ケンを使う})\\
&+P(\text{A君が勝つ}\cap\text{エドモンド本田を使う})+P(\text{A君が勝つ}\cap\text{春麗を使う})\\
&+P(\text{A君が勝つ}\cap\text{ブランカを使う})+P(\text{A君が勝つ}\cap\text{ザンギエフを使う})\\
&+P(\text{A君が勝つ}\cap\text{ガイルを使う})+P(\text{A君が勝つ}\cap\text{ダルシムを使う})
\end{align*}
\]
「A君が勝つ」という事象を\(A\),「リュウを使う」という事象を\(B_1\),「ケンを使う」という事象を\(B_2\),「エドモンド本田を使う」という事象を\(B_3\),・・・,「ダルシムを使う」という事象を\(B_8\)とおくことにすれば,上の式は
\[
\begin{align*}
P(A)=&P(A\cap B_1)+P(A\cap B_2)+P(A\cap B_3)+P(A\cap B_4)\\
&+P(A\cap B_5)+P(A\cap B_6)+P(A\cap B_7)+P(A\cap B_8)\\
&=\displaystyle \sum^{8}_{i=1}P(A\cap B_i)
\end{align*}
\]すなわち\[P(A)=\displaystyle \sum^{8}_{i=1}P(A\cap B_i)\]と書けることがわかります.これを一般化すると,

全確率の定理\[P(A)=\displaystyle \sum^{\infty}_{i=1}P(A\cap B_i)\]

であると言えそうです.これを全確率の定理と呼びます.

ところで「ストリートファイター」ってゲーム自体今はどれくらい知名度あるんだろう?僕の時代は知らない人はいないくらいに流行っていました(スクリューパイルドライバーが出せたらまさにヒーロー).なので馴染みやすいかなと思って例に挙げましたが….調べると今はストリートファイター5まであるみたいですね.プレイアブルキャラは40人(!)らしいですから,この場合は\[P(A)=\displaystyle \sum^{40}_{i=1}P(A\cap B_i)\]ですね^^;

確率の乗法定理

条件付き確率の定義より,\[P(B|A)=\frac{P(B\cap A)}{P(A)}\]
両辺に\(P(A)\)を掛けることによって,\[P(A \cap B)=P(A)P(B|A)\]が得られます.(\(P(B \cap A)=P(A\cap B)\)としました)これを確率の乗法定理といいます.

確率の乗法定理(その1)\[P(A \cap B)=P(A)P(B|A)\]

日本語に翻訳すると「事象\(A\)と事象\(B\)が同時に起こる確率は,事象\(A\)の確率と,事象\(A\)の影響を受けた事象\(B\)の確率(条件付き確率)との積に等しい」ということで,少し確率の問題に慣れた人であればいつも無意識にやっている計算だと思います.例題で確認してみます.
当たりくじ3本を含む10本のくじの中から,引いたくじはもとに戻さないで,1本ずつ2回続けてくじを引く.2本とも当たる確率を求めよ.また,2回目が当たる確率いくらか.

1回目が当たるという事象を\(A\),2回目が当たるという事象を\(B\)とします.

2本とも当たる確率)
求める確率は\(P(A\cap B)\)です.確率の乗法定理より,\(P(A \cap B)=P(A)P(B|A)\)ですから,\(P(A)\)と\(P(B|A)\)を求めましょう.\(P(A)=\frac{3}{10}\)なのは問題ないでしょう.\(P(B|A)\)を求めます.これは「1回目が当たったという事実のもとで2回目が当たる確率」ですから,「引いたくじはもとに戻さない(当たりが1枚減る)」ことに注意せねばなりません.1回目に当たりを引けば,その後全体の枚数は9枚,当たりは2枚になりますから,\(P(B|A)=\frac{2}{9}\)です.したがって求める確率は\[P(A \cap B)=P(A)P(B|A)=\frac{3}{10}\cdot\frac{2}{9}=\frac{1}{15}\]となります.

2回目が当たる確率)
求める確率は\(P(B)\)です.まず気をつけて欲しいのは,求めようとしているのは確率\(P(B)\)であって確率\(P(B|A)\)ではない,ということ.すなわち,確率を求めようとしている今この時,まだ1回目は引いてもいない!何もしていない!ということです.まだなにもしていない,くじの前で黙って腕を組んだまま2回目を予想している(\(P(B)\)を求めようとしている)…そんなイメージです.1回目は引いてもいないし眼中にもありません.2回目だけを見つめています.以上に留意して,実際に\(P(B)\)を求めてみましょう.確率の定義に従います.2回目に起こりうるすべての場合の数は?2回目において,10枚のくじのどれが引きやすくどれが引きにくいなどということはありません(同様に確からしい).よって10通り.題意に適する場合の数は?当たり3枚のうちどれが引きやすくどれが引きにくいということはやはりありません.よって3通り.したがって求める確率は,\[P(B)=\frac{3}{10}\]となります.\(P(B|A)\neq P(B)\)であることに注目してください.

次の問題です.

当たりくじ3本を含む10本のくじの中から,1本ずつ2回続けてくじを引く.2本とも当たる確率を求めよ.ただし,引いたくじはもとに戻すものとする.また,2回目に当たる確率はいくらか.

2本とも当たる確率)
求める確率は\(P(A\cap B)\)です.確率の乗法定理より,\(P(A \cap B)=P(A)P(B|A)\)ですから,\(P(A)\)と\(P(B|A)\)を求めましょう.\(P(A)=\frac{3}{10}\)なのは問題ないでしょう.\(P(B|A)\)を求めます.これは「1回目が当たったという事実のもとで2回目が当たる確率」なわけですが,今回は引いたくじをもとに戻しています.ですから,2回目の状況は1回目の状況となんら変化がないことになります.したがって,\(P(B|A)=\frac{3}{10}\)となります.よって,求める確率は\[P(A \cap B)=P(A)P(B|A)=\frac{3}{10}\cdot\frac{3}{10}=\frac{9}{100}\]となります.

2回目が当たる確率)
求める確率は\(P(B)\)です.前問同様に考えます.2回目に起こりうるすべての場合の数は?2回目において10枚のくじのどれもが同様に確からしい.よって10通り.題意に適する場合の数は?当たり3枚のうちどれもがやはり同様に確からしい.よって3通り.したがって求める確率は,\[P(B)=\frac{3}{10}\]となります.前問と全く同じです.

さて,今回は\(P(B|A)\),\(P(B)\)はどちらも\(\frac{3}{10}\)ですから\(P(B|A)=P(B)\)です.この,\[P(B|A)=P(B)\]が成り立つとき,事象\(A\)と事象\(B\)は独立であるといいます.この式を「翻訳」すると,「\(B\)の確率は\(A\)が起きたかどうかなんて関係ない」と,すなわち「事象\(A\)と事象\(B\)が互いに影響を及ぼしていない」と読み取ることができます.

以上の準備のもと,次の定理が成り立ちます.

確率の乗法定理(その2)事象\(A\)と事象\(B\)が独立,すなわち\(P(B|A)=P(B)\)のとき\[P(A \cap B)=P(A)P(B)\]

高校教科書では上の話を,「2つの試行同士が互いに影響を与えない」ことを「独立」であると定義し,そのもとで確率の乗法定理(その2)を紹介しています.そしてこの話とは別の話題として(大分後になってから)「条件付き確率」から「確率の乗法定理(その2)」を導く,という順序で説明しています.なので,確率の乗法定理が2回(しかもそのあいだかなり間を挟んでから)登場することになり,それらにどのような関係があるのかがいまいち見えづらいのではないでしょうか.

しかし,上でみたように\[\text{条件付き確率の定義}\rightarrow\text{確率の乗法定理その1}\rightarrow\text{「独立」の定義}\rightarrow\text{確率の乗法定理その2}\]という流れで理解すると,高校教科書では「別々のもの」として載っている2つの確率の乗法定理が同じもの(その1を特殊化したものがその2)であることが明解で,論理的にはしっくりくると個人的に思います.

もっとも,実用上においては(実際問題を解く上では)どちらの理解でも大差はないと思いますが…

ベイズの定理

ベイズの定理\[P(B_i|A)=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P( B_j|A)}\quad(i=1,2,\cdots)\]

(証明)
\[
\begin{align*}
P(B_i|A)&=\frac{P(B_i\cap A)}{P(A)}&\cdots~(1)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A\cap B_j)}&\cdots~(2)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P(B_j|A)}&\cdots~(3)
\end{align*}
\]
\((1)\)は条件付き確率の定義そのものです.\((2)\)の分子は確率の乗法定理より,分母は全確率の定理によります.\((2)\)の分母に再び確率の乗法定理を用いると\((3)\)となります.(証明終)

この「ベイズの定理」は,証明の過程を見て貰えば分かる通り,条件付き確率の定義式確率の乗法定理全確率の定理を用いて変形したものに過ぎません.なので,この式は「根っこはあくまで条件付き確率の定義式だ」という認識のもと,あとは(その条件付き確率の定義式を)問題に応じて便宜変形する,というような使い方をすればよいと思います(つまり「条件付き確率」の定義を納得しており,「確率の乗法定理」と「全確率の定理」を知ってさえいればベイズの定理そのものを覚える必要はない,ということ).

このベイズの定理を用いて,次の問題を解いてみます.早稲田大の問題です.

ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し,表を見ないで箱の中にしまった.そして残りのカードをよくきってから3枚抜き出したところ,3枚ともダイヤであった.このとき箱の中のカードがダイヤである確率を求めよ.
(早稲田・文)

「抜き出された1枚がダイヤ」という事象を\(A\),「3枚ともダイヤ」という事象を\(B\)とおきます.すると,求める確率は\(P(A|B)\)と表せます.これをベイズの定理を用いて計算してみましょう.
\[
\begin{align*}
P(A|B)&=\frac{P(A\cap B)}{P(B)}\\
&=\frac{P(A)P(B|A)}{P(B\cap A)+P(B\cap \overline{A})}\\
&=\frac{P(A)P(B|A)}{P(A\cap B)+P(\overline{A}\cap B)}\\
&=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}\\
&=\frac{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}+\frac{{}_{39} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{13} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}\\
&=\frac{10}{49}
\end{align*}
\]
となります.

条件付き確率の直観的理解

条件付き確率の定義事象\(A\),事象\(B\)に対して,確率\[\frac{P(B\cap A)}{P(A)}\]を\(A\)が与えられたときの\(B\)の条件付き確率と呼び,\(P(B|A)\)と書く.

この定義をみても,正直しっくりこないという人は多いと思います.今回はこの条件付き確率の定義の直観的理解を目指してみようと思います.

まず,次の問題を考えてみましょう.

問題
100人の生徒に,次の2つの質問をした.「さんまの内臓を食べるか食べないか」「エビフライのしっぽは食べるか食べないか」.すると,次のような結果を得た.この100人の中から,1人を選び出す.このとき,次の問いに答えよ.

    1. 選び出された生徒が,サンマの内臓を食べる確率
    2. 選び出された生徒が,エビフライのしっぽを食べる確率
    3. 選び出された生徒が,サンマの内臓もエビフライのしっぽも食べる確率
    4. 選び出された生徒が,サンマの内臓は食べるが,エビフライのしっぽは食べない確率
    5. 選び出された生徒が「自分はサンマの内臓は食べますよ~」と発言した.このとき,その生徒がエビフライのしっぽも食べる確率

(解答)

    1. 表をみると全生徒\(100\)人の中でサンマの内臓を食べる人数は\(45\)人ですから,求める確率は\(\frac{45}{100}\)
    2. 表を見ると全生徒\(100\)人の中でエビフライの尻尾を食べる人数は\(67\)人ですから,求める確率は\(\frac{67}{100}\)
    3. 表を見ると全生徒\(100\)人の中でサンマの内臓もエビフライの尻尾も食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{100}\)
    4. 表を見ると全生徒\(100\)人の中でサンマの内臓は食べるが,エビフライの尻尾は食べない人数は\(10\)人ですから,求める確率は\(\frac{10}{100}\)

…と簡単に求められると思います.ここまでウォーミングアップ.問題は5.です.

実際に想像してみましょう.自分の目の前に一人生徒が来た.この生徒がエビフライの尻尾を食べるかどうかを予測したい.そこで,確率を求めようと表を眺めます.この時点では選び出されたその生徒がエビフライの尻尾を食べる確率は\(\frac{67}{100}\)です.図で視覚化すると,

という感じでしょうか.この時点では確率は2.とおんなじです.

しかしここで!その生徒が「自分はサンマの内臓は食べますよ~美味しいですよね~」と喋り,我々がその発言を聞いてしまったとしましょう.すると状況は一変してしまいます.なぜなら,目の前にいる生徒が「サンマの内臓を食べない」という可能性がなくなるから,図中の内臓を食べない(内臓×)という部分が消え失せ,結果として図が下のように変化してしまう(縮んでしまう)からです.

「サンマの内臓を食べる」という発言を聞いてしまった以上,この右側の縮んでしまった図のもとで確率を考え直さねばなりません:全体の人数が\(35+10=45\)で,そのうち尻尾を食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{45}\left(=\frac{7}{9}\right)\)となります.図で視覚化すると,以下のようになります.

このように,「情報が入ることで,図(全事象)が縮む」というのが理解のポイントです.

ではいよいよ上の話を数式に翻訳してみましょう.
題意の確率「『(選び出された生徒が)内臓を食べる』という情報を耳にしたとき,その生徒が尻尾も食べる確率」を\[P(\text{尻尾}|\text{内臓})\]と書くことにしましょう.この確率は,上の議論により
\[
\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}
\]
と書けることになります(下図参照).

したがって,\[P(\text{尻尾}|\text{内臓})=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\]
さらに,分母分子を全体の人数\(n(\text{全体})(=100)\)で割ると
\[
\begin{align*}
P(\text{尻尾}|\text{内臓})&=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\\
&=\frac{\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{全体})}}{\frac{n(\text{内臓})}{n(\text{全体})}}=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\end{align*}
\]
となります.したがって,
\[
P(\text{尻尾}|\text{内臓})=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\]
と書けます.さらに,「内臓(内臓を食べる)」という事象を\(A\),「尻尾(尻尾を食べる)」という事象を\(B\)とおけば
\[
P(B|A)=\frac{P(B\cap A)}{P(A)}
\]
となり最初の定義式を得ます.

以上をまとめると,条件付き確率の定義式の直観的イメージは次のようだといえそうです:

    • 情報が入ったことで,全事象が縮んでしまう(事象\(\overline{A}\)が消え,事象\(A\)だけ残る).
    • 縮んだあとの事象\(A\)のもとでの確率を考えることになるから,分母には\(P(A)\)がくる.
    • 分子には,事象\(\overline{A}\)が消えてしまい事象\(A\)だけに縮んでしまった,そのもとでの事象\(B\),すなわち事象\(B\cap A\)の確率\(P(B\cap A)\)がくる.

定義式\(P(B|A)=\frac{P(B\cap A)}{P(A)}\)は上の図のイメージ,すなわち「全事象が縮んだあとの確率計算」という認識をもっておくことが直観的理解のコツ,ということです.

ちなみに,\(P(B|A)\)は高校教科書では\(P_A(B)\)と表現していることに注意してください.どちらも同じ意味で,正しい記法です.が,個人的には\(P(B|A)\)の方をおすすめします.記述の際に書きやすいし,何より気持ち的に\(A\)が\(B\)の『後側』にあることから「\(A\)が\(B\)『背景』にあるんだよ」というニュアンスが伝わりやすいからです.

モンティ・ホール問題

みんな大好きモンティ・ホール問題.

プレーヤーの前に閉じた3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。ここでプレーヤーはドアを変更すべきだろうか?

この有名な問題にはいろいろな考え方があるようですが,ここでは条件付き確率の問題とみて(ベイズの定理を使って)考えてみましょう!

与えられた3つのドアにA,B,Cと名前をつけます.

まず「プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる」とあるので,ここではプレーヤーが部屋Aを選び,モンティが部屋Bのドアを開けたとしましょう.

ここで,プレーヤーに選択権が与えられるわけです.最初の選択(部屋A)を変えずにいるか,それとも部屋Cに選択を変えるか.選び方によって確率は変わるのか,変わらないのか.変わるのであれば,どちらを選択するのが賢明か…?

計算してみましょう.モンティが部屋\(B\)を開けるという事象を「\(B\text{開}\)」,実際に部屋\(X\)に車があるという事象を「\(X\text{車}\)」と書くことにします.

まず,部屋を変えない場合

求めたい確率は「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Aに車がある確率」ですから,\(P(A\text{車}|B\text{開})\)となります.計算してみましょう.

\[
\begin{align*}
P(A\text{車}|B\text{開})&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開})}&\cdots(1)\\
&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}&\cdots(2)\\
&=\frac{\frac{1}{2}}{\frac{1}{2}+1}&\cdots(3)\\
&=\frac{1}{3}
\end{align*}
\]

\((1)\)は条件付き確率の定義そのものです.

\((2)\)の分母について:\(B\text{開}\)という状況,すなわち「モンティが部屋\(B\)を開ける」という状況を詳しく見ると次の3通りが考えられます

      • 車が部屋\(A\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(C\)にあって,モンティが部屋\(B\)を開ける

このうち真ん中「車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける」はありえません(モンティはヤギの部屋を開けるわけですから).したがって\[P(B\text{開})=P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})\]となります(全確率の定理).

\((3)\)で\(P(A\text{車}\cap B\text{開})=\frac{1}{2}\)である理由:まず,プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられません.そして今車は部屋\(A\)にありますから,部屋\(B\)と部屋\(C\)にはヤギがいることになります.つまりモンティには部屋\(B\)を開けるか,部屋\(C\)を開けるか2つの選択肢があります.したがって確率は\(\frac{1}{2}\)となります.

\((3)\)で\(P(B\text{開}\cap C\text{車})=1\)である理由:プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられず,また部屋\(C\)には実際に車があるのでモンティは部屋\(C\)も開けられません.所以,モンティが開けられるのは部屋\(B\)しかありません.したがって確率は1となります.

以上に気を付けて計算すると確率は\(\dfrac{1}{3}\)になります.

次に,部屋を変える場合

求めたい確率は,「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Cに車がある確率」ですから,\(P(C\text{車}|B\text{開})\)となります.同じように計算してみましょう.

\[
\begin{align*}
P(C\text{車}|B\text{開})&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開})}\\
&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}\\
&=\frac{1}{\frac{1}{2}+1}=\frac{2}{3}
\end{align*}
\]

よって確率は\(\dfrac{2}{3}\)となります.

結局,部屋を変えたほうがよい(当たる確率が倍になる!)ことが分かります!

ここで用いた考え方は「ベイズの定理」と呼ばれます.このベイズの定理を使うと,とくに難しい局面もないままに単純な計算のもと欲しい確率が手に入ってしまいます.

 

 

部分積分の公式

部分積分法\[\int f(x)g(x)dx=F(x)g(x)-\int F(x)g'(x) dx\]

(証明)

積の微分法より\[(F(x)g(x))’=f(x)g(x)+F(x)g'(x)\]
この式は「微分して\(f(x)g(x)+F(x)g'(x)\)になるような関数が,\(F(x)g(x)\)」ということですから,不定積分が原始関数を表すことを思い出すと\[F(x)g(x)=\int \big( f(x)g(x)+F(x)g'(x) \big)dx\]と書けます.不定積分の線形性より,
\[F(x)g(x)=\int f(x)g(x)dx+\int F(x)g'(x) dx\]
移項すると,\[\int f(x)g(x)dx=F(x)g(x)-\int F(x)g'(x) dx\](証明終)

教科書等だと部分積分の公式は\[\int f'(x)g(x)dx=f(x)g(x)-\int f(x)g'(x) dx\]などと書かれていることが多いので,「まず被積分関数(の一部)を\(f'(x)\)の形にしてから公式を適用する」と認識されがちですが,その使い方はちょっと面倒だと思います.そうではなく,上のように\[\int f(x)g(x)dx=F(x)g(x)-\int F(x)g'(x) dx\]と認識しておけば,結局「片方\(f(x)\)の原始関数(の1つ)を求めて,もう片方\(g(x)\)を微分する」と読め,やるべきことが明解です.もちろん,やっていることは同じなんですがこんな地味なレベルでの認識の違いで覚えやすさ,計算のスピードが変わってくるので意外と大事です.

覚え方:代ゼミの荻野暢也先生の言葉をお借りすれば…「片方積分して,放っておかれたほう微分して引く積分」です!(僕はこの荻野先生の覚え方で覚えました^^;.部分積分するときは未だにこれを頭の中で唱えながら部分積分しています.おすすめです)

ベータ関数と\(\frac{(\beta-\alpha)^3}{6}\)公式

天下りですが以下のような\(2\)変数関数\(B(p,~q)\)を定義します.

ベータ関数\[\displaystyle B(p,~q):=\int^1_0x^{p-1}(1-x)^{q-1}dx\]

(「\(:=\)」は「左辺を右辺で定義する」という意味です.)
この関数をベータ関数と呼びます.こいつを計算してみましょう.

直接的に求まりそうにないので,部分積分してみます(\(x^{p-1}\)を積分側,\((1-x)^{q-1}\)を微分側にしましょう).すると,

\[\displaystyle
\begin{align*}
&\int^1_0 x^{p-1}(1-x)^{q-1}dx\\
=&\biggl[\frac{x^p}{p}(1-x)^{q-1}\biggl]^1_0+\int^1_0\frac{x^p}{p}(q-1)(1-x)^{q-2}dx\\
=&\frac{q-1}{p}\int^1_0x^p(1-x)^{q-2}dx\\
=&\frac{q-1}{p}B(p+1,~q-1)
\end{align*}
\]
より,
\[B(p,~q)=\frac{q-1}{p}B(p+1,~q-1)\]という漸化式を得ます.この漸化式から,
\[
\begin{align*}
&B(p,~q)=\frac{q-1}{p}B(p+1,~q-1)\\
&B(p+1,~q-1)=\frac{q-2}{p+1}B(p+2,~q-2)\\
&B(p+2,~q-2)=\frac{q-3}{p+2}B(p+3,~q-3)\\
&B(p+3,~q-3)=\frac{q-4}{p+3}B(p+4,~q-4)\\
&\hspace{40mm}\vdots
\end{align*}
\]

が得られますが,例えば上の四つの式から,

\[B(p,~q)=\frac{q-1}{p}\frac{q-2}{p+1}\frac{q-3}{p+2}\frac{q-4}{p+3}B(p+4,~q-4)\]

が得られますので,この調子で続ければ\(B(\text{☆},\text{★})\)の\(\text{★}\)がどんどん小さくなり,うまく計算が出来そうです.

では,★はどこまで下げましょうか?\(B(\text{☆},\text{★})\)の定義をみると,★は1であると計算しやすいですね.なぜなら\((1-x)^{q-1}\)が\(0\)乗で1になってくれますから.

\(B(\text{☆},\text{★})\)の\(\text{★}\)が1になるまで下げてみます.

\[
\begin{align*}
&B(p,~q)=\frac{q-1}{p}B(p+1,~q-1)\\
&B(p+1,~q-1)=\frac{q-2}{p+1}B(p+2,~q-2)\\
&B(p+2,~q-2)=\frac{q-3}{p+2}B(p+3,~q-3)\\
&B(p+3,~q-3)=\frac{q-4}{p+3}B(p+4,~q-4)\\
&\hspace{40mm}\vdots\\
&B(p+(q-2),~q-(q-2))=\frac{q-(q-1)}{p+(q-2)}B(p+(q-1),~q-(q-1))
\end{align*}
\]
(4行目の\(\displaystyle B(p+3,~q-3)=\frac{q-4}{p+3}B(p+4,~q-4)\)の「\(4\)」を「\(q-1\)」に,「\(3\)」を「\(q-2\)」に置き換えるイメージ!)

したがって,

\[
\begin{align*}
B(p,~q)&=\frac{q-1}{p}\frac{q-2}{p+1}\frac{q-3}{p+2}\frac{q-4}{p+3}~\cdots~\frac{q-(q-1)}{p+(q-2)}B(p+(q-1),~q-(q-1)\\
&=\frac{q-1}{p}\frac{q-2}{p+1}\frac{q-3}{p+2}\frac{q-4}{p+3}~\cdots~\frac{1}{p+q-2}B(p+q-1,~1)\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}B(p+q-1,~1)\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}\int^1_0x^{p+q-2}(1-x)^0dx\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}\int^1_0x^{p+q-2}dx\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}\biggl[\frac{x^{p+q-1}}{p+q-1}\bigg]^1_0\\
&=\frac{(p-1)!(q-1)!}{(p+q-1)!}
\end{align*}
\]

できました.\(\displaystyle B(p,~q)=\frac{(p-1)!(q-1)!}{(p+q-1)!}\).定義より\(\displaystyle B(p,~q)=\int^1_0x^{p-1}(1-x)^{q-1}dx\)でしたから,結局,

\[\displaystyle \int^1_0x^{p-1}(1-x)^{q-1}dx=\frac{(p-1)!(q-1)!}{(p+q-1)!}\]

が得られたことになります.

さて次に,\(\displaystyle \int^1_0x^{p-1}(1-x)^{q-1}dx\)の積分区間\([0,~1]\)が,\([\alpha,~\beta]\)となるような置換を考えてみましょう.すなわち右のような置換です(新たな変数\(t\)としました).この場合,どのように置換すればよいでしょうか?\(t\)が\(\alpha\)のとき\(x\)が\(0\)ですから,さしあたり\[x=t-\alpha\]という置換が思い浮かびます.しかし,\(t=\beta\)のとき\(x\)は\(\beta-\alpha\)ではなく\(1\)であってほしい.であれば,\(t-\alpha\)を\(\beta-\alpha\)で割ればいいのでは?と考え,\[\displaystyle x=\frac{t-\alpha}{\beta-\alpha}\]という置換に気付きます.置換してみましょう.\(\displaystyle dx=\frac{1}{\beta-\alpha}dt\)ですから,

\[
\begin{align*}
\displaystyle \int^1_0x^{p-1}(1-x)^{q-1}dx&=\int^{\beta}_{\alpha}\left(\frac{t-\alpha}{\beta-\alpha}\right)^{p-1}\left(1-\frac{t-\alpha}{\beta-\alpha}\right)^{q-1}\frac{1}{\beta-\alpha}dt\\
&=\frac{1}{(\beta-\alpha)^{p+q-1}}\int^{\beta}_{\alpha}(t-\alpha)^{p-1}(\beta-t)^{q-1}dt
\end{align*}
\]

ゆえに,

\[\displaystyle \frac{1}{(\beta-\alpha)^{p+q-1}}\int^{\beta}_{\alpha}(x-\alpha)^{p-1}(\beta-x)^{q-1}dx=\frac{(p-1)!(q-1)!}{(p+q-1)!}\]

すなわち,

\[\displaystyle \int^{\beta}_{\alpha}(x-\alpha)^{p-1}(\beta-x)^{q-1}dx=\frac{(p-1)!(q-1)!}{(p+q-1)!}(\beta-\alpha)^{p+q-1}\]

が得られたことになります(ダミー変数を\(t\)から見慣れた\(x\)に変えました).

…で,結局何がいいたいの??というと…

この式の\((p,~q)\)に例えば\((2,~2),~(2,~3)\)と代入してみてください.前者は
\[\displaystyle \int^{\beta}_{\alpha}(x-\alpha)(\beta-x)dx=\frac{1}{6}(\beta-\alpha)^3\]

後者は
\[\displaystyle \int^{\beta}_{\alpha}(x-\alpha)(\beta-x)^2dx=\frac{1}{12}(\beta-\alpha)^4\]
となり,例の有名公式が得られます.つまり,数学Ⅱで学ぶ例の有名公式は,実はベータ関数の特殊な場合でもあった,ということがわかります.

このベータ関数は大学の微分積分学で学ぶかと思いますが,実は今回のこの記事の内容自体が大学入試問題として出題されたこともあります.実際,上の解説を見て分かるように導出には部分積分,漸化式,置換積分と高校数学範囲の知識しか使っていません.

© 2024 佐々木数学塾, All rights reserved.