ベイズの定理

ベイズの定理\[P(B_i|A)=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P( B_j|A)}\quad(i=1,2,\cdots)\]

(証明)
\[
\begin{align*}
P(B_i|A)&=\frac{P(B_i\cap A)}{P(A)}&\cdots~(1)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A\cap B_j)}&\cdots~(2)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P(B_j|A)}&\cdots~(3)
\end{align*}
\]
\((1)\)は条件付き確率の定義そのものです.\((2)\)の分子は確率の乗法定理より,分母は全確率の定理によります.\((2)\)の分母に再び確率の乗法定理を用いると\((3)\)となります.(証明終)

この「ベイズの定理」は,証明の過程を見て貰えば分かる通り,条件付き確率の定義式確率の乗法定理全確率の定理を用いて変形したものに過ぎません.なので,この式は「根っこはあくまで条件付き確率の定義式だ」という認識のもと,あとは(その条件付き確率の定義式を)問題に応じて便宜変形する,というような使い方をすればよいと思います(つまり「条件付き確率」の定義を納得しており,「確率の乗法定理」と「全確率の定理」を知ってさえいればベイズの定理そのものを覚える必要はない,ということ).

このベイズの定理を用いて,次の問題を解いてみます.早稲田大の問題です.

ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し,表を見ないで箱の中にしまった.そして残りのカードをよくきってから3枚抜き出したところ,3枚ともダイヤであった.このとき箱の中のカードがダイヤである確率を求めよ.
(早稲田・文)

「抜き出された1枚がダイヤ」という事象を\(A\),「3枚ともダイヤ」という事象を\(B\)とおきます.すると,求める確率は\(P(A|B)\)と表せます.これをベイズの定理を用いて計算してみましょう.
\[
\begin{align*}
P(A|B)&=\frac{P(A\cap B)}{P(B)}\\
&=\frac{P(A)P(B|A)}{P(B\cap A)+P(B\cap \overline{A})}\\
&=\frac{P(A)P(B|A)}{P(A\cap B)+P(\overline{A}\cap B)}\\
&=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}\\
&=\frac{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}+\frac{{}_{39} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{13} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}\\
&=\frac{10}{49}
\end{align*}
\]
となります.

条件付き確率の直観的理解

条件付き確率の定義事象\(A\),事象\(B\)に対して,確率\[\frac{P(B\cap A)}{P(A)}\]を\(A\)が与えられたときの\(B\)の条件付き確率と呼び,\(P(B|A)\)と書く.

この定義をみても,正直しっくりこないという人は多いと思います.今回はこの条件付き確率の定義の直観的理解を目指してみようと思います.

まず,次の問題を考えてみましょう.

問題
100人の生徒に,次の2つの質問をした.「さんまの内臓を食べるか食べないか」「エビフライのしっぽは食べるか食べないか」.すると,次のような結果を得た.この100人の中から,1人を選び出す.このとき,次の問いに答えよ.

    1. 選び出された生徒が,サンマの内臓を食べる確率
    2. 選び出された生徒が,エビフライのしっぽを食べる確率
    3. 選び出された生徒が,サンマの内臓もエビフライのしっぽも食べる確率
    4. 選び出された生徒が,サンマの内臓は食べるが,エビフライのしっぽは食べない確率
    5. 選び出された生徒が「自分はサンマの内臓は食べますよ~」と発言した.このとき,その生徒がエビフライのしっぽも食べる確率

(解答)

    1. 表をみると全生徒\(100\)人の中でサンマの内臓を食べる人数は\(45\)人ですから,求める確率は\(\frac{45}{100}\)
    2. 表を見ると全生徒\(100\)人の中でエビフライの尻尾を食べる人数は\(67\)人ですから,求める確率は\(\frac{67}{100}\)
    3. 表を見ると全生徒\(100\)人の中でサンマの内臓もエビフライの尻尾も食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{100}\)
    4. 表を見ると全生徒\(100\)人の中でサンマの内臓は食べるが,エビフライの尻尾は食べない人数は\(10\)人ですから,求める確率は\(\frac{10}{100}\)

…と簡単に求められると思います.ここまでウォーミングアップ.問題は5.です.

実際に想像してみましょう.自分の目の前に一人生徒が来た.この生徒がエビフライの尻尾を食べるかどうかを予測したい.そこで,確率を求めようと表を眺めます.この時点では選び出されたその生徒がエビフライの尻尾を食べる確率は\(\frac{67}{100}\)です.図で視覚化すると,

という感じでしょうか.この時点では確率は2.とおんなじです.

しかしここで!その生徒が「自分はサンマの内臓は食べますよ~美味しいですよね~」と喋り,我々がその発言を聞いてしまったとしましょう.すると状況は一変してしまいます.なぜなら,目の前にいる生徒が「サンマの内臓を食べない」という可能性がなくなるから,図中の内臓を食べない(内臓×)という部分が消え失せ,結果として図が下のように変化してしまう(縮んでしまう)からです.

「サンマの内臓を食べる」という発言を聞いてしまった以上,この右側の縮んでしまった図のもとで確率を考え直さねばなりません:全体の人数が\(35+10=45\)で,そのうち尻尾を食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{45}\left(=\frac{7}{9}\right)\)となります.図で視覚化すると,以下のようになります.

このように,「情報が入ることで,図(全事象)が縮む」というのが理解のポイントです.

ではいよいよ上の話を数式に翻訳してみましょう.
題意の確率「『(選び出された生徒が)内臓を食べる』という情報を耳にしたとき,その生徒が尻尾も食べる確率」を\[P(\text{尻尾}|\text{内臓})\]と書くことにしましょう.この確率は,上の議論により
\[
\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}
\]
と書けることになります(下図参照).

したがって,\[P(\text{尻尾}|\text{内臓})=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\]
さらに,分母分子を全体の人数\(n(\text{全体})(=100)\)で割ると
\[
\begin{align*}
P(\text{尻尾}|\text{内臓})&=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\\
&=\frac{\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{全体})}}{\frac{n(\text{内臓})}{n(\text{全体})}}=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\end{align*}
\]
となります.したがって,
\[
P(\text{尻尾}|\text{内臓})=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\]
と書けます.さらに,「内臓(内臓を食べる)」という事象を\(A\),「尻尾(尻尾を食べる)」という事象を\(B\)とおけば
\[
P(B|A)=\frac{P(B\cap A)}{P(A)}
\]
となり最初の定義式を得ます.

以上をまとめると,条件付き確率の定義式の直観的イメージは次のようだといえそうです:

    • 情報が入ったことで,全事象が縮んでしまう(事象\(\overline{A}\)が消え,事象\(A\)だけ残る).
    • 縮んだあとの事象\(A\)のもとでの確率を考えることになるから,分母には\(P(A)\)がくる.
    • 分子には,事象\(\overline{A}\)が消えてしまい事象\(A\)だけに縮んでしまった,そのもとでの事象\(B\),すなわち事象\(B\cap A\)の確率\(P(B\cap A)\)がくる.

定義式\(P(B|A)=\frac{P(B\cap A)}{P(A)}\)は上の図のイメージ,すなわち「全事象が縮んだあとの確率計算」という認識をもっておくことが直観的理解のコツ,ということです.

ちなみに,\(P(B|A)\)は高校教科書では\(P_A(B)\)と表現していることに注意してください.どちらも同じ意味で,正しい記法です.が,個人的には\(P(B|A)\)の方をおすすめします.記述の際に書きやすいし,何より気持ち的に\(A\)が\(B\)の『後側』にあることから「\(A\)が\(B\)『背景』にあるんだよ」というニュアンスが伝わりやすいからです.

モンティ・ホール問題

みんな大好きモンティ・ホール問題.

プレーヤーの前に閉じた3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。ここでプレーヤーはドアを変更すべきだろうか?

この有名な問題にはいろいろな考え方があるようですが,ここでは条件付き確率の問題とみて(ベイズの定理を使って)考えてみましょう!

与えられた3つのドアにA,B,Cと名前をつけます.

まず「プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる」とあるので,ここではプレーヤーが部屋Aを選び,モンティが部屋Bのドアを開けたとしましょう.

ここで,プレーヤーに選択権が与えられるわけです.最初の選択(部屋A)を変えずにいるか,それとも部屋Cに選択を変えるか.選び方によって確率は変わるのか,変わらないのか.変わるのであれば,どちらを選択するのが賢明か…?

計算してみましょう.モンティが部屋\(B\)を開けるという事象を「\(B\text{開}\)」,実際に部屋\(X\)に車があるという事象を「\(X\text{車}\)」と書くことにします.

まず,部屋を変えない場合

求めたい確率は「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Aに車がある確率」ですから,\(P(A\text{車}|B\text{開})\)となります.計算してみましょう.

\[
\begin{align*}
P(A\text{車}|B\text{開})&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開})}&\cdots(1)\\
&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}&\cdots(2)\\
&=\frac{\frac{1}{2}}{\frac{1}{2}+1}&\cdots(3)\\
&=\frac{1}{3}
\end{align*}
\]

\((1)\)は条件付き確率の定義そのものです.

\((2)\)の分母について:\(B\text{開}\)という状況,すなわち「モンティが部屋\(B\)を開ける」という状況を詳しく見ると次の3通りが考えられます

      • 車が部屋\(A\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(C\)にあって,モンティが部屋\(B\)を開ける

このうち真ん中「車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける」はありえません(モンティはヤギの部屋を開けるわけですから).したがって\[P(B\text{開})=P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})\]となります(全確率の定理).

\((3)\)で\(P(A\text{車}\cap B\text{開})=\frac{1}{2}\)である理由:まず,プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられません.そして今車は部屋\(A\)にありますから,部屋\(B\)と部屋\(C\)にはヤギがいることになります.つまりモンティには部屋\(B\)を開けるか,部屋\(C\)を開けるか2つの選択肢があります.したがって確率は\(\frac{1}{2}\)となります.

\((3)\)で\(P(B\text{開}\cap C\text{車})=1\)である理由:プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられず,また部屋\(C\)には実際に車があるのでモンティは部屋\(C\)も開けられません.所以,モンティが開けられるのは部屋\(B\)しかありません.したがって確率は1となります.

以上に気を付けて計算すると確率は\(\dfrac{1}{3}\)になります.

次に,部屋を変える場合

求めたい確率は,「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Cに車がある確率」ですから,\(P(C\text{車}|B\text{開})\)となります.同じように計算してみましょう.

\[
\begin{align*}
P(C\text{車}|B\text{開})&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開})}\\
&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}\\
&=\frac{1}{\frac{1}{2}+1}=\frac{2}{3}
\end{align*}
\]

よって確率は\(\dfrac{2}{3}\)となります.

結局,部屋を変えたほうがよい(当たる確率が倍になる!)ことが分かります!

ここで用いた考え方は「ベイズの定理」と呼ばれます.このベイズの定理を使うと,とくに難しい局面もないままに単純な計算のもと欲しい確率が手に入ってしまいます.

 

 

ベータ関数と\(\frac{(\beta-\alpha)^3}{6}\)公式

天下りですが以下のような\(2\)変数関数\(B(p,~q)\)を定義します.

ベータ関数\[\displaystyle B(p,~q):=\int^1_0x^{p-1}(1-x)^{q-1}dx\]

(「\(:=\)」は「左辺を右辺で定義する」という意味です.)
この関数をベータ関数と呼びます.こいつを計算してみましょう.

直接的に求まりそうにないので,部分積分してみます(\(x^{p-1}\)を積分側,\((1-x)^{q-1}\)を微分側にしましょう).すると,

\[\displaystyle
\begin{align*}
&\int^1_0 x^{p-1}(1-x)^{q-1}dx\\
=&\biggl[\frac{x^p}{p}(1-x)^{q-1}\biggl]^1_0+\int^1_0\frac{x^p}{p}(q-1)(1-x)^{q-2}dx\\
=&\frac{q-1}{p}\int^1_0x^p(1-x)^{q-2}dx\\
=&\frac{q-1}{p}B(p+1,~q-1)
\end{align*}
\]
より,
\[B(p,~q)=\frac{q-1}{p}B(p+1,~q-1)\]という漸化式を得ます.この漸化式から,
\[
\begin{align*}
&B(p,~q)=\frac{q-1}{p}B(p+1,~q-1)\\
&B(p+1,~q-1)=\frac{q-2}{p+1}B(p+2,~q-2)\\
&B(p+2,~q-2)=\frac{q-3}{p+2}B(p+3,~q-3)\\
&B(p+3,~q-3)=\frac{q-4}{p+3}B(p+4,~q-4)\\
&\hspace{40mm}\vdots
\end{align*}
\]

が得られますが,例えば上の四つの式から,

\[B(p,~q)=\frac{q-1}{p}\frac{q-2}{p+1}\frac{q-3}{p+2}\frac{q-4}{p+3}B(p+4,~q-4)\]

が得られますので,この調子で続ければ\(B(\text{☆},\text{★})\)の\(\text{★}\)がどんどん小さくなり,うまく計算が出来そうです.

では,★はどこまで下げましょうか?\(B(\text{☆},\text{★})\)の定義をみると,★は1であると計算しやすいですね.なぜなら\((1-x)^{q-1}\)が\(0\)乗で1になってくれますから.

\(B(\text{☆},\text{★})\)の\(\text{★}\)が1になるまで下げてみます.

\[
\begin{align*}
&B(p,~q)=\frac{q-1}{p}B(p+1,~q-1)\\
&B(p+1,~q-1)=\frac{q-2}{p+1}B(p+2,~q-2)\\
&B(p+2,~q-2)=\frac{q-3}{p+2}B(p+3,~q-3)\\
&B(p+3,~q-3)=\frac{q-4}{p+3}B(p+4,~q-4)\\
&\hspace{40mm}\vdots\\
&B(p+(q-2),~q-(q-2))=\frac{q-(q-1)}{p+(q-2)}B(p+(q-1),~q-(q-1))
\end{align*}
\]
(4行目の\(\displaystyle B(p+3,~q-3)=\frac{q-4}{p+3}B(p+4,~q-4)\)の「\(4\)」を「\(q-1\)」に,「\(3\)」を「\(q-2\)」に置き換えるイメージ!)

したがって,

\[
\begin{align*}
B(p,~q)&=\frac{q-1}{p}\frac{q-2}{p+1}\frac{q-3}{p+2}\frac{q-4}{p+3}~\cdots~\frac{q-(q-1)}{p+(q-2)}B(p+(q-1),~q-(q-1)\\
&=\frac{q-1}{p}\frac{q-2}{p+1}\frac{q-3}{p+2}\frac{q-4}{p+3}~\cdots~\frac{1}{p+q-2}B(p+q-1,~1)\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}B(p+q-1,~1)\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}\int^1_0x^{p+q-2}(1-x)^0dx\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}\int^1_0x^{p+q-2}dx\\
&=\frac{(p-1)!(q-1)!}{(p+q-2)!}\biggl[\frac{x^{p+q-1}}{p+q-1}\bigg]^1_0\\
&=\frac{(p-1)!(q-1)!}{(p+q-1)!}
\end{align*}
\]

できました.\(\displaystyle B(p,~q)=\frac{(p-1)!(q-1)!}{(p+q-1)!}\).定義より\(\displaystyle B(p,~q)=\int^1_0x^{p-1}(1-x)^{q-1}dx\)でしたから,結局,

\[\displaystyle \int^1_0x^{p-1}(1-x)^{q-1}dx=\frac{(p-1)!(q-1)!}{(p+q-1)!}\]

が得られたことになります.

さて次に,\(\displaystyle \int^1_0x^{p-1}(1-x)^{q-1}dx\)の積分区間\([0,~1]\)が,\([\alpha,~\beta]\)となるような置換を考えてみましょう.すなわち右のような置換です(新たな変数\(t\)としました).この場合,どのように置換すればよいでしょうか?\(t\)が\(\alpha\)のとき\(x\)が\(0\)ですから,さしあたり\[x=t-\alpha\]という置換が思い浮かびます.しかし,\(t=\beta\)のとき\(x\)は\(\beta-\alpha\)ではなく\(1\)であってほしい.であれば,\(t-\alpha\)を\(\beta-\alpha\)で割ればいいのでは?と考え,\[\displaystyle x=\frac{t-\alpha}{\beta-\alpha}\]という置換に気付きます.置換してみましょう.\(\displaystyle dx=\frac{1}{\beta-\alpha}dt\)ですから,

\[
\begin{align*}
\displaystyle \int^1_0x^{p-1}(1-x)^{q-1}dx&=\int^{\beta}_{\alpha}\left(\frac{t-\alpha}{\beta-\alpha}\right)^{p-1}\left(1-\frac{t-\alpha}{\beta-\alpha}\right)^{q-1}\frac{1}{\beta-\alpha}dt\\
&=\frac{1}{(\beta-\alpha)^{p+q-1}}\int^{\beta}_{\alpha}(t-\alpha)^{p-1}(\beta-t)^{q-1}dt
\end{align*}
\]

ゆえに,

\[\displaystyle \frac{1}{(\beta-\alpha)^{p+q-1}}\int^{\beta}_{\alpha}(x-\alpha)^{p-1}(\beta-x)^{q-1}dx=\frac{(p-1)!(q-1)!}{(p+q-1)!}\]

すなわち,

\[\displaystyle \int^{\beta}_{\alpha}(x-\alpha)^{p-1}(\beta-x)^{q-1}dx=\frac{(p-1)!(q-1)!}{(p+q-1)!}(\beta-\alpha)^{p+q-1}\]

が得られたことになります(ダミー変数を\(t\)から見慣れた\(x\)に変えました).

…で,結局何がいいたいの??というと…

この式の\((p,~q)\)に例えば\((2,~2),~(2,~3)\)と代入してみてください.前者は
\[\displaystyle \int^{\beta}_{\alpha}(x-\alpha)(\beta-x)dx=\frac{1}{6}(\beta-\alpha)^3\]

後者は
\[\displaystyle \int^{\beta}_{\alpha}(x-\alpha)(\beta-x)^2dx=\frac{1}{12}(\beta-\alpha)^4\]
となり,例の有名公式が得られます.つまり,数学Ⅱで学ぶ例の有名公式は,実はベータ関数の特殊な場合でもあった,ということがわかります.

このベータ関数は大学の微分積分学で学ぶかと思いますが,実は今回のこの記事の内容自体が大学入試問題として出題されたこともあります.実際,上の解説を見て分かるように導出には部分積分,漸化式,置換積分と高校数学範囲の知識しか使っていません.

命題(条件)の分配法則

命題や条件は,分配することができます.すなわち,
\[(p\lor q)\land r \Longleftrightarrow (p \land r)\lor (q \land r)\]や\[(p\land q)\lor r \Longleftrightarrow (p \lor r)\land (q \lor r)\]などが成り立ちます.

証明

真理表で確認します.
まず,\(p,~q,~r\)の真偽は\(2^3=8\)通りあることに注意して,

と書けます.見やすさのためにFを赤色にしました.
次に\(p\lor q\)を書き,その列を埋めましょう.\(p\)の列と\(q\)の列に着目して,\(\lor\)の定義に従うと,

と書けます.次に\((p\lor q)\land r\)を書き,その列を埋めます.\(p\lor q\)と\(r\)の列に着目して,\(\land\)の定義に従うと,

と書けます.
今度は\( (p \land r)\lor (q \land r)\)について調べます.そのためにはまず\((p \land r)\)と\((q \land r)\)を調べなくてはなりません.なのでまず,\(p\lor r\)と\(q \land r\)を書き,それぞれの列を埋めましょう.\(p\)の列と\(r\)の列,そして\(q\)の列と\(r\)の列に着目して\(\land\)の定義に従うと,

と書けます.さて,準備ができたので\( (p \land r)\lor (q \land r)\)を書いてその列を埋めていきましょう.先ほど書いた\( (p \land r)\)と\((q \land r)\)の列に着目して\(\lor\)の定義に従うと,

と書けます.

さて,ここで\((p\lor q)\land r\)と\((p \land r)\lor (q \land r)\)の列に着目しましょう.すると,真理値が同じですね.同値\(\leftrightarrow\)の定義より,\((p\lor q)\land r\)と\((p \land r)\lor (q \land r)\)が同値であることが分かります.

これで,\((p\lor q)\land r \Longleftrightarrow (p \land r)\lor (q \land r)\)であることが証明できました.同様にして,\((p\land q)\lor r \Longleftrightarrow (p \lor r)\land (q \lor r)\)が証明できます.

「でない」「かつ」「または」「ならば」の定義

最初に「命題」「条件」という言葉の確認から.

命題:正しいか正しくないかを一意的に判定できる主張
条件:変数(変項ともいいます)を含む命題

これらは高校生は数学Ⅰで既習だと思います.

以下,\(p,~q\)を命題とします.\(\overline{p},~p\land q,~p \lor q,~p\rightarrow q\)を改めて定義します.

定義

\(p\land q\)
\(p\)と\(q\)が両方真のときのみ真で,その他の場合はすべて偽となるような命題.この命題を「\(p\)かつ\(q\)」と呼び,\(p \land q\)と表す.

\(p \lor q\)
\(p\)と\(q\)が両方偽ときのみ偽で,その他の場合はすべて真となるような命題.この命題を「\(p\)または\(q\)」と呼び,\(p \land q\)と表す.

\(\overline{p}\)
\(p\)が真のときに偽で\(p\)が偽のときに真となるような命題.この命題を「\(p\)でない」あるいは「\(p\)の否定」と呼び,\(\overline{p}\)あるいは\(\lnot{p}\)と表す.

\(p\rightarrow q\)
\(p\)が真で\(q\)が偽のときのみ偽で,その他の場合はすべて真となるような命題.この命題を「\(p\)ならば\(q\)」と呼び,\(p\rightarrow q\)と表す.

上が\(p\land q,~p \lor q,~\lnot p,~p\rightarrow q\)の定義です.…が,とても見にくいですね.そこで以下のような表でまとめてみます.Tは真(True)を,Fは偽(False)を表すとします.


大分見やすくなりました.これを,「真理表(または真理値表)」と呼びます.以後,\(p\land q,~p \lor q,~\lnot p,~p\rightarrow q\)を上の表に従う命題とし,これらの表に基づき各種命題の真偽判定していくことになります.

(補足1)
ところで,この定義の中で唯一違和感があるとしたら,「『\(p\)ならば\(q\)』は,\(p\)が偽のとき\(q\)の真偽に関わらず真とする」という点かと思います.定義なんだからつべこべ言わず受け入れましょう,と言いたいところですが(「定義する」と言われたら受け入れるしかない?),あえて感覚的な説明をするとしたら,次のように考えると受け入れやすいかもしれません:

とある家庭で父親が息子に言いました「テストで満点をとったら,スマホを買ってあげるよ」と.

このとき,次の4つのケースが考えられます.

    1. 息子が満点をとり,父親がスマホを買ってあげる
    2. 息子が満点をとり,父親がスマホを買ってあげない
    3. 息子は満点をとれず,父親がスマホを買ってあげる
    4. 息子は満点をとれず,父親がスマホを買ってあげない

このうち,父親が「約束を守った・破った」ことになるのはどれかを考えてみます.1.これは父親はきちんと約束を守っています.2.これは父親は明らかに約束を破っていますね.さて,3と4についてはこのように考えられないでしょうか:

そもそも息子が満点を取ってない以上,父親が買ってあげようとも(満点とれなかったのにラッキーですね)買ってあげずとも,約束を破ったことにはならない,すなわち約束を守ったことになる.

このように考えると「ならば」を上のように定義することが感覚的に受け入れられるのではないでしょうか.

(補足2)
命題\[p \longrightarrow q\]
が真であることを,
\[p \Longrightarrow q\]
と表します.ですから,「\(p \Rightarrow q\)」は「\(p \rightarrow q\)が真である(成り立つ)」と読み替えられます.

「すべて」「存在する」の否定

以下,\(x\in \{x_1,~x_2,~x_3,\cdots ,x_n\}\)とする.

\(\overline{\forall x~p(x)} \Longleftrightarrow \exists x~\overline{p(x)}\)

証明

\[
\begin{align*}
&\overline{\forall x~p(x)}\\
\Longleftrightarrow~&\overline{p(x_1)\land p(x_2)\land p(x_2)\land \cdots \land p(x_n)}\\
\Longleftrightarrow~&\overline{p(x_1)}\lor \overline{p(x_2)}\lor \overline{p(x_2)}\lor \cdots \lor\overline{p(x_n)}\\
\Longleftrightarrow~&\exists x~\overline{p(x)}&\textbf{(証明終)}
\end{align*}
\]

\(\overline{\exists x~p(x)} \Longleftrightarrow \forall x~\overline{p(x)}\)

証明

\[
\begin{align*}
&\overline{\exists x~p(x)}\\
\Longleftrightarrow~&\overline{p(x_1)\lor p(x_2)\lor p(x_2)\lor \cdots \lor p(x_n)}\\
\Longleftrightarrow~&\overline{p(x_1)}\land \overline{p(x_2)}\land \overline{p(x_2)}\land \cdots \land\overline{p(x_n)}\\
\Longleftrightarrow~&\forall x~\overline{p(x)}&\textbf{(証明終)}
\end{align*}
\]

\(\forall\)(すべての)を否定すると\(\exists\)(存在する)となり,\(\exists\)(存在する)を否定すると\(\forall\)(すべての)となります.

「オイラーグラフ\(\Longleftrightarrow\)すべての頂点が偶点」の証明

頂点と辺(直線でなくともOK)を結んだ図形をグラフと呼びます.

ここで,

・すべての辺を1回だけ通り,
・出発点に戻る
道が存在する(すなわち一筆書きができる)グラフ

つまり一筆書きして出発点に戻ってこられるグラフをオイラーグラフと呼びます.

このオイラーグラフに関して,次の定理があります(頂点に集まる辺の本数を次数とよび,次数が偶数であるような頂点を偶点,次数が奇数であるような頂点を奇点と呼びます).

\[\text{オイラーグラフ}\Longleftrightarrow{頂点がすべて偶点}\]

この定理より,例えば上の三つのグラフの頂点はどれも偶点だけなのでいずれもオイラーグラフであることがわかります.つまり一筆書きできます!下の証明は,一筆書きを見つけるための一般論にもなっています.

証明

(\(\Longrightarrow\)の証明)
グラフがオイラーグラフであるとする.オイラーグラフとはいわば「一筆書きして出発点に戻ってこられる」ようなグラフであるから,各頂点において,その頂点で袋小路になることなく通過できることになる.これはその頂点に「入る」辺があれば必ず「出ていく」辺もセットで存在することを意味する(2本がセットとなる).したがって各頂点における次数は2の倍数となる.ゆえに,すべての頂点は偶点であるといえる.

(\(\Longleftarrow\)の証明)
すべての頂点が偶点となるグラフを考える.辺の数が1のとき,すべての頂点は奇点となるから考える必要はない.したがって辺の本数を\(n\)として\(n\geq2\)で考える.

\(n\)に関する帰納法で証明する.

\(n<k\)のとき,与えらえた命題が正しいと仮定,すなわち\[\text{\(k-1\)個以下の頂点すべてが偶点\(~\Longrightarrow~\)オイラーグラフ}\]であると仮定する.この仮定のもとで,
\[\text{\(k\)個の頂点すべてが偶点\(~\Longrightarrow~\)オイラーグラフ}\]が示せればよい.

まとめると,今手元にある仮定は,

\[
\begin{cases}
\text{\(k-1\)個以下の頂点すべてが偶点\(~\Longrightarrow~\)オイラーグラフ}\quad \cdots (1)\\
\text{\(k\)個の頂点すべてが偶点}\quad \cdots (2)
\end{cases}
\]

であり,この下で,\(k\)個の頂点をもつグラフがオイラーグラフであることが示せればよい.

今,仮定(2)よりグラフの\(k\)個の頂点はすべて偶点である.このグラフ(\(G\)とおく)は閉路\(C\)をもつ.この閉路\(C\)を抜き出す(下図参照).グラフ\(C\)を抜き出したあとのグラフを\(G\backslash C\)とおく.

閉路\(C\)を抜き出しても,各頂点は偶点のままであることに注意する(なぜなら\(C\)を抜き出したあと,頂点から次数が\(2\)の倍数だけ減ることになるが,もともと偶点なので,\(\text{偶数}-2\text{の倍数}=\text{偶数}\)より,残った頂点もやっぱり偶点となるから.下図参照).

残ったグラフ\(G\backslash C\)の頂点はすべて偶点であるから,仮定(1)より,\(G\backslash C\)はすべてオイラーグラフといえる.

グラフ\(C\)を辿る過程で,残ったグラフ\(G\backslash C\)(オイラーグラフ)を寄り道しながらたどれば一筆書きができる(下図参照).すなわち\(G\)はオイラーグラフである.

\(n=2\)で各頂点が偶点であるようなグラフがオイラーグラフであることは明らか.(証明終)

この証明から分かるように,「一筆書きの見つけ方」は以下のようになります:
① まず何でもいいから閉路(ア)をみつけ,その閉路(ア)を取り除く.
② 取り除いたあとのグラフから,一筆書きの経路(イ)(ウ)を見つける.
③ あとは(ア)を進む途中で(イ)(ウ)に寄り道して出発点に戻る.

②の段階で一筆書き(イ)(ウ)が見つけづらい場合は,そのグラフのもとで再び①②の操作を行えばOK.

これで理論上はどんなオイラーグラフも一筆書きの経路が見つかります.

\(\exists x \forall y\)と\(\forall y \exists x\)の違い

並びが違うだけのように見えますが意味は全く異なります.\(p(x,~y)\)を条件とします.

\(\exists x \forall y~p(x,~y)\)は「\(x\)が存在して,任意の\(y\)に対して\(p(x,~y)\)が成り立つ」となります.最初に「存在して」と言っているあたりが慣れないと気持ち悪いと思います.なので言い換えると,「任意の\(y\)に対して\(p(x,~y)\)が成り立つような\(x\)が,\(y\)とは無関係に存在する」となります.

ポイントは,\(x\)は\(y\)に依存していないということです.

他方,\(\forall y \exists x ~p(x,~y)\)は「どんな\(y\)に対しても,それに対応して\(x\)が存在して,\(p(x,~y)\)が成り立つ」ということです.やはり「存在して」が先に来ると違和感がある人は「\(p(x,~y)\)が成り立つような\(x\)が,\(y\)に応じて存在する」と言い換えればよいと思います.

こちらは\(x\)は\(y\)に依存しているということがポイントです.

【具体例】

条件\(p(x,~y)\)を「\(x\)は\(y\)の親である」という条件とします(\(x,y\in \text{人類}\)).このとき,

\(\exists x \forall y~p(x,~y)\)は,
\[\exists x \forall y~[~\text{\(x\)は\(y\)の親である}~]\]
となります.これを翻訳すると「人間\(x\)が存在して,その人間\(x\)はすべての人間\(y\)の親である」,あるいは「どんな人間\(y\)にとっても親となる人間\(x\)が(その人間\(y\)が誰であるかとは無関係に)存在する」となります.

・・・この命題は常識的に考えれば真とは言いづらいですね^^;宗教のようなある種の信仰を持っている人にとってはこの命題も真と言えるのかもしれませんが.

他方,\(\forall y \exists x ~p(x,~y)\)は,

\[\forall y \exists x ~[~\text{\(x\)は\(y\)の親である}~]\]

これを翻訳すると「どんな人間\(y\)に対しても,その人間\(y\)に対応して\(x\)という人間が存在し,\(x\)と\(y\)との間に親子関係が成り立つ」あるいは「どんな人間\(y\)に対しても,その人間に応じて親\(x\)が存在する」となります.

・・・この命題は明らかに真でしょう.(クローン人間など特殊な例を考えない限り)物理的に人間から生まれなかった人間はいませんから.

以上,\(\exists x \forall y\)と\(\forall y \exists x\)の違い,それは\(x\)と\(y\)の間に関係(対応)があるかないか,ということです!

基本ベクトルの外積

同じ基本ベクトル同士の外積は,\(\overrightarrow{0}\)になります.なぜなら,同じベクトルですからその2つのベクトルが作る平行四辺形の面積は0であるから,外積の大きさも0(外積の定義ⅲを参照),したがって\(\overrightarrow{0}\)です.

異なる基本ベクトル同士の外積ならどうでしょうか.たとえば,\(\overrightarrow{e_1}\times\overrightarrow{e_2}\)を考えてみます.

\(\overrightarrow{e_1}\times\overrightarrow{e_2}\)とは,外積の定義ⅰとⅱにより,図1に示す赤いベクトルであるといえます.さらに,\(\overrightarrow{e_1}\)と\(\overrightarrow{e_2}\)が作る平行四辺形は,正方形ですから,その面積は\(1\times1=1\)です.したがって,先ほどの赤いベクトル\(\overrightarrow{e_1}\times\overrightarrow{e_2}\)の大きさは\(1\)である,と言えます(図2参照).

以上により,\(\overrightarrow{e_1}\times\overrightarrow{e_2}\)は上の図の赤いベクトルで,しかもその大きさは\(1\)であることが分かります.このベクトルはほかならぬ\(\overrightarrow{e_3}\)ですね.同様に考え,\(\overrightarrow{e_1}\times\overrightarrow{e_3}\)や\(\overrightarrow{e_3}\times\overrightarrow{e_2}\)なども導出できます.

© 2024 佐々木数学塾, All rights reserved.