包除原理

数学Aで次の式を学びました.

\[
\begin{align*}
n(A_1 \cup A_2)=&n(A_1)+n(A_2)\\
&-n(A_1 \cap A_2)
\end{align*}
\]

\[
\begin{align*}
n(A_1 \cup A_2 \cup A_3)=&n(A_1)+n(A_2)+n(A_3)\\
&-n(A_1 \cap A_2)-n(A_1 \cap A_3)-n(A_2 \cap A_3)\\
&+n(A_1 \cap A_2 \cap A_3)
\end{align*}
\]

授業でベン図を用いて理解したことと思います.

この2つの式の流れ的に,

\[
\begin{align*}
&n(A_1 \cup A_2 \cup A_3 \cup A_4)\\
=&~n(A_1)+n(A_2)+n(A_3)+n(A_4)\\
&-n(A_1 \cap A_2)-n(A_1 \cap A_3)-n(A_1 \cap A_4)-n(A_2 \cap A_3)-n(A_2 \cap A_4)-n(A_3 \cap A_4)\\
&+n(A_1 \cap A_2 \cap A_3)+n(A_1 \cap A_2 \cap A_4)+n(A_1 \cap A_3 \cap A_4)+n(A_2 \cap A_3 \cap A_4)\\
&-n(A_1 \cap A_2 \cap A_3 \cap A_4)\\
\end{align*}
\]

などが,そしてさらに一般化して,

\[
n\left(\displaystyle\bigcup_{i}^{n} A_i\right)=\displaystyle\sum_{i}^{n} n(A_i)-\displaystyle\sum_{i<j}^{n}n(A_i \cap A_j)+\displaystyle\sum_{i<j<k}^{n}n(A_i \cap A_j \cap A_k)-\cdots+(-1)^{n-1}\displaystyle\sum^{n}_{i<j<\cdots} n(A_i \cap A_j \cap \cdots )
\]

が成り立ちそうな気がします.

ここで,\(\displaystyle\bigcup_{i}^{n} A_i\)は\[A_1 \cup A_2 \cup ~\cdots~ \cup A_n\]を,\(\displaystyle\sum_{i<j}^{n}n(A_i \cap A_j)\)などは\(1\leq i<j\leq n~(i,j\in \mathbb{N})\)をみたす\(n(A_i \cap A_j)\)をすべて加えたものを意味するとします.

さて,この予想は正しいのでしょうか??もはやベン図では太刀打ちできません.数学的帰納法で証明してみます.

証明

\(n=l\)のとき予想が正しいとします.この仮定のもとで,\(n=l+1\)のときを考えます.

\[
\begin{align*}
n\left(\displaystyle\bigcup_{i}^{l+1} A_i\right)&=n\left(\left(\displaystyle\bigcup_{i}^{l}A_i\right)\bigcup A_{l+1}\right)\\
&=n\left(\displaystyle\bigcup_{i}^{l}A_i\right)+n\left(A_{l+1}\right)-n\left(\left(\displaystyle\bigcup_{i}^{l}A_i\right) \bigcap A_{l+1}\right)
\end{align*}
\]

ここで,第三項にある\(\left(\displaystyle\bigcup_{i}^{l}A_i\right) \bigcap A_{l+1}\)について考えてみると,

\[
\begin{align*}
&\left(\displaystyle\bigcup_{i}^{l}A_i\right) \bigcap A_{l+1}\\
=&(A_1 \cup A_2 \cup A_3 \cup \cdots \cup A_l)\cap A_{l+1}\\
=&(A_1 \cap A_{l+1} ) \cup (A_2 \cap A_{l+1} ) \cup (A_3 \cap A_{l+1} ) \cup \cdots \cup(A_l \cap A_{l+1} )\\
=&\bigcup^{l}_i(A_i \cap A_{l+1})
\end{align*}
\]

ですから,

\[n\left(\displaystyle\bigcup_{i}^{l+1} A_i\right)=n\left(\displaystyle\bigcup_{i}^{l}A_i\right)+n\left(A_{l+1}\right)-n\left(\bigcup^{l}_i(A_i \cap A_{l+1})\right)\quad \cdots(\ast)\]

を得ます.ここで仮定より,

\[
n\left(\displaystyle\bigcup_{i}^{l} A_i\right)=\displaystyle\sum_{i}^{l} n(A_i)-\displaystyle\sum_{i<j}^{l}n(A_i \cap A_j)+\displaystyle\sum_{i<j<k}^{l}n(A_i \cap A_j \cap A_k)-\cdots+(-1)^{n-1}\displaystyle\sum^{l}_{i<j<\cdots} n(A_i \cap A_j \cap \cdots )
\]

また,この式の\(A_i\)を\(A_i \cap A_{l+1}\)に変えることにより,

\[
\begin{align*}
&n\left(\displaystyle\bigcup_{i}^{l} (A_i \cap A_{l+1})\right)\\
=&\displaystyle\sum_{i}^{l} n(A_i \cap A_{l+1})-\displaystyle\sum_{i<j}^{l}n(A_i \cap A_{l+1} \cap A_j)+\displaystyle\sum_{i<j<k}^{l}n(A_i \cap A_{l+1} \cap A_j \cap A_k)-\cdots+(-1)^{n-1}\displaystyle\sum^{l}_{i<j<\cdots} n(A_i \cap A_{l+1} \cap A_j \cap \cdots )\\
=&\displaystyle\sum_{i}^{l} n(A_i \cap A_{l+1})-\displaystyle\sum_{i<j}^{l}n(A_i \cap A_j \cap A_{l+1})+\displaystyle\sum_{i<j<k}^{l}n(A_i  \cap A_j \cap A_k \cap A_{l+1})-\cdots+(-1)^{n-1}\displaystyle\sum^{l}_{i<j<\cdots} n(A_i  \cap A_j \cap \cdots \cap A_{l+1})
\end{align*}
\]

これら仮定を\((\ast)\)に代入すると,

\[
\begin{align*}
&n\left(\displaystyle\bigcup_{i}^{l+1} A_i\right)\\
=&\displaystyle\sum_{i}^{l} n(A_i)-\displaystyle\sum_{i<j}^{l}n(A_i \cap A_j)+\displaystyle\sum_{i<j<k}^{l}n(A_i \cap A_j \cap A_k)-\cdots+(-1)^{n-1}\displaystyle\sum^{l}_{i<j<\cdots} n(A_i \cap A_j \cap \cdots )\\
&+n\left(A_{l+1}\right)\\
&-\left\{\displaystyle\sum_{i}^{l} n(A_i \cap A_{l+1})-\displaystyle\sum_{i<j}^{l}n(A_i \cap A_j \cap A_{l+1})+\displaystyle\sum_{i<j<k}^{l}n(A_i  \cap A_j \cap A_k \cap A_{l+1})-\cdots+(-1)^{n-1}\displaystyle\sum^{l}_{i<j<\cdots} n(A_i  \cap A_j \cap \cdots \cap A_{l+1})\right\}\\
=&\left\{\displaystyle\sum_{i}^{l} n(A_i)+n\left(A_{l+1}\right)\right\}-\left\{\displaystyle\sum_{i<j}^{l}n(A_i \cap A_j)+\displaystyle\sum_{i}^{l} n(A_i \cap A_{l+1})\right\}+\left\{\displaystyle\sum_{i<j<k}^{l}n(A_i \cap A_j \cap A_k)+\displaystyle\sum_{i<j}^{l}n(A_i \cap A_j \cap A_{l+1})\right\}\\
&-\cdots+(-1)^{n-1}\left\{\displaystyle\sum^{l}_{i<j<\cdots} n(A_i \cap A_j \cap \cdots )+\displaystyle\sum^{l}_{i<j<\cdots} n(A_i  \cap A_j \cap \cdots \cap A_{l+1})\right\}\\
=&\displaystyle\sum_{i}^{l+1} n(A_i)-\displaystyle\sum_{i<j}^{l+1}n(A_i \cap A_j)+\displaystyle\sum_{i<j<k}^{l+1}n(A_i \cap A_j \cap A_k)-\cdots+(-1)^{n-1}\displaystyle\sum^{l+1}_{i<j<\cdots} n(A_i \cap A_j \cap \cdots )
\end{align*}
\]

となって\(n=l+1\)のときも成り立つことが分かります.\(n=1\)のとき成り立つことは自明.(証明終)

見た目はいかついですが高校レベルでも理解できる内容(未習の知識としては\(\bigcup\)の記法と「または,かつ」の分配法則くらい)なので,ぜひ証明にチャレンジしてみてください.集合,場合の数,数学的帰納法,\(\Sigma\)記号の使い方などの総復習にもなりますから.

ちなみに今回証明した式を包除原理と呼びます.

いわゆる「場合分け」って

\(ax^2-2x-a=0\)を解け.ただし,\(a\)は定数とする.

「(ア)\(a=0\)のとき~(イ)\(a\neq0\)のとき~,」という,\(a\)が0かどうかで場合分けするお馴染みの問題です。これを論理式で記述すると

\[
\begin{align*}
&ax^2-2x-a=0 \land(a=0 \lor a \neq 0)\\
\Longleftrightarrow~ & (ax^2-2x-a=0 \land a=0) \lor (ax^2-2x-a=0 \land a \neq 0)\\
\Longleftrightarrow~ & (0-2x-0=0 \land a=0) \lor \left(x=\frac{1\pm\sqrt{1^2-a\cdot(-a)}}{a} \land a \neq 0 \right)\\
\Longleftrightarrow~ & (x = 0 \land a=0) \lor \left(x=\frac{1\pm\sqrt{1+a^2}}{a} \land a \neq 0 \right)
\end{align*}
\]

となります。

ベクトルの外積

外積を定義します.

外積

    1. \(\overrightarrow{a}\)と\(\overrightarrow{b}\)に対して垂直で,
    2. その向きが,\(\overrightarrow{a}\)から\(\overrightarrow{b}\)へねじを回したときにねじが進む向きと一致し,
    3. その大きさが,\(\overrightarrow{a}\)と\(\overrightarrow{b}\)が作る平行四辺形の面積と一致する

ようなベクトルを「外積(outer product)」と呼び,\[\overrightarrow{a}\times \overrightarrow{b}\]と表す.

ことにします.上図の赤いベクトルですね.定義しただけでは役に立たないので,実際にこの外積を求めてみましょう.\(\overrightarrow{a}=(a_1,~a_2,~a_3),~\overrightarrow{b}=(b_1,~b_2,~b_3)\)とおくことにします.

まず,\(\overrightarrow{a}\)は基本ベクトル\(\overrightarrow{e_1}=(1,~0,~0),~\overrightarrow{e_2}=(0,~1,~0),~\overrightarrow{e_3}=(0,~0,~1)\)を用いて,
\[
\begin{align*}
\overrightarrow{a}=
&\left(
\begin{array}{c}
a_1\\
a_2\\
a_3
\end{array}
\right)
=
\left(
\begin{array}{c}
a_1\\
0\\
0
\end{array}
\right)
+
\left(
\begin{array}{c}
0\\
a_2\\
0
\end{array}
\right)
+
\left(
\begin{array}{c}
0\\
0\\
a_3
\end{array}
\right)\\
&=a_1\left(
\begin{array}{c}
1\\
0\\
0
\end{array}
\right)
+
a_2\left(
\begin{array}{c}
0\\
1\\
0
\end{array}
\right)
+
a_3\left(
\begin{array}{c}
0\\
0\\
1
\end{array}
\right)\\
&=a_1\overrightarrow{e_1}+a_2\overrightarrow{e_2}+a_3\overrightarrow{e_3}
\end{align*}
\]

と\(e_1,~e_2,~e_3\)の1次結合で表すことができます.同様にして

\[\overrightarrow{b}=b_1\overrightarrow{e_1}+b_2\overrightarrow{e_2}+b_3\overrightarrow{e_3}\]

したがって外積\(\overrightarrow{a}\times\overrightarrow{b}\)は

\[\overrightarrow{a}\times\overrightarrow{b}=(a_1\overrightarrow{e_1}+a_2\overrightarrow{e_2}+a_3\overrightarrow{e_3})\times(b_1\overrightarrow{e_1}+b_2\overrightarrow{e_2}+b_3\overrightarrow{e_3})\]

と書けることになります.これを「計算」してみればよい.しかしここでひとつ問題があります.「\(\times\)」に関する計算法則を,まだ私たちはなにも知りません(普段使っている「掛ける」とは見た目が同じだけで別物です).したがって,まずこの「\(\times\)」がどのような計算法則を持つのか,調べなくてはなりません.

結論から先に述べますと,

\[
\begin{align*}
&\overrightarrow{a}\times\overrightarrow{b}=-\overrightarrow{b}\times\overrightarrow{a}\tag{A}\\
&k(\overrightarrow{a}\times \overrightarrow{b})=(k\overrightarrow{a})\times \overrightarrow{b}=\overrightarrow{a}\times (k\overrightarrow{b})\tag{B}\\
&\overrightarrow{a}\times(\overrightarrow{b}+\overrightarrow{c})=\overrightarrow{a}\times\overrightarrow{b}+\overrightarrow{a}\times\overrightarrow{c}\tag{C}
\end{align*}
\]

が成り立ちます(\(\mathrm{(A)}\)は定義より明らか.\(\mathrm{(B)}\),\(\mathrm{(C)}\)).注意したいのは,1つ目,「交換するとマイナスがつく」ということです.外積という新しい定義を導入したわけですから,当然,これまでの常識(交換法則)が通用するとは限らないわけです.

では,これらの計算法則に従って,計算してみましょう(実際に紙に書いて手を動かしてみることをおすすめします).

\[
\begin{align*}
&~\overrightarrow{a}\times\overrightarrow{b}\\
=&~(a_1\overrightarrow{e_1}+a_2\overrightarrow{e_2}+a_3\overrightarrow{e_3})\times(b_1\overrightarrow{e_1}+b_2\overrightarrow{e_2}+b_3\overrightarrow{e_3})\\
=&~a_1\overrightarrow{e_1}\times b_1\overrightarrow{e_1}+a_1\overrightarrow{e_1}\times b_2\overrightarrow{e_2}+a_1\overrightarrow{e_1}\times b_3\overrightarrow{e_3}\\
&+a_2\overrightarrow{e_2}\times b_1\overrightarrow{e_1}+a_2\overrightarrow{e_2}\times b_2\overrightarrow{e_2}+a_2\overrightarrow{e_2}\times b_3\overrightarrow{e_3}\\
&+a_3\overrightarrow{e_3}\times b_1\overrightarrow{e_1}+a_3\overrightarrow{e_3}\times b_2\overrightarrow{e_2}+a_3\overrightarrow{e_3}\times b_3\overrightarrow{e_3}\\
=&~a_1b_1(\overrightarrow{e_1}\times \overrightarrow{e_1})+a_1b_2(\overrightarrow{e_1}\times \overrightarrow{e_2})+a_1b_3(\overrightarrow{e_1}\times \overrightarrow{e_3})\\
&+a_2b_1(\overrightarrow{e_2}\times \overrightarrow{e_1})+a_2b_2(\overrightarrow{e_2}\times \overrightarrow{e_2})+a_2b_3(\overrightarrow{e_2}\times \overrightarrow{e_3})\\
&+a_3b_1(\overrightarrow{e_3}\times \overrightarrow{e_1})+a_3b_2(\overrightarrow{e_3}\times \overrightarrow{e_2})+a_3b_3(\overrightarrow{e_3}\times \overrightarrow{e_3})
\end{align*}
\]

ここで,

\[
\begin{align*}
&\overrightarrow{e_1}\times\overrightarrow{e_1}=\overrightarrow{e_2}\times\overrightarrow{e_2}=\overrightarrow{e_3}\times\overrightarrow{e_3}=\overrightarrow{0} \\
&\overrightarrow{e_1}\times\overrightarrow{e_2}=\overrightarrow{e_3},\quad\overrightarrow{e_1}\times\overrightarrow{e_3}=-\overrightarrow{e_2}\\
&\overrightarrow{e_2}\times\overrightarrow{e_1}=-\overrightarrow{e_3},\quad\overrightarrow{e_2}\times\overrightarrow{e_3}=\overrightarrow{e_1}\\
&\overrightarrow{e_3}\times\overrightarrow{e_1}=\overrightarrow{e_2},\quad\overrightarrow{e_3}\times\overrightarrow{e_2}=-\overrightarrow{e_1}
\end{align*}
\]

ですから(なぜ?),結局外積\(\overrightarrow{a}\times\overrightarrow{b}\)は
\[
\begin{align*}
\overrightarrow{a}\times\overrightarrow{b}
=&~a_1b_1\cdot \overrightarrow{0}+a_1b_2\overrightarrow{e_3} -a_1b_3\overrightarrow{e_2}\\
&-a_2b_1\overrightarrow{e_3}+a_2b_2\cdot \overrightarrow{0}+a_2b_3\overrightarrow{e_1}\\
&+a_3b_1\overrightarrow{e_2}-a_3b_2\overrightarrow{e_1}+a_3b_3\cdot \overrightarrow{0}\\
=&~(a_2b_3-a_3b_2)\overrightarrow{e_1}+(a_3b_1-a_1b_3)\overrightarrow{e_2}+(a_1b_2-a_2b_1)\overrightarrow{e_3}\\
=&~(a_2b_3-a_3b_2)\left(
\begin{array}{c}
1\\
0\\
0
\end{array}
\right)
+
(a_3b_1-a_1b_3)\left(
\begin{array}{c}
0\\
1\\
0
\end{array}
\right)
+
(a_1b_2-a_2b_1)\left(
\begin{array}{c}
0\\
0\\
1
\end{array}
\right)\\
=&~\left(
\begin{array}{c}
a_2b_3-a_3b_2\\
a_3b_1-a_1b_3\\
a_1b_2-a_2b_1\\
\end{array}
\right)
\end{align*}
\]

を得ます.この結果は覚えておくとよいでしょう.以下のように覚えるのがおすすめです.

\[\overrightarrow{a}\times\overrightarrow{b}=\left(
\begin{array}{c}
a_2b_3-a_3b_2\\
a_3b_1-a_1b_3\\
a_1b_2-a_2b_1\\
\end{array}
\right)\]

内積(inner product)と言葉自体は似ているのですが,内積はスカラー量であるのに対して,外積はベクトル量であることに注意してください.

注意
高校数学においても垂直なベクトルを求めるシーンは多いのですが,高校範囲外なので,テストや模試等では検算にとどめておくのが無難かも知れません.

「かつ」「または」の分配法則

\(p,~q,~r,~s\)を命題とする.このとき,
\[p\land (q \lor r) \Longleftrightarrow (p\land q) \lor (p\land r)\]
が成り立ちます.高校数学的にはベン図で証明(というか説明?)しますが,論理学的には真理値表で証明します.

他にも,\[p\lor (q \land r) \Longleftrightarrow (p\lor q) \land (p\lor r)\]や\[(p\lor q) \land (r \lor s) \Longleftrightarrow (p\land r) \lor (q\land r) \lor (p \land s) \lor (q \land s)\]や
\[(p\land q) \lor (r \land s) \Longleftrightarrow (p\lor r) \land (q\lor r) \land (p \lor s) \land (q \lor s)\]なども同様に成り立ちます.数や文字の分配法則にそっくりですね.証明はこちら

軌跡の問題を論理式で記述する

2直線\(kx+2y-k+4=0\)と\(2x-ky+6-2k=0\)がある.\(k\)の値が変化するとき,この2直線の交点の軌跡の方程式を求めよ.

網羅系問題集には必ず載ってる軌跡の有名問題です.この手の問題に難儀した人は少なくないと思います.初めて見る人はこれを教科書で学んだ方法で解答を作成してみましょう.正解ならOK(軌跡に「漏れ」や「余計なもの」が入っていたらそれは正解とはいいませんよ).不正解なら以下を読んでみてください.

論理式で記述してみます.

求める軌跡上の点を\((X,~Y)\)とします.「\((X,~Y)\)が軌跡上の点である」ということを「\((X,~Y)\in\text{軌跡}\)」と表すことにします.この「\((X,~Y)\in\text{軌跡}\)」を同値変形することを考えます.

\[
\begin{align*}
&(X,~Y)\in\text{軌跡}\\
\Longleftrightarrow~&\exists k\begin{cases}
kX+2Y-k+4=0\\
2X-kY+6-2k=0
\end{cases}\tag{1}\\
\Longleftrightarrow~&\exists k\begin{cases}
(X-1)k=-2Y-4\\
2X-kY+6-2k=0
\end{cases}\\
\Longleftrightarrow~&\exists k\begin{cases}
(X-1)k=-2Y-4\land(X-1=0 \lor X-1\neq 0)\\
2X-kY+6-2k=0\tag{2}
\end{cases}\\
\Longleftrightarrow~&\exists k\begin{cases}
((X-1)k=-2Y-4\land X-1=0) \lor ((X-1)k=-2Y-4\land X-1\neq 0)\\
2X-kY+6-2k=0\tag{3}
\end{cases}\\
\Longleftrightarrow~&\exists k\begin{cases}
(0\cdot k=-2Y-4\land X=1) \lor (k=\frac{-2Y-4}{X-1}\land X\neq 1)\\
2X-kY+6-2k=0
\end{cases}\\
\Longleftrightarrow~&\exists k\begin{cases}
(X=1\land Y=-2) \lor (k=\frac{-2Y-4}{X-1}\land X\neq 1)\\
2X-kY+6-2k=0
\end{cases}\\
\Longleftrightarrow~&\exists k\left(((X=1\land Y=-2) \lor (k=\frac{-2Y-4}{X-1}\land X\neq 1))\land 2X-kY+6-2k=0\right)\\
\Longleftrightarrow~&\exists k\left((X=1\land Y=-2\land 2X-kY+6-2k=0) \lor (k=\frac{-2Y-4}{X-1}\land X\neq 1\land 2X-kY+6-2k=0)\right)\tag{4}\\
\Longleftrightarrow~&\exists k(X=1\land Y=-2\land 2X-kY+6-2k=0) \lor \exists k(k=\frac{-2Y-4}{X-1}\land X\neq 1\land 2X-kY+6-2k=0)\tag{5}\\
\Longleftrightarrow~&\exists k(X=1\land Y=-2\land 2\cdot 1-k\cdot (-2)+6-2k=0) \lor (X\neq 1\land 2X-\frac{-2Y-4}{X-1}Y+6-2\frac{-2Y-4}{X-1}=0)\tag{6}\\
\Longleftrightarrow~&\exists k(X=1\land Y=-2\land 0\cdot k+8=0) \lor (X\neq 1\land X^2+2X+Y^2+4Y+1=0)\tag{7}\\
\Longleftrightarrow~&X\neq 1\land (X+1)^2+(Y+2)^2=4\tag{8}\\
\end{align*}
\]

となって求める軌跡の方程式を得ます.通常の解答を見るとわかりますが,読めばとりあえず理解はできるものの,いざ自分で解答をつくれと言われると次に何をやればよいのか見えずらく(必然性が感じられず)不安に感じるタイプの問題ではないでしょうか.で,結局半ば流れを「覚えよう」となるっていう.しかし,上で見るように論理式で記述すると機械的な変形(次にすべきことが明解で迷いがない,もはや「計算」するような感覚)により答えを得ることがきます.これが論理式の強力な点だと思います.

ただし上の変形は論理に関する様々な知識を使っています.

\((1)\)は存在条件への言い換えです.
\((2)\)は恒真条件\(X-1=0\lor X-1\neq 0\)の追加
\((3)\)は分配法則
\((4)\)は分配法則
\((5)\)は存在記号の分配法則
\((6)\)後半は存在記号があるので\(k\)を消去できて
\((7)\)の前半は矛盾命題なので\((8)\)と同値になります.

(というか数式がはみ出て見づらくてすみません…)

存在記号は分配できるか?

できます(かつ(\(\land\))に関して).なぜなら,

\[\forall x[p(x)\land q(x)]~\Longleftrightarrow \forall x p(x)\land \forall x q(x)\]であるから,この命題の待遇を考えると,

\[\lnot(\forall x[p(x)\land q(x)])~\Longleftrightarrow \lnot(\forall x p(x)\land \forall x q(x))\]

すなわち

\[\exists x[\lnot p(x)\lor \lnot q(x)]~\Longleftrightarrow \exists x \lnot p(x)\lor \exists x \lnot q(x)\]

となります.\(\lnot\)は否定を表す記号です.ですから,

\[\exists x[\overline{p(x)}\lor \overline{q(x)}]~\Longleftrightarrow \exists x \overline{ p(x)}\lor \exists x \overline{q(x)}\]

とも書けますね.見やすさのために\(\overline{p(x)}\)を\(p(x)\)に,\(\overline{q(x)}\)を\(q(x)\)に改めて書き換えれば,
\[\exists x[p(x) \lor q(x)]~\Longleftrightarrow \exists x p(x)\lor \exists x q(x)\]
となります.

注意:ただし,存在記号はかつ(\(\land\))に関しては分配できません!すなわち,\[\exists x[p(x) \land q(x)] \Longrightarrow \exists x p(x) \land \exists xq(x)\]であって,この逆は成り立ちません.これは具体例を考えれば分かりやすい.仮に全体集合をあるクラスだとして,\(p(x)\)を「\(x\)は勉強が得意」\(q(x)\)を「\(x\)はスポーツが得意」だとします.すると,\(\exists x[p(x) \land q(x)]\)は「勉強もスポーツも両方得意な生徒がいる」となり,\(\exists x p(x) \land \exists xq(x)\)は「勉強が得意な生徒がいて,かつ,スポーツが得意な生徒もいる」となります.\(\Longrightarrow\)が成り立つのは当たり前でしょう.\(\Longleftarrow\)について考えます.「(そのクラスに)勉強が得意な生徒がいて,スポーツが得意な生徒もいるのなら,勉強もスポーツも両方得意な生徒がいる」となりますが,これは正しいでしょうか.少し考えればわかるように明らかに正しくないですね.反例.仮定を満たすクラスとして,「勉強は超得意だけどスポーツはダメダメな秀才君がいて,スポーツは超得意だけど勉強はからっきしの脳筋君がいる.そしてクラスの他の生徒たちは勉強もスポーツもとくに得意とは言えない,いたってフツーの生徒,そんなクラスが例えば考えられます.このクラスには明らかに「勉強もスポーツも両方得意な生徒」はいることにはなりませんね.

任意記号は分配できるか?

\(p(x),~q(x)\)を条件とする.\(\forall\)は「任意記号(または全称記号)」と呼び,「任意の(Any),すべての(for All)」という意味です.Aをひっくり返して\(\forall\).このとき,

\[\forall x[p(x)\land q(x)]~\Longleftrightarrow \forall x p(x)\land \forall x q(x)\quad \cdots (\ast)\]

が成り立ちます.例えば,\(p(x)\)を「\(x\)は勉強が得意」という条件,\(q(x)\)を「\(x\)はスポーツが得意」という条件だとしましょう.このとき,\(\forall x[p(x)\land q(x)]\)は

\[\text{全員,勉強とスポーツ両方得意}\]

という意味になります.イメージし易さのため,\(x\in \text{(とあるクラス)}\)とすると,

\[\text{このクラスの全員が,勉強とスポーツ両方得意}\]

となります.いわば,スーパーマンみたいな奴だけで構成されたクラスですね,そんなクラスをイメージしてください.

他方,\(\forall x p(x)\land \forall x q(x)\)は\[\text{このクラスの全員が勉強が得意で,かつ,このクラスの全員がスポーツが得意}\]という意味になります.

これらの「翻訳」に従って,上の\((\ast)\)を記述し直してみると,

\begin{align*}
&\text{このクラスの全員が,勉強とスポーツ両方得意}\\
\Longleftrightarrow~&\text{このクラスの全員が勉強が得意で,かつ,このクラスの全員がスポーツが得意}
\end{align*}

ということになります.このようにイメージすると,\((\ast)\)の\(\Longleftarrow\)も\(\Longrightarrow\)もどちらも成り立つこと,すなわち同値であることが容易に納得できます.

注意:ただし,任意記号はまたは(\(\lor\))に関しては分配できません

なぜイプシロン・デルタ(エヌ)論法が必要なのか

大学で微分積分学または解析学で最初にぶち当たる関門,\(\epsilon-\delta\)論法(\(\epsilon-N\)論法).まずこれが理解できず相当ゲンナリするひとは結構多いと思います.自分もそうでした.かつて理解するのに苦労した一学生としてひとことメモしておこうと思います.

理解の第一歩は,そもそもなぜそのような定義が必要なのか?を感じることだと思います.

高校の教科書では数列の極限を,

数列\(\{a_n\}\)において,\(n\)を限りなく大きくするとき,\(a_n\)がある値\(\alpha\)に限りなく近づくならば,\(\{a_n\}\)は\(\alpha\)に収束する,または\(\{a_n\}\)の極限は\(\alpha\)であるといい,\[\lim_{n\rightarrow \infty}a_{n}=\alpha\]と書く.

と定義しています.この定義に従えば,例えば数列\(\{1+\frac{1}{n}\}\)において,\(n\)を限りなく大きくするとき,\(1+\frac{1}{n}\)は\(1\)に限りなく近づいているので,\(\{1+\frac{1}{n}\}\)は\(1\)に収束すると言えて,\[\lim_{n\rightarrow \infty}\left(1+\frac{1}{n}\right)=1\]と書ける,ということになります.

一見なんの問題もないように見えますし,高校数学の問題を解く上では何の問題もありません.しかし,上の定義はよく考えてみるとかなり怪しい.

例えば,数列\(\{1+\frac{1}{n}\}\)において,\(n\)を限りなく大きくするとき,\(1+\frac{1}{n}\)は(\(1\)そのものにならない以上)\(0\)にだって限りなく近づいている,とも言えるわけで,ならば上の定義に従って\[\lim_{n\rightarrow \infty}\left(1+\frac{1}{n}\right)=0\]とも書ける,ということになります.例えるならば一関から仙台へ向かってる人は,仙台に到着しない限り,「東京へ向かっている」とも言えてしまう,ということです.

他にも,

\(\displaystyle \lim_{n\rightarrow \infty}a_n=\alpha,~\lim_{n\rightarrow \infty}b_n=\beta\)のとき,\[\lim_{n\rightarrow \infty}(a_n\pm b_n)=\alpha\pm\beta\]とか\[\lim_{n\rightarrow \infty}ka_n=k\lim_{n\rightarrow \infty}a_n\]とか\[\lim_{n\rightarrow \infty}a_nb_n=\alpha\beta,~\lim_{n\rightarrow \infty}\frac{a_n}{b_n}=\frac{\alpha}{\beta}\]さらに「はさみうちの原理」などを数学Ⅲの序盤に「極限の性質」として学びましたがいざこれらを証明するとなるとどうすればいいのでしょうか(「原理」と名前がついていますがこれは証明すべき定理です).

百歩譲ってこれらは「感覚的に明らか」と認めるにしても,例えば\(\displaystyle \lim_{n\rightarrow \infty}x_n=0\)のとき,\[\lim_{n\rightarrow \infty}\frac{x_1+x_2+x_3+\cdots+x_n}{n}=0\]はどうでしょう.これは感覚的に明らかでもないし,上の定義で証明しようとしても完全にお手上げです.

つまり上の高校教科書の定義は数学の定義としては不十分ということです.このような要請のもと,\(\epsilon-\delta\)論法(今は数列なので\(\epsilon-N\)論法)なる極限の新たな定義が必要になります.

© 2024 佐々木数学塾, All rights reserved.