任意記号は分配できるか?

\(p(x),~q(x)\)を条件とする.\(\forall\)は「任意記号(または全称記号)」と呼び,「任意の(Any),すべての(for All)」という意味です.Aをひっくり返して\(\forall\).このとき,

\[\forall x[p(x)\land q(x)]~\Longleftrightarrow \forall x p(x)\land \forall x q(x)\quad \cdots (\ast)\]

が成り立ちます.例えば,\(p(x)\)を「\(x\)は勉強が得意」という条件,\(q(x)\)を「\(x\)はスポーツが得意」という条件だとしましょう.このとき,\(\forall x[p(x)\land q(x)]\)は

\[\text{全員,勉強とスポーツ両方得意}\]

という意味になります.イメージし易さのため,\(x\in \text{(とあるクラス)}\)とすると,

\[\text{このクラスの全員が,勉強とスポーツ両方得意}\]

となります.いわば,スーパーマンみたいな奴だけで構成されたクラスですね,そんなクラスをイメージしてください.

他方,\(\forall x p(x)\land \forall x q(x)\)は\[\text{このクラスの全員が勉強が得意で,かつ,このクラスの全員がスポーツが得意}\]という意味になります.

これらの「翻訳」に従って,上の\((\ast)\)を記述し直してみると,

\begin{align*}
&\text{このクラスの全員が,勉強とスポーツ両方得意}\\
\Longleftrightarrow~&\text{このクラスの全員が勉強が得意で,かつ,このクラスの全員がスポーツが得意}
\end{align*}

ということになります.このようにイメージすると,\((\ast)\)の\(\Longleftarrow\)も\(\Longrightarrow\)もどちらも成り立つこと,すなわち同値であることが容易に納得できます.

注意:ただし,任意記号はまたは(\(\lor\))に関しては分配できません

条件同士を結ぶ「,」(カンマ)について

条件同士を「,」でつなげることがあります.これについて確認しておきます.
結論から言うと,条件同士を「,」で結ぶときは基本的には論理和,すなわち「かつ(\(\land\))」を意味します.

しかしながら「,」を他の意味で使うこともあるようです.

例えば2次方程式\(x^2-3x+2=0\)を解く際,

\[x^2-3x+2=0\]より\[(x-1)(x-2)=0\]したがって\[x=1,~2\]

と書くことと思います.ここに現れる「,」は明らかに「かつ」ではありませんね.

しかし論理式で記述すると,

\[
\begin{align*}
&x^2-3x+2=0\\
\Longleftrightarrow~&(x-1)(x-2)=0\\
\Longleftrightarrow~&x-1=0\lor x-2=0\\
\Longleftrightarrow~&x=1\lor x=2\\
\end{align*}
\]

であり,これをみると\(x=1\)と\(x=2\)は論理和つまり「または」で結ばれていることが分かります.

以前,某雑誌でこの「,」の使い方について触れていました.それによると(大学の)数学の先生によっては上の「,」はあくまで「かつ」とすべき派と,上の「,」は集合論で使う「,」だから全然OK派がいる・・・みたいなことを言っていた気がします(ごめんなさいうろ覚えです).僕個人としては条件と共に現れる「,」は「かつ」としておき,例えば上の二次方程式ならば\(x=1\)または\(x=2\)と書いた方がいいじゃん派です.

「存在する」の扱い

\[
\begin{align*}
\begin{cases}
x=a\\
x=b
\end{cases}
\end{align*}
\]

ここから短絡的に\(x\)を消去して\(a=b\)としても同値とはなりません.しかしもし,

\[
\begin{align*}
\begin{cases}
x=a\\
x=b
\end{cases}
\end{align*}\text{を満たす\(x\)が存在する}
\]

なら,\(a=b\)と同値であると言えます(\(x\)は文字通り消える).この二者の違いは,「存在する」という一言があるかないかです.この「存在する」について議論してみたいと思います.簡単のため,上を論理式で記述してみます.「\(x\)が存在する」は「\(\exists x\)」と書けますから(\(\exists\)はExistの頭文字をひっくり返したものです),

\[
\begin{align*}
\exists x
\begin{cases}
x=a\\
x=b
\end{cases}
\Longleftrightarrow~a=b
\end{align*}
\]

となります.一般に,条件を\(p(x)\)で表すことにすると,

\[
\begin{align*}
\exists x
\begin{cases}
p(x)\\
x=a
\end{cases}
\Longleftrightarrow~p(a)
\end{align*}
\]

が成り立ちます.

【証明】

(\(\Rightarrow\))仮定より,条件\(p(x)\)と\(x=a\)をみたす\(x\)が存在する.今,これを\(\alpha\)とおく.このとき,\[p(\alpha)\land \alpha=a\]すなわち\[p(a)\]が成り立つ.

(\(\Leftarrow\))仮定より,\(p(x)\)をみたす\(x\)が存在する.その\(x\)は\(a\)である.そしてこの\(a\)は方程式\(x=a\)を明らかにみたしている.ゆえに,\(p(x)\land x=a\)をみたす\(x\)が(\(a\)として)存在する.

(証明終)

これは様々な同値変形で用いるとても重要な考え方になります.
とくに連立方程式においては,「消去する」などといいつつも文字は消えるわけではないのですが,しかし「存在する」のであれば,消えてなくなります.この違いに注意しておきたいです.

連立方程式における中かっこの意味

連立方程式
\[
\begin{align*}
\begin{cases}
x+y=1\\
x-y=3
\end{cases}
\end{align*}
\]
に現れる中かっこ\(\{\)の意味について確認しておきます.結論から言うと,この中かっこは条件同士を「かつ」で結んでいることを意味しています.すなわち,
\[
\begin{align*}
&\begin{cases}
x+y=1\\
x-y=3
\end{cases}\\
\Longleftrightarrow~&x+y=1 \land x-y=3\\
\Longleftrightarrow~&x+y=1 \land x-y+(x+y)=3+1\\
\Longleftrightarrow~&x+y=1 \land 2x=4\\
\Longleftrightarrow~&x+y=1 \land x=2\\
\Longleftrightarrow~&2+y=1 \land x=2\\
\Longleftrightarrow~&x=2 \land y=-1\\
\end{align*}
\]
ということです.

2次方程式の共通解問題(その1)

\(2\)つの\(2\)次方程式\(x^2+kx+2=0,~2x^2+kx+1=0\)が共通解をもつように定数\(k\)の値を定めよ。

この問題の定石的解法は「共通解を\(\alpha\)とおいて代入して連立せよ」ですが,具体的には何をしているのか,論理式を用いてみてみます。

解答

\begin{align*}
&\exists x
\begin{cases}
x^2+kx+2=0\\
2x^2+kx+1=0
\end{cases}\\
\Longleftrightarrow~&\exists x
\begin{cases}
x^2+kx+2=0 \\
2x^2+kx+1-(x^2+kx+2)=0
\end{cases}&\cdots (1)\\
\Longleftrightarrow~&\exists x
\begin{cases}
x^2+kx+2=0\\
x^2-1=0
\end{cases}\\
\Longleftrightarrow~&\exists x
\begin{cases}
x^2+kx+2=0\\
x=-1 \lor x=1
\end{cases}&\cdots (2)\\
\Longleftrightarrow~&\exists x [x^2+kx+2=0 \land (x=-1 \lor x=1)]&\cdots (3)\\
\Longleftrightarrow~&\exists x [(x^2+kx+2=0 \land x=-1) \lor (x^2+kx+2=0 \land x=1)]&\cdots (4)\\
\Longleftrightarrow~&\exists x (x^2+kx+2=0 \land x=-1) \lor \exists x(x^2+kx+2=0 \land x=1)]&\cdots (5)\\
\Longleftrightarrow~& (-1)^2+k(-1)+2=0 \lor 1^2+k\cdot1+2=0 &\cdots (6)\\
\Longleftrightarrow~&k=3 \lor k=-3\\
\end{align*}

よって\(k=\pm 3\).

解答終

一般的な解答で感じられる一種の不安感は論理式で記述すれば払拭できると思います。
ただし,ここでは様々な同値変形\((1)\)~\((6)\)を用いています。それぞれの同値変形について,順を追ってみてみると

まず\((1)\)は連立方程式の解法は・・・「文字を減らす方針」?で紹介した同値変形です。

\((2)\)は,この記事でとりあげている同値変形です。

\((3)\)は,連立方程式における\(\{\)は「かつ(\(\land\))」を表すためです。

\((4)\)は,かつ(\(\land\)),または(\(\lor\))の分配法則によります。

\((5)\)は,存在記号がまたは(\(\lor\))に関して分配できることによります。

\((6)\)存在記号\(\exists\)があれば代入することで文字を消去することができます。

(関連:2次方程式の共通解問題(その2)

連立方程式の解法は…「文字を減らす」方針?

正確には,こうです.

\[
\begin{cases}
f(x,~y)=0\\
g(x,~y)=0
\end{cases}
\Longleftrightarrow
\begin{cases}
f(x,~y)=0\\
g(x,~y)+kf(x,~y)=0
\end{cases}
\]

だから簡単な例でいうと,

\[\begin{align*}
&\begin{cases}
x+y=1\\
2x+3y=3
\end{cases}\\
\Longleftrightarrow
&\begin{cases}
x+y-1=0\\
(2x+3y-3)-2(x+y-1)=0
\end{cases}\\
\Longleftrightarrow
&\begin{cases}
x+y-1=0\\
y+2=0
\end{cases}\\
\Longleftrightarrow
&\begin{cases}
x+y-1=0\\
y=-2
\end{cases}\\
\Longleftrightarrow
&\begin{cases}
x=3\\
y=-2
\end{cases}\\
\end{align*}
\]

連立方程式を解く,という作業も結局,同値変形しているに過ぎないので「文字を減らす」というよく言われる表現は個人的に違和感があります.文字(というか式?)は別に減ってないので・・・.単純な連立方程式であれば,このへんうるさく言わなくても全然平気なんだけどごつい連立方程式だと同値性を意識しないとうまく解けなかったり汚い記述になったりする気がします(数検1級一次試験で一時期流行ってました).とくに\((\ast)\)の同値性は\(f(x,~y)=0\)を表記しないと同値性が崩れること,すなわち

\[\begin{cases}
f(x,~y)=0\\
g(x,~y)=0
\end{cases}
\Longrightarrow
g(x,~y)+kf(x,~y)=0
\]

であることに注意しましょう.

論理記号を使いこなせると明解に記述できるし思考しやすいので個人的には大好きなのですが準備と慣れを必要とするので難しい。この辺の論理学を学習してから数学を学べたらかなり強いと思うのだけど…そういった側面から教材を作れないものか思案中です.

同値変形の重要性2

論理式を記述する際,必要性だけで横着せずに,改行するごとに十分性まで考える,すなわち同値変形すればいいのです.

\[P_1\Longleftrightarrow P_2\Longleftrightarrow P_3\Longleftrightarrow\cdots \Longleftrightarrow P_n\]

このように変形すれば,行を追うごとに同値性を確認しているので,最後に逆を確認する必要がない.(★★)

このことに注意して再度解答を作成してみます.

【解答”】
\[\begin{align*}
&2-x=\sqrt{x}\\
\Longleftrightarrow&~(2-x)^2=x \land 2-x>0 \\
\Longleftrightarrow&~x^2-4x+4=x \land 2>x\\
\Longleftrightarrow&~x^2-5x+4=0 \land x<2\\
\Longleftrightarrow&~(x-4)(x-1)=0 \land x<2\\
\Longleftrightarrow&~(x=4 \lor x=1) \land x<2\\
\Longleftrightarrow&~(x=4 \land x<2) \lor (x=1\land x<2) \\
\Longleftrightarrow&~x=1\land x<2 \\
\Longleftrightarrow&~x=1
\end{align*}
\]

【解答”終】

このように同値変形を行えば,逆の考察をする必要がなく,解は\(x=1\)と自信をもって答えられます(参考:軌跡の問題を論理式で記述する

また,この解答のように論理記号\(\lor\)や\(\land\)やその分配法則を用いると簡潔に記述できます.論理記号の意味やその各種法則などの使い方も知っておくことは数学を学ぶ上で強力な武器(というかなくてはならない基礎体力)になります.ですから余力のある人は受験数学範囲の(記号)論理学を学んでおくといいと思います.

ちなみに,数学Ⅲを履修している人は,無理関数のグラフを描くことで視覚的に不適解を排除することができるでしょう.そっちの解答の方が直観的で手間もなく,実戦的だと思います.しかし,「絵」による定性的判断は時に誤った結論を導くことがあります.一方,論理による定量的判断は絶対です.その意味で,論理を味方にしておくことは極めて重要と個人的に思います.

というわけで,(★)の考え方だけでなく,(★★)の考え方も攻め方として持っておくとよいでしょう.それぞれにメリット,デメリットがあります.どちらか片方だけに固執するのではなく,状況に応じて攻め方を変えられるようになりたいものです.

同値変形の重要性

前回,式の記述について投稿しました.なぜ,あのような考え方が重要なのでしょうか.例えば,こんな問題があったとします.\[2-x=\sqrt{x}\text{ を解け.}\]

よくある誤答.

【誤答】
\[\begin{align*}
2-x&=\sqrt{x}\\
(2-x)^2&=x\\
x^2-4x+4&=x\\
x^2-5x+4&=0\\
(x-4)(x-1)&=0
\end{align*}
\]
ゆえに,\[x=1, 4\]
(誤答終)

どこがおかしいのでしょうか?得られた解のひとつ\(x=1\)を与式に代入すると,
\[\begin{align*}
2-1&=\sqrt{1}\\
1&=1
\end{align*}
\]
となり矛盾はありません.しかし\(x=4\)を与式に代入すると,
\[\begin{align*}
2-4&=\sqrt{4}\\
-2&=2
\end{align*}
\]
となり矛盾します.ここで,元の与式をよく観察すると,左辺の\(\sqrt{x}\)は必ず正であるから,当然右辺\(2-x>0\)も正すなわち\(x<2\).したがって,得られた解のうち\(4\)の方は不適な解であることが分かります.このことに注意すると,以下のように解答を修正でき,正答が得られます.

【解答】
\[\begin{align*}
2-x&=\sqrt{x}\\
(2-x)^2&=x\\
x^2-4x+4&=x\\
x^2-5x+4&=0\\
(x-4)(x-1)&=0
\end{align*}
\]
ゆえに,\[x=1, 4\]
ここで,\(x<2\)であるから,解は\[x=1\]である.(解答終)

この解答を,論理記号を用いて正確に記述し直してみましょう.

【解答’】
\[\begin{align*}
&~2-x=\sqrt{x}\\
\Longrightarrow&~(2-x)^2=x\\
\Longrightarrow&~x^2-4x+4=x\\
\Longrightarrow&~x^2-5x+4=0\\
\Longrightarrow&~(x-4)(x-1)=0
\end{align*}
\]

すなわち,

\[2-x=\sqrt{x}\Longrightarrow x=1\lor x=4\]を得る(\(\lor\)は論理記号で「または」の意).この時点では,\(x=1\lor x=4\)は必要条件にしか過ぎない.だから,次にこの十分性について調べる.すなわち,\[2-x=\sqrt{x}\Longleftarrow x=1\lor x=4\]について調べる.\(2-x=\sqrt{x}\longleftarrow x=4\)は偽である.他方,\(2-x=\sqrt{x}\longleftarrow x=1\)は真である.すなわち\(2-x=\sqrt{x}\Longleftarrow x=1\).よって(※),\[2-x=\sqrt{x}\Longleftrightarrow x=1\]を得る.(解答’終)

(※模式的にかけば\(p\Rightarrow q\lor r\),\(p \Leftarrow q\),\(\overline{p\Leftarrow r}\)のとき,\(p \Leftrightarrow q\)すなわち
\[(p\rightarrow q \lor r) \land (p \leftarrow q) \land (\overline{p \leftarrow r}) \Longrightarrow (p\leftrightarrow q)\]
なのですが,これは真理表で確認できます)

この解答は,いってみれば「とりあえず十分性を考えず必要性だけを意識して変形して,最後の最後に\(2-x=\sqrt{x}\)の十分性を考えた」となります.模式的に書けば,\[P_1\Longrightarrow P_2\Longrightarrow P_3\Longrightarrow\cdots \Longrightarrow P_n\]と変形してから,\[P_1\Longleftarrow P_n\](十分性)を確認する,という考え方(★)です.もちろん間違ってはいないんだけど,個人的に気になる点が2つ.

  • 最初の【解答】で示した解答を作る人は,論理を意識していないことが多い.だから,そもそも「逆を確認しよう」なんては考えない.結果,これを他の分野にも跨る「論理の問題」として捉えず,「この問題『特有の』解法」として「記憶(暗記)」することになる(「無理方程式では,最後に解を満たすかどうか確認すればいいのね!」・・・などと).統一的な視点は連鎖的な理解を生み,その記憶の保持にもほとんど労力を要さない.対して,他の知識と紐づけされない孤立した知識は脳みそにいらぬ負担をかけることになる.そして苦労して記憶したわりに応用がきかないというオマケつき.
  • この「最後に逆を確認する」という作業が,今回のように簡単であれば問題ない.しかし,数学Ⅱの「軌跡」分野のように,逆の考察が難しい場合は何をもって逆を確認するのか(本によっては理由もなしに「逆も成り立つ」の一言で済ませている記述もある.この類の記述は本当に無責任だと個人的に思う.参考:軌跡の問題を論理式で記述する).

というわけで,(★)のような考え方(記述)はよく見かけます.が,他に考え方はあるのでしょうか.(つづく

相関係数

\(n\)個のデータ\(x_1,x_2,\cdots,x_n\),\(y_1,y_2,\cdots,y_n\)(それぞれ平均を\(\mu,\lambda\)とする)の相関係数\(\rho(x,y)\)がなぜ$$-1\leq\rho(x,y)\leq1$$なのか,質問を受けたので,このブログでの数式表示の練習も兼ねて書いてみようと思います.

(証明)
天下り的ではあるが,まず,2つのベクトル$$\vec{u}=(x_1-\mu,x_2-\mu,\cdots,x_n-\mu),~\vec{v}=(y_1-\lambda,y_2-\lambda,\cdots,y_n-\lambda)$$を用意し,これらの内積を考える.すると,
$$
\begin{align}
\vec{u}\cdot\vec{v}&=(x_1-\mu)(y_1-\lambda)\cdots(x_n-\mu)(y_n-\lambda)\\
&=\sum_{k=0}^{n}(x_k-\mu)(y_k-\lambda)\\
\end{align}
$$
となる.他方,\(\vec{u}\cdot\vec{v}\)は,内積の公式(高校教科書では「定義」)より

$$
\begin{align}
\vec{u}\cdot\vec{v}&=\sqrt{(x_1-\mu)^2+(x_2-\mu)^2+\cdots+(x_n-\mu)^2}\sqrt{(y_1-\lambda)^2+(y_2-\lambda)^2+\cdots+(y_n-\lambda)^2}\cos\theta\\
&=\sqrt{\sum_{k=0}^{n}(x_k-\mu)^2}\sqrt{\sum_{k=0}^{n}(y_k-\lambda)^2}\cos\theta\\
\end{align}
$$

ゆえに,
$$\cos\theta=\frac{\vec{u}\cdot\vec{v}}{\sqrt{\sum_{k=0}^{n}(x_k-\mu)^2}\sqrt{\sum_{k=0}^{n}(y_k-\lambda)^2}}$$
を得る.\(-1\leq\cos\theta\leq1\)であるから,上式は
$$-1\leq\frac{\vec{u}\cdot\vec{v}}{\sqrt{\sum_{k=0}^{n}(x_k-\mu)^2}\sqrt{\sum_{k=0}^{n}(y_k-\lambda)^2}}\leq1$$
である.前半に得た式をこの不等式に代入すれば,
$$-1\leq\frac{\sum_{k=0}^{n}(x_k-\mu)(y_k-\lambda)}{\sqrt{\sum_{k=0}^{n}(x_k-\mu)^2}\sqrt{\sum_{k=0}^{n}(y_k-\lambda)^2}}\leq1$$
分母分子を\(\frac{1}{n}\)で割って,
$$-1\leq\frac{\frac{1}{n}\sum_{k=0}^{n}(x_k-\mu)(y_k-\lambda)}{\frac{1}{n}\sqrt{\sum_{k=0}^{n}(x_k-\mu)^2}\sqrt{\sum_{k=0}^{n}(y_k-\lambda)^2}}\leq1\\
-1\leq\frac{\frac{1}{n}\sum_{k=0}^{n}(x_k-\mu)(y_k-\lambda)}{\sqrt{\frac{1}{n}\sum_{k=0}^{n}(x_k-\mu)^2}\sqrt{\frac{1}{n}\sum_{k=0}^{n}(y_k-\lambda)^2}}\leq1$$
すなわち
$$-1\leq\frac{Cov(x,y)}{\sigma(x)\sigma(y)}\leq1$$
よって,$$-1\leq\rho(x,y)\leq1$$を得る.(証明終)

結構疲れます^^;
ベクトルを使って統計の性質を証明するなんて,面白いです.

© 2024 佐々木数学塾, All rights reserved.