定積分の再定義

(高校生へ注意)この記事を読む際は,教科書の定積分の定義は忘れて読んで下さい.一旦無の状態に戻るのが理解のポイントです.

私たちは四角形の面積なら求められます.タテ\(\times\)ヨコ.さらにここから,三角形の面積やら台形の面積やらをも求められることになります.では,下のような曲線を含む図形Aの面積はどうやって求めればいいのでしょうか.というか,何を指して曲線を含む図形Aの「面積」とすればいいのでしょうか?

下図のような\(x\)軸,\(y=f(x)\),\(x=a\),\(x=b\)状況を仮定した上で,次のように考えてみます:

まず,図形を分割します.何個に分割してもいいのですが,ここでは\(n\)個に分割(等分でなくともよい)することにします.\[a=x_0<x_1<x_2<x_3<\cdots<x_{n-1}<x_{n}=b\]という分割です.

次に,これら\(n\)個の図形を,長方形に近似します.区間\([x_{i-1},~x_{i}]\)において「高さ」をとる\(x\)を\(\xi_i\)とします.区間\([x_{i-1},~x_{i}]\)上のどの点\(x\)を\(\xi_i\)とするかは任意です(ちなみに\(\xi\)はギリシャ文字で「グザイ」「クシー」などと読みます).

これらの長方形の面積を求めます.例えば左から\(i\)番目の長方形の面積なら,横幅は\(x_{i}-x_{i-1}\)です.高さは\(f(\xi_i)\)です.したがって左から\(i\)番目の長方形の面積は
\[f(\xi_i)(x_{i+1}-x_i)\]
と書けます.さらに,\(x_{i+1}-x_i=\Delta x_i\)とおけば,
\[f(\xi_i)\Delta x_i\]
と書けます.これを\(n\)個寄せ集めるのですから,敷き詰めた長方形の面積の和は
\[\sum^{n}_{i=0}f(\xi_i)\Delta x_i\]
と表されることになります.これをリーマン和と呼びます.

この「リーマン和」をもってして図形Aの「面積」とするのはどうでしょうか?…それはちょっとマズイ気がします.なぜなら,図形Aとリーマン和とではスキマ(誤差)が大きすぎますから(下図参照).

どうすればスキマ(誤差)は小さくなるでしょうか?各長方形の幅を小さくすれば,細長い長方形になって,スキマは小さくなります.当然,スキマは小さければ小さいほど,今私たちにとって欲しいものが正確に求まりそうな気がします.各長方形の幅を小さくするには,\(n\)を大きく,すなわち分割の数を大きくしてやればいいでしょう.


式で表すと,
\[\lim_{n\rightarrow \infty}\sum^{n}_{i=0}f(\xi_i)\Delta x_i\]
これなら,図形の「面積」と呼んでも差し支えなさそうです.そこで,この極限値を図形Aの「面積」と定義し,「定積分」と名付け,記号\[\int^b_a f(x)dx\]で表すことにします.

定積分の定義\[\int^b_a f(x)dx:=\lim_{n\rightarrow \infty}\sum^{n}_{i=0}f(\xi_i)\Delta x_i\]

\(:=\)は「左辺を右辺で定義する」という意味です.

以上を見ると,\(\displaystyle \int^b_a f(x)dx\)の\(\displaystyle \int\)や\(dx\)の「イメージ」が見えてきます.右図に示すように,\(\displaystyle \sum\)が\(\displaystyle \int\)に,\(\Delta x_i\)が\(dx\)と対応しているわけです.

 

ここで,\(\displaystyle \sum\ f(\xi_i)\Delta x_i\)の意味を思い出しましょう.\(f(\xi_i)\)が「タテ」,\(\Delta x_i\)が「ヨコ」を表すのでしたから,\(f(\xi_i)\times\Delta x_i\)は「長方形の面積」を意味し,その長方形の面積\(f(\xi_i)\Delta x_i\)を\(\displaystyle \sum\)する(足し加える),という意味でした.

以上を踏まえて\(\displaystyle \int^b_a f(x)dx\)を眺めると,これは「微小面積\(f(x)\times dx\)を\(\displaystyle \int\)したもの(連続的に足し加えたもの)」と読み取れることが分かります!

定積分を「リーマン和の極限」とみなす捉え方は,とても自然で,記号の導入も全く違和感がありません.さらに,右図に示した記号の解釈は,定積分の問題を扱う上で極めて重要な解釈になります.

次回はこの定積分の定義に従って図形の面積を計算してみます.すると,大きな問題に直面します….

定積分の話(定積分の定義と定積分で面積が求まる理由)

高校教科書では,定積分を次のように定義しています.

定積分の定義(高校教科書ver.)
\(f(x)\)の原始関数の1つを\(F(x)\)とする.
\[\int^b_af(x)dx:=F(b)-F(a)\]

そして,数学Ⅱまたは数学Ⅲで積分を既習の人はこの定積分を計算することによって「面積が求まる」ということも知っていると思います.

しかし,ここでひとつ疑問.なぜ定積分で面積が求まるのでしょうか?定積分の定義は上に示したようにあくまで「原始関数の差を『定積分』と呼ぶことにしましょう」と言っているに過ぎず,「面積」云々には一切触れていません.つまり(定積分の「定義」から)「面積が求まる」ということが「定理」として得られるはずですが,その理由はどこにあるのでしょうか?その辺を理解しないままにただただ計算している人も多いのではないでしょうか.

調べてみましょう.

今,\(y=f(x),~x\leq k,~y=0\)で示される部分の面積を\(S(k)\)と表すことにします.


すると,\(y=f(x),~x=x_1,~x=x_2,~y=0\)で囲まれる部分の面積は,\[S(x_2)-S(x_1)\]で表されることになります.


この斜線部分の面積を評価することを考えます.斜線部分の面積\(S(x_2)-S(x_1)\)は,区間\([x_1,~x_2]\)の幅\(x_2-x_1\)を「ヨコ」,区間\([x_1,~x_2]\)で一番大きい\(y\)の値\(f(x_{max})\)を「タテ」としたときの長方形の面積\((x_2-x_1)f(x_{max})\)より小さく,区間\([x_1,~x_2]\)の幅\(x_2-x_1\)を「ヨコ」,区間\([x_1,~x_2]\)で一番小さい\(y\)の値\(f(x_{min})\)を「タテ」としたときの長方形の面積\((x_2-x_1)f(x_{min})\)よりも大きいと言えます(下図参照.一番大きい,または小さい\(y\)の値を取るときの\(x\)をそれぞれ\(x_{max},~x_{min}\)とおきました).

したがって,以下の不等式が成り立ちます.
\[(x_2-x_1)f(x_{min})\leq S(x_2)-S(x_1)\leq (x_2-x_1)f(x_{max})\]
さらに,辺々を\(x_2-x_1\)で割ることで,
\[f(x_{min})\leq \frac{S(x_2)-S(x_1)}{x_2-x_1}\leq f(x_{max})\]
が得られます.

ここで,\(x_2\)を\(x_1\)に近づけてみます.すなわち,
\[\lim_{x_2\rightarrow x_1}f(x_{min})\leq \lim_{x_2\rightarrow x_1}\frac{S(x_2)-S(x_1)}{x_2-x_1}\leq \lim_{x_2\rightarrow x_1}f(x_{max})\]
まず中辺ですが,これは導関数の定義から\[S'(x_1)\]と書けます.

次に左辺と右辺について.\(x_2\)を\(x_1\)に近づけるというのは,区間\([x_1,x_2]\)の幅を縮めるということですから,図から\(f(x_{max}),~f(x_{min})\)はどちらも\(f(x_1)\)に近づくことが分かります(下図参照).

すなわち,
\[\lim_{x_2\rightarrow x_1}f(x_{max})=\lim_{x_2\rightarrow x_1}f(x_{max})=f(x_1)\]

したがって,はさみうちの原理から
\[S'(x_1)=f(x_1)\]
が得られますが,この式は
\[S(x_1)=\text{\(f(x_1)\)の原始関数}\]
であることを示しています.添え字がちょっとうるさいので\(x_1\)を\(x\)に置き換えておきます.
\[S(x)=\text{\(f(x)\)の原始関数}\]
準備は整いました.定積分の定義\(\displaystyle \int^b_a f(x)dx=F(b)-F(a)\)を変形してみます.
\[
\begin{align}
\int^b_a f(x)dx=&F(b)-F(a)\\
=&\text{\(f(x)\)の原始関数}|_{x=b}-\text{\(f(x)\)の原始関数}|_{x=a}\tag{1}\\
=&S(x)|_{x=b}-S(x)|_{x=a}\tag{2}\\
=&S(b)-S(a)
\end{align}
\]
\((1)\)は定義の仮定:「\(F(x)=\text{\(f(x)\)の原始関数}\)」から,
\((2)\)は先に導いた式:「\(S(x)=\text{\(f(x)\)の原始関数}\)」によるものです.

結局,
\[\int^b_a f(x)dx=S(b)-S(a)\]
が得られますが,\(S(b)-S(a)\)は\(y=f(x),~x=a,~x=b,~y=0\)で囲まれた面積を表しますから,定積分すなわち原始関数の差は確かに面積を表すことが確認でしました.

以上により定積分で面積が求められることが一応納得はできました.しかしながら,この「納得」は上でみたように複雑で,お世辞にも「直観的」とは言えません.一般に求積問題は図形が絡むので視覚情報から解法に繋げていくことが多いのですが,その視覚情報を数式に落とし込むにはある種の「直観的」な理解が必要になってきます.教科書の定義のままでは直観的な理解が伴わないゆえに求積問題等ではうまく発想・立式ができず,ほとんど使い物になりません.数学が得意な人,これから得意にしたい人,あるいは将来的に数学を使う学部学科に進みたい人は違う角度で定積分というものを捉える(理解する)べきです.

次回,「定積分」を教科書とは違う角度から(リーマン和の極限として)再定義し,今度は逆に「定積分が原始関数の差である」ことを定理として導いてみようと思います.すなわち,教科書が「定積分とは原始関数の差である(定義)→定積分は面積である(定理)」という流れであったのに対し,逆に「定積分はリーマン和の極限(=面積)である(定義)→定積分は原始関数の差である(定理)」という流れで定積分というものを捉え直します.この考え方自体がとりもなおさず受験数学における求積問題の肝にもなります.

否定をとることの難しさと論理式の有用性

背理法で示す方針の場合,与えられた命題を否定する必要がありますが,これが意外と難しいケースがあります.

\(xy\)平面内の相異なる4点\(P_1,~P_2,~P_3,~P_4\)とベクトル\(\overrightarrow{v}\)に対し,\(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする.このとき,\(k\)と異なるすべての\(m\)に対し\[\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\]が成り立つような点\(P_k\)が存在することを示せ.(京都大・文)

この問題の場合,与えられた命題は

「\(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする.このとき,\(k\)と異なるすべての\(m\)に対し\(\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\)が成り立つような点\(P_k\)が存在する」

です.この否定をとればいいわけですが,どこからどう手をつければいいのかいまいちわからない,できたとしてもなんだか不安….そこで,ここでは論理記号を用いて捉えてみます.与えられた命題を次の4つの部分に分けて翻訳していきます.

      1. \(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする.
      2. このとき,
      3. \(k\)と異なるすべての\(m\)に対し\(\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\)が成り立つ
      4. ような点\(P_k\)が存在する

1.「\(k\neq m\)のとき\(\overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\)が成り立っているとする」は
\[k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\]

2.「このとき」は\[\Longrightarrow\]

3.「\(k\)と異なるすべての\(m\)に対し\(\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\)が成り立つ」は\[\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]\]

4.「ような点\(P_k\)が存在する」は
\[\exists P_k\]

ですから,以上を繋げると,
\[\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\Longrightarrow\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]\]
となります.これの否定を考えます.
\[\overline{\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\Longrightarrow\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]}\]

ここで,一般に
\[
\begin{align*}
&(A\rightarrow B)\Longleftrightarrow \overline{A}\lor B
\end{align*}
\]
ですから,
\[\overline{A\rightarrow B}\Longleftrightarrow \overline{\overline{A} \lor B}\Longleftrightarrow A \land \overline{B}\]
です.したがって,
\[
\begin{align*}
&\overline{\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\Longrightarrow\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]}\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \overline{\exists P_k\forall m \big[m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0\big]}\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[\overline{m\neq k \Longrightarrow \overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0}\big]\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[m\neq k \land \overline{\overrightarrow{P_kP_m}\cdot\overrightarrow{v}<0}\big]\\ \Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}\geq0\big]\\ \Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m \big[(m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}>0)\lor(m\neq k \land\overrightarrow{P_kP_m}\cdot\overrightarrow{v}=0)\big]\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\big[\exists m(m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}>0)\lor\exists m(m\neq k \land\overrightarrow{P_kP_m}\cdot\overrightarrow{v}=0)\big]\\
\Longleftrightarrow~&\big(k\neq m \Longrightarrow \overrightarrow{P_kP_m}\cdot \overrightarrow{v}\neq 0\big)\land \forall P_k\exists m(m\neq k \land \overrightarrow{P_kP_m}\cdot\overrightarrow{v}>0)
\end{align*}
\]
となります.

もとの問題の解説では他の解法があったのですが,別解としての上記のように否定をとり矛盾を示す方針が載っていました.が,その「否定をとる」という作業の時点で既に難しく,ならば論理式で記述したらどうなるかなと思い考えてみました.見た目こそ厳ついものの,論理式の扱いに慣れさえすればとても分かりやすく明解です.

シグマ計算の工夫

教科書には次の式が公式として載っています.\[\sum^n_{k=1}ar^{n-1}=\frac{a(1-r^n)}{1-r}\]これは「公式」なのだから覚えるべきなのでしょうか?

結論から言えば,これは覚えるべき式ではありません.次のように考えましょう:

\[\sum\text{の後ろが\(r^{n}\)の形をしている}\]
ことからこれは等比数列の和であることが見て取れます.ここが最大のポイント.
等比数列の和の公式を思い出しましょう.等比数列の和の公式で必要な情報は,初項,公比,項数,の3つの情報でした.それらさえ分かればいい.\(\sum^n_{k=1}ar^{n-1}\)から読み取ってみましょう.

初項は?\(ar^{n-1}\)に\(n=1\)を代入すればよいでしょう.\(ar^{1-1}=ar^{0}=a\)です.

公比は?これは式の形からただちに\(r\)と分かります.

項数は?\(\sum^n_{k=1}\),すなわち項は\(1\)から\(n\)までありますから\(n\)個です.

したがって,等比数列の和の公式にこれらを代入し,\[\frac{a(1-r^n)}{1-r}\]が得られます.

練習に次の問題をやってみましょう.

\[(1)~\sum^{10}_{k=6}2\cdot 3^k\hspace{40mm}(2)~\sum^{2n-1}_{k=m}5^{2k-1}\]

\((1)\)

初項は?\(2\cdot 3^k\)に\(k=1\)と代入すればよいでしょう.\(2\cdot 3^1=6\)です.

公比は?式の形から,\(3\)です.

項数は?\(10-6+1=5\)です.

したがって,求める和は\[\frac{6(1-3^5)}{1-3}=\frac{6(3^5-1)}{2}=3^6-3=726\]となります.

\((2)\)

初項は?\(5^{2k-1}\)に\(k=m\)と代入すればよいでしょう.\(5^{2m-1}\)です.

公比は?\(5^{2k-1}=5^{2k}\cdot5^{-1}=\frac{1}{5}25^k\)であることに注意して,\(25\)です.

項数は?\((2n-1)-m+1=2n-m\)です.

したがって,求める和は\[\frac{5^{2m-1}(1-25^{2n-m})}{1-25}=\frac{5^{2m-1}(25^{2n-m}-1)}{24}\]となります.

以上,解答の過程に着目して欲しいのですが「\(\sum ar^{n-1}\)の公式」など必要ありませんし,覚えていても上ような形に添わないため使い物にすらなりません.

一般に,教科書が「公式」だと言っているから必ず覚えてなくてはならない,という訳では決してありません.教科書で「覚えろ」と言わんばかりの記述であっても,それが本当に覚える価値のある式なのか,それとも導出過程さえ押さえればいい式なのか,自分の頭で考え,疑う癖をつけることは数学を学ぶ上では非常に大事です.

全確率の定理

A君が友人とストリートファイターⅡ(スーファミ)で友人Bと対戦している.A君が勝つ確率は?

という問題があったとしましょう.こんな問題を見たらどう思いますか?(勝つか負けるか,2分の1だ!は間違いですよ~)当然,こう思うと思います「そらA君が誰使うかによるだろ」と.では,どんな場合があるでしょうか.リュウを使う場合,ケンを使う場合,ガイルを使う場合,春麗を使う場合….いろいろ考えられます.そして,ストⅡは2人同時に操作はできません(そのラウンドで1人のプレイヤーがリュウとケンと同時に操作し味方2人状態で戦うことはできません!).つまり同時に起こることはありませんから,これらの場合は互いに排反です.したがって,求める確率は
\[
\begin{align*}
P(\text{A君が勝つ})=&P(\text{A君が勝つ}\cap\text{リュウを使う})+P(\text{A君が勝つ}\cap\text{ケンを使う})\\
&+P(\text{A君が勝つ}\cap\text{エドモンド本田を使う})+P(\text{A君が勝つ}\cap\text{春麗を使う})\\
&+P(\text{A君が勝つ}\cap\text{ブランカを使う})+P(\text{A君が勝つ}\cap\text{ザンギエフを使う})\\
&+P(\text{A君が勝つ}\cap\text{ガイルを使う})+P(\text{A君が勝つ}\cap\text{ダルシムを使う})
\end{align*}
\]
「A君が勝つ」という事象を\(A\),「リュウを使う」という事象を\(B_1\),「ケンを使う」という事象を\(B_2\),「エドモンド本田を使う」という事象を\(B_3\),・・・,「ダルシムを使う」という事象を\(B_8\)とおくことにすれば,上の式は
\[
\begin{align*}
P(A)=&P(A\cap B_1)+P(A\cap B_2)+P(A\cap B_3)+P(A\cap B_4)\\
&+P(A\cap B_5)+P(A\cap B_6)+P(A\cap B_7)+P(A\cap B_8)\\
&=\displaystyle \sum^{8}_{i=1}P(A\cap B_i)
\end{align*}
\]すなわち\[P(A)=\displaystyle \sum^{8}_{i=1}P(A\cap B_i)\]と書けることがわかります.これを一般化すると,

全確率の定理\[P(A)=\displaystyle \sum^{\infty}_{i=1}P(A\cap B_i)\]

であると言えそうです.これを全確率の定理と呼びます.

ところで「ストリートファイター」ってゲーム自体今はどれくらい知名度あるんだろう?僕の時代は知らない人はいないくらいに流行っていました(スクリューパイルドライバーが出せたらまさにヒーロー).なので馴染みやすいかなと思って例に挙げましたが….調べると今はストリートファイター5まであるみたいですね.プレイアブルキャラは40人(!)らしいですから,この場合は\[P(A)=\displaystyle \sum^{40}_{i=1}P(A\cap B_i)\]ですね^^;

確率の乗法定理

条件付き確率の定義より,\[P(B|A)=\frac{P(B\cap A)}{P(A)}\]
両辺に\(P(A)\)を掛けることによって,\[P(A \cap B)=P(A)P(B|A)\]が得られます.(\(P(B \cap A)=P(A\cap B)\)としました)これを確率の乗法定理といいます.

確率の乗法定理(その1)\[P(A \cap B)=P(A)P(B|A)\]

日本語に翻訳すると「事象\(A\)と事象\(B\)が同時に起こる確率は,事象\(A\)の確率と,事象\(A\)の影響を受けた事象\(B\)の確率(条件付き確率)との積に等しい」ということで,少し確率の問題に慣れた人であればいつも無意識にやっている計算だと思います.例題で確認してみます.
当たりくじ3本を含む10本のくじの中から,引いたくじはもとに戻さないで,1本ずつ2回続けてくじを引く.2本とも当たる確率を求めよ.また,2回目が当たる確率いくらか.

1回目が当たるという事象を\(A\),2回目が当たるという事象を\(B\)とします.

2本とも当たる確率)
求める確率は\(P(A\cap B)\)です.確率の乗法定理より,\(P(A \cap B)=P(A)P(B|A)\)ですから,\(P(A)\)と\(P(B|A)\)を求めましょう.\(P(A)=\frac{3}{10}\)なのは問題ないでしょう.\(P(B|A)\)を求めます.これは「1回目が当たったという事実のもとで2回目が当たる確率」ですから,「引いたくじはもとに戻さない(当たりが1枚減る)」ことに注意せねばなりません.1回目に当たりを引けば,その後全体の枚数は9枚,当たりは2枚になりますから,\(P(B|A)=\frac{2}{9}\)です.したがって求める確率は\[P(A \cap B)=P(A)P(B|A)=\frac{3}{10}\cdot\frac{2}{9}=\frac{1}{15}\]となります.

2回目が当たる確率)
求める確率は\(P(B)\)です.まず気をつけて欲しいのは,求めようとしているのは確率\(P(B)\)であって確率\(P(B|A)\)ではない,ということ.すなわち,確率を求めようとしている今この時,まだ1回目は引いてもいない!何もしていない!ということです.まだなにもしていない,くじの前で黙って腕を組んだまま2回目を予想している(\(P(B)\)を求めようとしている)…そんなイメージです.1回目は引いてもいないし眼中にもありません.2回目だけを見つめています.以上に留意して,実際に\(P(B)\)を求めてみましょう.確率の定義に従います.2回目に起こりうるすべての場合の数は?2回目において,10枚のくじのどれが引きやすくどれが引きにくいなどということはありません(同様に確からしい).よって10通り.題意に適する場合の数は?当たり3枚のうちどれが引きやすくどれが引きにくいということはやはりありません.よって3通り.したがって求める確率は,\[P(B)=\frac{3}{10}\]となります.\(P(B|A)\neq P(B)\)であることに注目してください.

次の問題です.

当たりくじ3本を含む10本のくじの中から,1本ずつ2回続けてくじを引く.2本とも当たる確率を求めよ.ただし,引いたくじはもとに戻すものとする.また,2回目に当たる確率はいくらか.

2本とも当たる確率)
求める確率は\(P(A\cap B)\)です.確率の乗法定理より,\(P(A \cap B)=P(A)P(B|A)\)ですから,\(P(A)\)と\(P(B|A)\)を求めましょう.\(P(A)=\frac{3}{10}\)なのは問題ないでしょう.\(P(B|A)\)を求めます.これは「1回目が当たったという事実のもとで2回目が当たる確率」なわけですが,今回は引いたくじをもとに戻しています.ですから,2回目の状況は1回目の状況となんら変化がないことになります.したがって,\(P(B|A)=\frac{3}{10}\)となります.よって,求める確率は\[P(A \cap B)=P(A)P(B|A)=\frac{3}{10}\cdot\frac{3}{10}=\frac{9}{100}\]となります.

2回目が当たる確率)
求める確率は\(P(B)\)です.前問同様に考えます.2回目に起こりうるすべての場合の数は?2回目において10枚のくじのどれもが同様に確からしい.よって10通り.題意に適する場合の数は?当たり3枚のうちどれもがやはり同様に確からしい.よって3通り.したがって求める確率は,\[P(B)=\frac{3}{10}\]となります.前問と全く同じです.

さて,今回は\(P(B|A)\),\(P(B)\)はどちらも\(\frac{3}{10}\)ですから\(P(B|A)=P(B)\)です.この,\[P(B|A)=P(B)\]が成り立つとき,事象\(A\)と事象\(B\)は独立であるといいます.この式を「翻訳」すると,「\(B\)の確率は\(A\)が起きたかどうかなんて関係ない」と,すなわち「事象\(A\)と事象\(B\)が互いに影響を及ぼしていない」と読み取ることができます.

以上の準備のもと,次の定理が成り立ちます.

確率の乗法定理(その2)事象\(A\)と事象\(B\)が独立,すなわち\(P(B|A)=P(B)\)のとき\[P(A \cap B)=P(A)P(B)\]

高校教科書では上の話を,「2つの試行同士が互いに影響を与えない」ことを「独立」であると定義し,そのもとで確率の乗法定理(その2)を紹介しています.そしてこの話とは別の話題として(大分後になってから)「条件付き確率」から「確率の乗法定理(その2)」を導く,という順序で説明しています.なので,確率の乗法定理が2回(しかもそのあいだかなり間を挟んでから)登場することになり,それらにどのような関係があるのかがいまいち見えづらいのではないでしょうか.

しかし,上でみたように\[\text{条件付き確率の定義}\rightarrow\text{確率の乗法定理その1}\rightarrow\text{「独立」の定義}\rightarrow\text{確率の乗法定理その2}\]という流れで理解すると,高校教科書では「別々のもの」として載っている2つの確率の乗法定理が同じもの(その1を特殊化したものがその2)であることが明解で,論理的にはしっくりくると個人的に思います.

もっとも,実用上においては(実際問題を解く上では)どちらの理解でも大差はないと思いますが…

ベイズの定理

ベイズの定理\[P(B_i|A)=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P( B_j|A)}\quad(i=1,2,\cdots)\]

(証明)
\[
\begin{align*}
P(B_i|A)&=\frac{P(B_i\cap A)}{P(A)}&\cdots~(1)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A\cap B_j)}&\cdots~(2)\\
&=\frac{P(B_i)P(A|B_i)}{ \sum^{\infty}_{j=1}P(A)P(B_j|A)}&\cdots~(3)
\end{align*}
\]
\((1)\)は条件付き確率の定義そのものです.\((2)\)の分子は確率の乗法定理より,分母は全確率の定理によります.\((2)\)の分母に再び確率の乗法定理を用いると\((3)\)となります.(証明終)

この「ベイズの定理」は,証明の過程を見て貰えば分かる通り,条件付き確率の定義式確率の乗法定理全確率の定理を用いて変形したものに過ぎません.なので,この式は「根っこはあくまで条件付き確率の定義式だ」という認識のもと,あとは(その条件付き確率の定義式を)問題に応じて便宜変形する,というような使い方をすればよいと思います(つまり「条件付き確率」の定義を納得しており,「確率の乗法定理」と「全確率の定理」を知ってさえいればベイズの定理そのものを覚える必要はない,ということ).

このベイズの定理を用いて,次の問題を解いてみます.早稲田大の問題です.

ジョーカーを除いたトランプ52枚の中から1枚のカードを抜き出し,表を見ないで箱の中にしまった.そして残りのカードをよくきってから3枚抜き出したところ,3枚ともダイヤであった.このとき箱の中のカードがダイヤである確率を求めよ.
(早稲田・文)

「抜き出された1枚がダイヤ」という事象を\(A\),「3枚ともダイヤ」という事象を\(B\)とおきます.すると,求める確率は\(P(A|B)\)と表せます.これをベイズの定理を用いて計算してみましょう.
\[
\begin{align*}
P(A|B)&=\frac{P(A\cap B)}{P(B)}\\
&=\frac{P(A)P(B|A)}{P(B\cap A)+P(B\cap \overline{A})}\\
&=\frac{P(A)P(B|A)}{P(A\cap B)+P(\overline{A}\cap B)}\\
&=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}\\
&=\frac{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}{\frac{{}_{13} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{12} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}+\frac{{}_{39} \mathrm{C}_1}{{}_{54} \mathrm{C}_1}\times \frac{{}_{13} \mathrm{C}_3}{{}_{53} \mathrm{C}_3}}\\
&=\frac{10}{49}
\end{align*}
\]
となります.

条件付き確率の直観的理解

条件付き確率の定義事象\(A\),事象\(B\)に対して,確率\[\frac{P(B\cap A)}{P(A)}\]を\(A\)が与えられたときの\(B\)の条件付き確率と呼び,\(P(B|A)\)と書く.

この定義をみても,正直しっくりこないという人は多いと思います.今回はこの条件付き確率の定義の直観的理解を目指してみようと思います.

まず,次の問題を考えてみましょう.

問題
100人の生徒に,次の2つの質問をした.「さんまの内臓を食べるか食べないか」「エビフライのしっぽは食べるか食べないか」.すると,次のような結果を得た.この100人の中から,1人を選び出す.このとき,次の問いに答えよ.

    1. 選び出された生徒が,サンマの内臓を食べる確率
    2. 選び出された生徒が,エビフライのしっぽを食べる確率
    3. 選び出された生徒が,サンマの内臓もエビフライのしっぽも食べる確率
    4. 選び出された生徒が,サンマの内臓は食べるが,エビフライのしっぽは食べない確率
    5. 選び出された生徒が「自分はサンマの内臓は食べますよ~」と発言した.このとき,その生徒がエビフライのしっぽも食べる確率

(解答)

    1. 表をみると全生徒\(100\)人の中でサンマの内臓を食べる人数は\(45\)人ですから,求める確率は\(\frac{45}{100}\)
    2. 表を見ると全生徒\(100\)人の中でエビフライの尻尾を食べる人数は\(67\)人ですから,求める確率は\(\frac{67}{100}\)
    3. 表を見ると全生徒\(100\)人の中でサンマの内臓もエビフライの尻尾も食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{100}\)
    4. 表を見ると全生徒\(100\)人の中でサンマの内臓は食べるが,エビフライの尻尾は食べない人数は\(10\)人ですから,求める確率は\(\frac{10}{100}\)

…と簡単に求められると思います.ここまでウォーミングアップ.問題は5.です.

実際に想像してみましょう.自分の目の前に一人生徒が来た.この生徒がエビフライの尻尾を食べるかどうかを予測したい.そこで,確率を求めようと表を眺めます.この時点では選び出されたその生徒がエビフライの尻尾を食べる確率は\(\frac{67}{100}\)です.図で視覚化すると,

という感じでしょうか.この時点では確率は2.とおんなじです.

しかしここで!その生徒が「自分はサンマの内臓は食べますよ~美味しいですよね~」と喋り,我々がその発言を聞いてしまったとしましょう.すると状況は一変してしまいます.なぜなら,目の前にいる生徒が「サンマの内臓を食べない」という可能性がなくなるから,図中の内臓を食べない(内臓×)という部分が消え失せ,結果として図が下のように変化してしまう(縮んでしまう)からです.

「サンマの内臓を食べる」という発言を聞いてしまった以上,この右側の縮んでしまった図のもとで確率を考え直さねばなりません:全体の人数が\(35+10=45\)で,そのうち尻尾を食べる人数は\(35\)人ですから,求める確率は\(\frac{35}{45}\left(=\frac{7}{9}\right)\)となります.図で視覚化すると,以下のようになります.

このように,「情報が入ることで,図(全事象)が縮む」というのが理解のポイントです.

ではいよいよ上の話を数式に翻訳してみましょう.
題意の確率「『(選び出された生徒が)内臓を食べる』という情報を耳にしたとき,その生徒が尻尾も食べる確率」を\[P(\text{尻尾}|\text{内臓})\]と書くことにしましょう.この確率は,上の議論により
\[
\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}
\]
と書けることになります(下図参照).

したがって,\[P(\text{尻尾}|\text{内臓})=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\]
さらに,分母分子を全体の人数\(n(\text{全体})(=100)\)で割ると
\[
\begin{align*}
P(\text{尻尾}|\text{内臓})&=\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{内臓})}\\
&=\frac{\frac{n(\text{尻尾}\cap \text{内臓})}{n(\text{全体})}}{\frac{n(\text{内臓})}{n(\text{全体})}}=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\end{align*}
\]
となります.したがって,
\[
P(\text{尻尾}|\text{内臓})=\frac{P(\text{尻尾}\cap \text{内臓})}{P(\text{内臓})}
\]
と書けます.さらに,「内臓(内臓を食べる)」という事象を\(A\),「尻尾(尻尾を食べる)」という事象を\(B\)とおけば
\[
P(B|A)=\frac{P(B\cap A)}{P(A)}
\]
となり最初の定義式を得ます.

以上をまとめると,条件付き確率の定義式の直観的イメージは次のようだといえそうです:

    • 情報が入ったことで,全事象が縮んでしまう(事象\(\overline{A}\)が消え,事象\(A\)だけ残る).
    • 縮んだあとの事象\(A\)のもとでの確率を考えることになるから,分母には\(P(A)\)がくる.
    • 分子には,事象\(\overline{A}\)が消えてしまい事象\(A\)だけに縮んでしまった,そのもとでの事象\(B\),すなわち事象\(B\cap A\)の確率\(P(B\cap A)\)がくる.

定義式\(P(B|A)=\frac{P(B\cap A)}{P(A)}\)は上の図のイメージ,すなわち「全事象が縮んだあとの確率計算」という認識をもっておくことが直観的理解のコツ,ということです.

ちなみに,\(P(B|A)\)は高校教科書では\(P_A(B)\)と表現していることに注意してください.どちらも同じ意味で,正しい記法です.が,個人的には\(P(B|A)\)の方をおすすめします.記述の際に書きやすいし,何より気持ち的に\(A\)が\(B\)の『後側』にあることから「\(A\)が\(B\)『背景』にあるんだよ」というニュアンスが伝わりやすいからです.

モンティ・ホール問題

みんな大好きモンティ・ホール問題.

プレーヤーの前に閉じた3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。ここでプレーヤーはドアを変更すべきだろうか?

この有名な問題にはいろいろな考え方があるようですが,ここでは条件付き確率の問題とみて(ベイズの定理を使って)考えてみましょう!

与えられた3つのドアにA,B,Cと名前をつけます.

まず「プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる」とあるので,ここではプレーヤーが部屋Aを選び,モンティが部屋Bのドアを開けたとしましょう.

ここで,プレーヤーに選択権が与えられるわけです.最初の選択(部屋A)を変えずにいるか,それとも部屋Cに選択を変えるか.選び方によって確率は変わるのか,変わらないのか.変わるのであれば,どちらを選択するのが賢明か…?

計算してみましょう.モンティが部屋\(B\)を開けるという事象を「\(B\text{開}\)」,実際に部屋\(X\)に車があるという事象を「\(X\text{車}\)」と書くことにします.

まず,部屋を変えない場合

求めたい確率は「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Aに車がある確率」ですから,\(P(A\text{車}|B\text{開})\)となります.計算してみましょう.

\[
\begin{align*}
P(A\text{車}|B\text{開})&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開})}&\cdots(1)\\
&=\frac{P(A\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}&\cdots(2)\\
&=\frac{\frac{1}{2}}{\frac{1}{2}+1}&\cdots(3)\\
&=\frac{1}{3}
\end{align*}
\]

\((1)\)は条件付き確率の定義そのものです.

\((2)\)の分母について:\(B\text{開}\)という状況,すなわち「モンティが部屋\(B\)を開ける」という状況を詳しく見ると次の3通りが考えられます

      • 車が部屋\(A\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける
      • 車が部屋\(C\)にあって,モンティが部屋\(B\)を開ける

このうち真ん中「車が部屋\(B\)にあって,モンティが部屋\(B\)を開ける」はありえません(モンティはヤギの部屋を開けるわけですから).したがって\[P(B\text{開})=P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})\]となります(全確率の定理).

\((3)\)で\(P(A\text{車}\cap B\text{開})=\frac{1}{2}\)である理由:まず,プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられません.そして今車は部屋\(A\)にありますから,部屋\(B\)と部屋\(C\)にはヤギがいることになります.つまりモンティには部屋\(B\)を開けるか,部屋\(C\)を開けるか2つの選択肢があります.したがって確率は\(\frac{1}{2}\)となります.

\((3)\)で\(P(B\text{開}\cap C\text{車})=1\)である理由:プレーヤーが部屋\(A\)を選んだ以上モンティは部屋\(A\)を開けられず,また部屋\(C\)には実際に車があるのでモンティは部屋\(C\)も開けられません.所以,モンティが開けられるのは部屋\(B\)しかありません.したがって確率は1となります.

以上に気を付けて計算すると確率は\(\dfrac{1}{3}\)になります.

次に,部屋を変える場合

求めたい確率は,「『モンティによって部屋Bが開けられた』という事実のもとで,部屋Cに車がある確率」ですから,\(P(C\text{車}|B\text{開})\)となります.同じように計算してみましょう.

\[
\begin{align*}
P(C\text{車}|B\text{開})&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開})}\\
&=\frac{P(C\text{車}\cap B\text{開})}{P(B\text{開}\cap A\text{車})+P(B\text{開}\cap C\text{車})}\\
&=\frac{1}{\frac{1}{2}+1}=\frac{2}{3}
\end{align*}
\]

よって確率は\(\dfrac{2}{3}\)となります.

結局,部屋を変えたほうがよい(当たる確率が倍になる!)ことが分かります!

ここで用いた考え方は「ベイズの定理」と呼ばれます.このベイズの定理を使うと,とくに難しい局面もないままに単純な計算のもと欲しい確率が手に入ってしまいます.

 

 

部分積分の公式

部分積分法\[\int f(x)g(x)dx=F(x)g(x)-\int F(x)g'(x) dx\]

(証明)

積の微分法より\[(F(x)g(x))’=f(x)g(x)+F(x)g'(x)\]
この式は「微分して\(f(x)g(x)+F(x)g'(x)\)になるような関数が,\(F(x)g(x)\)」ということですから,不定積分が原始関数を表すことを思い出すと\[F(x)g(x)=\int \big( f(x)g(x)+F(x)g'(x) \big)dx\]と書けます.不定積分の線形性より,
\[F(x)g(x)=\int f(x)g(x)dx+\int F(x)g'(x) dx\]
移項すると,\[\int f(x)g(x)dx=F(x)g(x)-\int F(x)g'(x) dx\](証明終)

教科書等だと部分積分の公式は\[\int f'(x)g(x)dx=f(x)g(x)-\int f(x)g'(x) dx\]などと書かれていることが多いので,「まず被積分関数(の一部)を\(f'(x)\)の形にしてから公式を適用する」と認識されがちですが,その使い方はちょっと面倒だと思います.そうではなく,上のように\[\int f(x)g(x)dx=F(x)g(x)-\int F(x)g'(x) dx\]と認識しておけば,結局「片方\(f(x)\)の原始関数(の1つ)を求めて,もう片方\(g(x)\)を微分する」と読め,やるべきことが明解です.もちろん,やっていることは同じなんですがこんな地味なレベルでの認識の違いで覚えやすさ,計算のスピードが変わってくるので意外と大事です.

覚え方:代ゼミの荻野暢也先生の言葉をお借りすれば…「片方積分して,放っておかれたほう微分して引く積分」です!(僕はこの荻野先生の覚え方で覚えました^^;.部分積分するときは未だにこれを頭の中で唱えながら部分積分しています.おすすめです)