超幾何分布

意味
\(M\)個のボールと\(N-M\)個の白いボールが入っている壺の中から\(K\)個のボールを無作為に非復元抽出で抽出する.赤いボールの個数が\(X\)であったとするとき,この\(X\)が従う分布.

確率分布
\[P(X=x | N,M,K)=\frac{\left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)}{\left(\begin{array}{c} N \\ K \\ \end{array} \right)},\quad x=0,1,\cdots,K\]
また,
\[\displaystyle \sum_{x=0}^{K}P(X=x | N,M,K)=1 \tag{1}\]

平均
\[\displaystyle E[X]=\frac{KM}{N} \tag{2}\]

分散
\[\displaystyle Var[X]=\frac{N-K}{N-1}K\frac{K}{N}\left(1-\frac{M}{N}\right) \tag{3}\]

\((1)\)の証明

天下りではあるがここで\((a+b)^N=(a+b)^M(a+b)^{N-M}\)の両辺を展開し,その第\(K\)項の係数を比較する.
\[
\begin{align}
\text{左辺}=&(a+b)^N\\
=&a^0b^N {}_N \mathrm{C} _0 + a^1b^{N-1} {}_N \mathrm{C} _{N-1} + \cdots + a^Kb^{N-K} {}_N \mathrm{C} _K + \cdots + a^Nb^0 {}_N \mathrm{C} _{N}
\end{align}
\]

よって左辺第\(K\)項の係数は\({}_N \mathrm{C} _K=\left(\begin{array}{c} N \\ K \\ \end{array} \right)\).

\[
\begin{align}
\text{左辺}=&(a+b)^M(a+b)^{N-M}\\
=&(a^0b^M {}_M \mathrm{C} _0 + a^1b^{M-1} {}_M \mathrm{C} _1 + \cdots + a^Kb^{M-K} {}_M \mathrm{C} _K + \cdots + a^Mb^0 {}_M \mathrm{C} _{M})\\
&\times (a^0b^{N-M} {}_{N-M} \mathrm{C} _0 + a^1b^{(N-M)-1} {}_{N-M} \mathrm{C} _1 + \cdots + a^Kb^{(N-M)-K} {}_{N-M} \mathrm{C} _K + \cdots + a^Mb^0 {}_{N-M} \mathrm{C} _{N-M})
\end{align}
\]

この式を展開したときの第\(K\)項の係数は,

左の因数から\(a^0b^M {}_M \mathrm{C} _0\)を選び,右の因数から\(a^K b^{(N-M)-K} {}_{N-M}\mathrm{C} _K\)を選び,それらを掛け合わせたもの
左の因数から\(a^1b^{M-1} {}_{M} \mathrm{C} _1\)を選び,右の因数から\(a^{K-1}b^{(N-M)-(K-1)} {}_{N-M}\mathrm{C} _{K-1}\)を選び,それらを掛け合わせたもの

左の因数から\(a^Kb^{M-K} {}_M \mathrm{C} _K\)を選び,右の因数から\(a^0b^{N-M} {}_{N-M}\mathrm{C} _0\)を選び,それらを掛け合わせたもの

を足し加えることで,

\[
\begin{align}
&{}_M \mathrm{C} _0 {}_{N-M} \mathrm{C} _{K} + {}_M \mathrm{C} _1 {}_{N-M} \mathrm{C} _{K-1} + \cdots + {}_M \mathrm{C} _K {}_{N-M} \mathrm{C} _{0}\\
=& \displaystyle \sum_{x=0}^{K} {}_M \mathrm{C} _x {}_{N-M} \mathrm{C} _{K-x}\\
=& \displaystyle \sum_{x=0}^{K} \left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)
\end{align}
\]

となる.したがって,

\[\displaystyle \sum_{x=0}^{K} \left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)=\left(\begin{array}{c} N \\ K \\ \end{array} \right)\]

を得る.両辺を\(\left(\begin{array}{c} N \\ K \\ \end{array} \right)\)で割ることで

\[\displaystyle \sum_{x=0}^{K} \frac{\left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)}{\left(\begin{array}{c} N \\ K \\ \end{array} \right)}= 1\]

すなわち

\[\displaystyle \sum_{x=0}^{K}P(X=x | N,M,K)=1\](証明終)

© 2022 佐々木数学塾, All rights reserved.