超幾何分布の性質

超幾何分布において,\(N \rightarrow \infty,~\frac{M}{N} \rightarrow p\)とすると,\(2\)項分布\(Bin(K,p)\)に収束する.\[\lim_{N \rightarrow \infty}P(X=x | N,M,K)=\left(\begin{array}{c} K \\ x \\ \end{array} \right)p^{x}(1-p)^{K-x}\]
証明
\[
\begin{align}
&P(X=x | N,M,K)\\
=&\frac{\left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)}{\left(\begin{array}{c} N \\ K \\ \end{array} \right)}\\
=&\frac{\frac{M!}{x!(M-x)!}\frac{(N-M)!}{(K-x)!(N-M-(K-x))!}}{\frac{N!}{K!(N-K)!}}\\
=&\frac{K!(N-K)!}{N!}\frac{M!}{x!(M-x)!}\frac{(N-M)!}{(K-x)!(N-M-(K-x))!}\\
=&\frac{K!}{x!(K-x)!} \times \frac{1}{N(N-1)\cdots(N-(K-1))}\\
&\times \frac{M(M-1)\cdots(M-(x-1))}{1}\\
&\times \frac{(N-M)\cdots (N-M-(K-x-1))}{1}\\
=&\left(\begin{array}{c} K \\ x \\ \end{array} \right)\frac{\overbrace{M(M-1)\cdots(M-(x-1))}^{x\text{個}}\times\overbrace{(N-M)\cdots (N-M-(K-x-1))}^{K-x\text{個}}}{\underbrace{N(N-1)\cdots(N-(K-1))}_{K\text{個}}}\\
=&\left(\begin{array}{c} K \\ x \\ \end{array} \right)\frac{\frac{M}{N}(\frac{M}{N}-\frac{1}{N})\cdots(\frac{M}{N}-\frac{x-1}{N})\times(1-\frac{M}{N})\cdots (1-\frac{M}{N}-\frac{K-x-1}{N})}{1(1-\frac{1}{N})\cdots(1-\frac{K-1}{N})}\\
\rightarrow &~\left(\begin{array}{c} K \\ x \\ \end{array} \right)p^x(1-p)^{K-x}
\end{align}
\]
(証明終)

超幾何分布

意味
\(M\)個のボールと\(N-M\)個の白いボールが入っている壺の中から\(K\)個のボールを無作為に非復元抽出で抽出する.赤いボールの個数が\(X\)であったとするとき,この\(X\)が従う分布.

確率分布
\[P(X=x | N,M,K)=\frac{\left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)}{\left(\begin{array}{c} N \\ K \\ \end{array} \right)},\quad x=0,1,\cdots,K\]
また,
\[\displaystyle \sum_{x=0}^{K}P(X=x | N,M,K)=1 \tag{1}\]

平均
\[\displaystyle E[X]=\frac{KM}{N} \tag{2}\]

分散
\[\displaystyle Var[X]=\frac{N-K}{N-1}K\frac{K}{N}\left(1-\frac{M}{N}\right) \tag{3}\]

\((1)\)の証明

天下りではあるがここで\((a+b)^N=(a+b)^M(a+b)^{N-M}\)の両辺を展開し,その第\(K\)項の係数を比較する.
\[
\begin{align}
\text{左辺}=&(a+b)^N\\
=&a^0b^N {}_N \mathrm{C} _0 + a^1b^{N-1} {}_N \mathrm{C} _{N-1} + \cdots + a^Kb^{N-K} {}_N \mathrm{C} _K + \cdots + a^Nb^0 {}_N \mathrm{C} _{N}
\end{align}
\]

よって左辺第\(K\)項の係数は\({}_N \mathrm{C} _K=\left(\begin{array}{c} N \\ K \\ \end{array} \right)\).

\[
\begin{align}
\text{左辺}=&(a+b)^M(a+b)^{N-M}\\
=&(a^0b^M {}_M \mathrm{C} _0 + a^1b^{M-1} {}_M \mathrm{C} _1 + \cdots + a^Kb^{M-K} {}_M \mathrm{C} _K + \cdots + a^Mb^0 {}_M \mathrm{C} _{M})\\
&\times (a^0b^{N-M} {}_{N-M} \mathrm{C} _0 + a^1b^{(N-M)-1} {}_{N-M} \mathrm{C} _1 + \cdots + a^Kb^{(N-M)-K} {}_{N-M} \mathrm{C} _K + \cdots + a^Mb^0 {}_{N-M} \mathrm{C} _{N-M})
\end{align}
\]

この式を展開したときの第\(K\)項の係数は,

左の因数から\(a^0b^M {}_M \mathrm{C} _0\)を選び,右の因数から\(a^K b^{(N-M)-K} {}_{N-M}\mathrm{C} _K\)を選び,それらを掛け合わせたもの
左の因数から\(a^1b^{M-1} {}_{M} \mathrm{C} _1\)を選び,右の因数から\(a^{K-1}b^{(N-M)-(K-1)} {}_{N-M}\mathrm{C} _{K-1}\)を選び,それらを掛け合わせたもの

左の因数から\(a^Kb^{M-K} {}_M \mathrm{C} _K\)を選び,右の因数から\(a^0b^{N-M} {}_{N-M}\mathrm{C} _0\)を選び,それらを掛け合わせたもの

を足し加えることで,

\[
\begin{align}
&{}_M \mathrm{C} _0 {}_{N-M} \mathrm{C} _{K} + {}_M \mathrm{C} _1 {}_{N-M} \mathrm{C} _{K-1} + \cdots + {}_M \mathrm{C} _K {}_{N-M} \mathrm{C} _{0}\\
=& \displaystyle \sum_{x=0}^{K} {}_M \mathrm{C} _x {}_{N-M} \mathrm{C} _{K-x}\\
=& \displaystyle \sum_{x=0}^{K} \left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)
\end{align}
\]

となる.したがって,

\[\displaystyle \sum_{x=0}^{K} \left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)=\left(\begin{array}{c} N \\ K \\ \end{array} \right)\]

を得る.両辺を\(\left(\begin{array}{c} N \\ K \\ \end{array} \right)\)で割ることで

\[\displaystyle \sum_{x=0}^{K} \frac{\left(\begin{array}{c} M \\ x \\ \end{array} \right)\left(\begin{array}{c} N-M \\ K-x \\ \end{array} \right)}{\left(\begin{array}{c} N \\ K \\ \end{array} \right)}= 1\]

すなわち

\[\displaystyle \sum_{x=0}^{K}P(X=x | N,M,K)=1\](証明終)