海の中では何万の

ガンマ関数からカイ二乗分布の導出

ガンマ関数からガンマ分布を経由して、カイ二乗分布を導出する。 ガンマ関数は以下のように定義される。

$$ \begin{align} \Gamma(\alpha) = \int_0^\infty x^{\alpha -1}\exp(-x)dx \end{align} $$

ただし、$\alpha>0$ である。 ガンマ分布は次のようになる。ガンマ関数の積分の内の関数を使って、自然なガンマ分布は次のように書ける。$X$が次の分布に従うとする。

$$ \begin{align} f_X(x) = \frac{1}{\Gamma(\alpha)}x^{\alpha -1}\exp(-x) \end{align} $$

$\Gamma(\alpha)$ で除されているのは、分布関数の総和が$1$ という、確率であることの条件を満たすためである。実際、計算すると、次のようになる。

$$ \begin{align} &\int_{-\infty}^{\infty} \frac{1}{\Gamma(\alpha)}x^{\alpha -1}\exp(-x)dx\\ &= \frac{1}{\Gamma(\alpha)} \int_{-\infty}^{\infty} x^{\alpha -1}\exp(-x)dx\\ &= \frac{1}{\Gamma(\alpha)}\Gamma(\alpha)\\ &= 1 \end{align} $$

以降この分布を自然なガンマ分布と呼ぶことにする。一般的なガンマ分布は二つのパラメータを持つ。一般的なガンマ分布へは自然なガンマ分布の変数変換によって、導出することができる。 $Y = \beta X$ とする。ただし、$\beta > 0$ である。 $\frac{dx}{dy} = \frac{1}{\beta}$ であるから、$Y$ の密度関数は次のようになる。

$$ \begin{align} f_Y(y) = \frac{1}{\Gamma(\alpha)} \left( \frac{1}{\beta} \right) \left( \frac{y}{\beta} \right) ^{\alpha -1} \exp\left( -\frac{y}{\beta} \right) \end{align} $$

この分布を$Gamma\left(\alpha, \beta\right)$ として表記する。
次にガンマ分布の特徴を調べる。一般的なガンマ分布へは自然なガンマ分布から導出できることが分かったので、自然なガンマ分布の特徴をまず調べる。以下では、$X$が自然なガンマ分布、$Y$が一般的なガンマ関数にそれぞれ従うとする。 $X$ の積率母関数は次のようになる。

$$ \begin{align} \varphi_X(t) &= E\left[\exp \left( tX \right) \right]\\ &= \int_0^\infty x^{\alpha -1} \exp\left( -\left( 1-t \right)x \right)dx \end{align} $$

ここで、$w = (1-t)x$ と置く。

$$ \begin{align} \varphi_X(t) &= \int_0^\infty \frac{1}{\Gamma(\alpha)} \frac{1}{\left(1-t\right)^{\alpha -1}} \left( \left( 1-t \right) x\right)^{\alpha -1} \exp\left( -\left( 1-t \right)x \right) \frac{1}{1-t}dw\\ &= \frac{1} {\Gamma(\alpha)\left(1-t\right) ^{\alpha}} \int_0^\infty w^{\alpha-1} exp\left( -w \right) dw\\ &= \frac{1}{\left(1-t \right)^\alpha} \end{align} $$

以上より、$X$ の積率母関数が得られた。次に、期待値と分散を求める。積率母関数の一階微分、二階微分を取る。

$$ \begin{align} \varphi_X'(t) &= E\left[X\exp \left( tX \right) \right]\\ &= \frac{\alpha}{\left(1-t \right)^{\alpha+1}} \end{align} $$
$$ \begin{align} \varphi_X''(t) &= E\left[X^2\exp \left( tX \right) \right]\\ &= \frac{ \alpha\left( \alpha + 1 \right) }{\left(1-t \right)^{\alpha+2}} \end{align} $$

それぞれ、$t = 0$ として、$E[X] = \alpha, E[X^2] = \alpha^2 + \alpha$ である。 また、$V[X] = E[X^2] - \left(E[X]\right)^2 = \alpha$ である。
したがって、自然なガンマ関数の期待値、分散は$\alpha$ である。 次に、一般的なガンマ関数の特性を求める。積率母関数は次のようになる。

$$ \begin{align} \varphi_Y(t) &= E\left[\exp \left( tY \right) \right]\\ &= E\left[\exp \left( \beta tX \right) \right]\\ &= \frac{1}{\left(1-\beta t \right)^\alpha} \end{align} $$

一階微分、二階微分を取る。

$$ \begin{align} \varphi_Y'(t) &= E\left[Y\exp \left( tY \right) \right]\\ &= \frac{\alpha\beta}{\left(1-\beta t \right)^{\alpha+1}} \end{align} $$
$$ \begin{align} \varphi_Y''(t) &= E\left[Y^2\exp \left( tY \right) \right]\\ &= \frac{ \alpha \left( \alpha + 1 \right) \beta^2 }{\left(1-\beta t \right)^{\alpha+2}} \end{align} $$

よって、期待値、分散は次のようになる。

$$ \begin{align} E[Y] &= \alpha\beta\\ E[Y^2] &= \alpha\left(\alpha+1 \right)\beta^2\\ V[Y] &= E[Y^2] - \left(E[Y]\right)^2\\ &= \alpha\left(\alpha+1 \right)\beta^2 - \alpha^2\beta^2\\ &= \alpha\beta^2 \end{align} $$

よって、一般的なガンマ分布の平均は$\alpha\beta$、分散は$\alpha\beta^2$ である。


次に、カイ二乗分布を考える。$\chi^2_2(n) = Gamma(\frac{n}{2}, 2)$ が成り立つ。ここで、$\chi^2_2(n)$ は自由度$n$ のカイ二乗分布である。 確率変数$X$ がカイ二乗分布に従うとすると、以下の分布がカイ二乗分布である。

$$ f_X(x) = \frac{1}{\Gamma(\frac{n}{2})}\frac{1}{2} \left( \frac{x}{2} \right) ^{\frac{n}{2} -1} \exp\left( -\frac{x}{2} \right) $$

以上より、ガンマ関数からカイ二乗分布を導出することができた。カイ二乗分布はガンマ分布の一種なので、積率母関数、期待値と分散はガンマ分布から流用することができる。それぞれ、以下のようになる。

$$ \begin{align} \varphi_X(t) &= E\left[\exp \left( tX \right) \right]\\ &= \frac{1}{\left( 1-2t \right) ^{\left( \frac{n}{2} \right)} } \end{align} $$
$$ \begin{align} E[X] &= \frac{n}{2}2 =n\\ V[X] &= \frac{n}{2}4 =2n \end{align} $$

したがって、自由度nのカイ二乗分布の期待値は$n$ 、分散は$2n$ である。

カイ二乗分布はやや複雑な構造を持っていて、形を忘れてしまうことがしばしばある。しかし、以上のように ガンマ関数の定義と$\chi^2_2(n) = Gamma(\frac{n}{2}, 2)$の二点を覚えていれば、カイ二乗分布を復元することができる。