Date Tags 統計

正規母集団に対する仮説検定

  • 『統計学入門』第12章より

早見表

何の検定 検定統計量 自由度 分布
母平均(母分散既知) \(\frac{\overline{X}-\mu}{\sqrt{\sigma^2/n}}\) 標準正規分布 \(N(0,1)\)
母平均(母分散未知) \(\frac{\overline{X}-\mu}{\sqrt{s^2/n}}\) \(n-1\) t分布
母分散 \(\frac{(n-1)s^2}{\sigma_{0}^2}\) \(n-1\) \(\chi^2\) 分布
2分布の平均(分散が等しい) \(\frac{\overline{X}-\overline{Y}}{\frac{(m-1)s_1^2+(n-1)s_2^2}{m+n-2}\sqrt{\frac{1}{m}+\frac{1}{n}}}\) \(m+n-2\) t分布
2分布の平均(分散が等しくない) \(\frac{\overline{X}-\overline{Y}}{\sqrt{s_1^2/m+s_2^2/n}}\) \(\frac{(s_1^2/m+s_2^2/n)^2}{\frac{(s_1^2/m)^2}{m-1}+\frac{(s_2^2/n)^2}{n-1}}\)に最も近い整数 t分布
2分布の分散 \(\frac{s_1^2}{s_2^2}\) \((m-1, n-1)\) F分布
表の度数分布 \(\sum_{i=1}^k\frac{(f_i-np_i)^2}{np_i}\) \(k-1\) \(\chi^2\) 分布
分割表の属性の独立 \(\sum_{i=1}^r\sum_{j=1}^c\frac{(nf_{ij}-f_{i\cdot}f_{\cdot j})^2}{nf_{i\cdot}f_{\cdot j}}\) \((r-1)(c-1)\) \(\chi^2\) 分布

母平均に関する検定

  • 母分散が既知のとき
    • 検定統計量 \(Z\)\(\overline{X}\) の標準化変数 である
    • つまり \(Z=\frac{\overline{X}-\mu}{\sqrt{\sigma^2/n}}\) である
    • 帰無仮説が正しければ、これは 標準正規分布N(0, 1) に従う
  • 母分散が未知のとき
    • 検定統計量 \(Z\)\(\overline{X}\) の標準化変数の母分散 \(\sigma^2\) を不偏分散 \(s^2\) に置き換えたもの である
    • つまり \(Z=\frac{\overline{X}-\mu}{\sqrt{s^2/n}}\) である
    • 帰無仮説が正しければ、これは 自由度 \(n-1\) のt分布 \(t(n-1)\) に従う
    • これをスチューデントのt検定と呼ぶ

母分散に関する検定

  • 検定統計量は \(\chi^2=\frac{(n-1)s^2}{\sigma_{0}^2}\)
  • これは帰無仮説のもとで 自由度 \(n-1\)\(\chi^2\) 分布 に従う
  • これを \(\chi^2\) 検定という

母平均の差の検定

  • 2つの分布の結果に差があるかどうかを検定する
  • それぞれ大きさ \(m, n\) の標本 \(X_1, \cdots, X_m, Y_1, \cdots, Y_n\) とする
  • \(X, Y\)の不偏分散をそれぞれ\(s_1^2, s_2^2\)とする

  • 分散が等しいとき

    • 合併した分散\(s^2\)\(s^2=\frac{(m-1)s_1^2+(n-1)s_2^2}{m+n-2}\) と表せる
    • このとき検定統計量は \(t=\frac{\overline{X}-\overline{Y}}{s\sqrt{1/m+1/n}}\)
    • これは 自由度 \(m+n-2\) の t分布 \(t(m+n-2)\) に従う
  • 分散が等しくないとき
    • 検定統計量は \(t=\frac{\overline{X}-\overline{Y}}{\sqrt{s_1^2/m+s_2^2/n}}\)
    • \(\nu=\frac{(s_1^2/m+s_2^2/n)^2}{\frac{(s_1^2/m)^2}{m-1}+\frac{(s_2^2/n)^2}{n-1}}\) とおき、\(\nu^\ast\)\(\nu\) に最も近い整数とすると、 \(t\)は近似的に 自由度 \(\nu^\ast\) のt分布 \(t(\nu^\ast)\) に従う
    • この検定はウェルチの検定と呼ばれる

母分散の比の検定

  • 母分散が等しいかどうかを調べたいときの検定
  • それぞれ大きさ \(m, n\) の標本 \(X_1, \cdots, X_m, Y_1, \cdots, Y_n\) とする
  • \(X, Y\)の不偏分散をそれぞれ\(s_1^2, s_2^2\)とする

  • ここで検定統計量であるフィッシャーの分散比は \(F=\frac{s_1^2}{s_2^2}\)

  • これは帰無仮説のもとで 自由度 \((m-1, n-1)\) のF分布 \(F(m-1, n-1)\) に従う
  • これをF検定という

様々な \(\chi^2\) 検定

適合度の検定

  • 適合度の \(\chi^2\) 検定
    • 仮定された確率分布に対して、標本から求められた度数が適合するかどうかを検証する検定
  • 以下のような表を考える
    • 理論確率は仮定した確率
    • 理論度数は(サンプル数)×(理論確率)
カテゴリ \(A_1\) \(A_2\) \(\cdots\) \(A_k\)
観測度数 \(f_1\) \(f_2\) \(\cdots\) \(f_k\) \(n\)
理論確率 \(p_1\) \(p_2\) \(\cdots\) \(p_k\) \(1\)
理論度数 \(np_1\) \(np_2\) \(\cdots\) \(np_k\) \(n\)
  • 検定統計量はピアソンの適合度基準 \(\chi^2=\sum_{i=1}^k\frac{(f_i-np_i)^2}{np_i}\)
  • これは \(n\) が大きいとき 自由度 \(k-1\)\(\chi^2\) 分布 \(\chi^2(k-1)\) に従う

分割表と独立性の検定

  • 属性 \(A\) がカテゴリ \(A_1, A_2, \cdots, A_r\) 、属性 \(B\) がカテゴリ \(B_1, B_2, \cdots, B_c\) をもつような分割表を考える
    • つまりは以下のような分割表である
カテゴリ \(B_1\) \(B_2\) \(\cdots\) \(B_c\)
\(A_1\) \(f_{11}\) \(f_{12}\) \(\cdots\) \(f_{1c}\) \(f_{1\cdot}\)
\(A_2\) \(f_{21}\) \(f_{22}\) \(\cdots\) \(f_{2c}\) \(f_{2\cdot}\)
\(\cdots\) \(\cdots\) \(\cdots\) \(\cdots\) \(\cdots\) \(\cdots\)
\(A_r\) \(f_{r1}\) \(f_{r2}\) \(\cdots\) \(f_{rc}\) \(f_{r\cdot}\)
\(f_{\cdot 1}\) \(f_{\cdot 2}\) \(\cdots\) \(f_{\cdot c}\) \(n\)
  • 属性 \(A\) と属性 \(B\) が 独立 であるかどうかを検定したい
    • 独立性の \(\chi^2\) 検定と呼ばれる
    • 独立 とは \(A_i \cap B_j\) に対して、\(P(A_i \cap B_j)=P(A_i)P(B_j)\) が成立すること
  • 帰無仮説 \(H_0\) : 任意の \(i, j\) に対して \(P(A_i \cap B_j)=P(A_i)P(B_j)\) が成立
  • 検定統計量 \(\chi^2=\sum_{i=1}^r\sum_{j=1}^c\frac{(f_{ij}-f_{i\cdot}f_{\cdot j}/n)^2}{f_{i\cdot}f_{\cdot j}/n}=\sum_{i=1}^r\sum_{j=1}^c\frac{(nf_{ij}-f_{i\cdot}f_{\cdot j})^2}{nf_{i\cdot}f_{\cdot j}}\)
  • これは 自由度 \((r-1)(c-1)\)\(\chi^2\) 検定 に従う

中心極限定理を用いる検定

  • 母集団分布が正規分布でなくても、中心極限定理が成立するなど検定統計量が近似的に正規分布に従う場合、正規分布に対する検定の手続きをそのまま用いることができる
    • ex. 二項分布の標本数が多い場合、検定統計量は中心極限定理により、標本数が多くなると標準正規分布に従う