今回は2つの
母平均の差に
関する検定と
推定を説明
していきます!
[PR]※本サイトには、プロモーションが含まれています
2つの母平均の差に関する検定
ある工場で機械1と機械2を利用して
飲料をビンに詰める工程があった
目標は80gである
機械1で作った製品を11個
機械2で作った製品を10個
ずつ取得した結果以下のデータが得られた
No | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
機械1 | 78 | 81 | 78 | 82 | 86 | 85 | 78 | 72 | 77 | 79 | 80 |
機械2 | 81 | 84 | 82 | 81 | 78 | 77 | 88 | 89 | 87 | 91 | – |
機械1から作られた製品の母集団の分布を\(N(μ_1,σ_1^2)\)
機械2から作られた製品の母集団の分布を\(N(μ_2,σ_2^2)\)と仮定する
\(μ_1\)と\(μ_2\)が等しいかどうかの検定を行え
母平均から取得できる
値は以下の性質を
持つことを利用します
\(x_{11},x_{12},x_{13},…,x_{1n}\)が
\(N(μ_1,σ_1^2)\)に従い
\(x_{21},x_{22},x_{33},…,x_{3n}\)が
\(N(μ_2,σ_2^2)\)に従う時
\(\bar x_1-\bar x_2\)は\(\displaystyle N(μ_1-μ_2,\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2})\)
に従う
この性質を利用すると
検定統計量の計算は
以下のようになります
\(\displaystyle u_0=\frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)
\(σ_1 , σ_2\)の
値を考えて
行きます
母分散の関係
分散が一致している
ものとしていない
もので統計量の計算を
分けます
条件 | 統計量 |
\(σ_1,σ_2\)未知 \(σ_1^2=σ_2^2\) | \(\displaystyle \frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\) |
\(σ_1,σ_2\)未知 \(σ_1^2=σ_2^2\)かわからない場合 | \(\displaystyle \frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}}\) |
\(σ_1^2=σ_2^2\)と推定する場合
統計量は
\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
Vは
\(V=\frac{S_1+S_2}{(n_1-1)+(n_2-1)}\)
tは自由度\(n_1+n_2-2\)のt分布に従う
\(σ_1^2≠σ_2^2\)の場合
統計量tは
\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}}\)
統計量tは自由度\(Φ*\)のt分布に近似的に従う
\(Φ*\)は等価自由度とよばれ次式により求められる
\(Φ*=(\frac{V_1}{n_1}+\frac{V_2}{n_2})^2/[({\frac{V_1}{n_1}})^2/Φ_1+(\frac{V_2}{n_2})^2/Φ_2]\)
2つの母平均に関する検定手順
\(σ_1,σ_2未知\) \(σ_1^2=σ_2^2\)と考えられる場合
1.帰無仮説,対立仮説を設定する
帰無仮説 | \(H_0\) | \(μ_1=μ_2\) |
対立仮説 | \(H_1\) | \(μ_1 \neq μ_2\) |
対立仮説 | \(H_1\) | \(μ_1 > μ_2\) |
対立仮説 | \(H_1\) | \(μ_1 < μ_2\) |
2.有意水準αを定める
3.手順1,2を見て棄却域を求める
対立仮説 | 棄却域 |
\(H_1:μ_1\neqμ_2\) | \(❘t_0❘≧t(Φ_1+Φ_2,α)\) |
\(H_1:μ_1<μ_2\) | \(t_0<-t(Φ_1+Φ_2,2α)\) |
\(H_1:μ_1>μ_2\) | \(t_0>t(Φ_1+Φ_2,2α)\) |
4.データから検定統計量\(t_0\)を求める
\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
\(\displaystyle V=\frac{S_1+S_2}{(n_1-1)+(n_2-1)}\)
\(Φ_1=n_1-1\),\(Φ_2=n_2-1\)
5.\(t_0\)の値が棄却域にあれば有意と判定し,\(H_0\)を棄却する
\(σ_1,σ_2未知\) \(σ_1^2\neqσ_2^2\)と考えられる場合
1.帰無仮説,対立仮説を設定する(welchの検定)
帰無仮説 | \(μ_1=μ_2\) |
対立仮説 | \(μ_1 \neq μ_2\) |
対立仮説 | \(μ_1 > μ_2\) |
対立仮説 | \(μ_1 < μ_2\) |
2.有意水準αを定める
3.手順1,2を見て棄却域を求める
対立仮説 | 棄却域 |
\(H_1:μ_1\neqμ_2\) | \(❘t_0❘≧t(Φ*,α)\) |
\(H_1:μ_1<μ_2\) | \(t_0<-t(Φ*,2α)\) |
\(H_1:μ_1>μ_2\) | \(t_0>t(Φ*,2α)\) |
4.データから検定統計量\(t_0\)を求める
\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)}{\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}}\)
\(Φ*=(\frac{V_1}{n_1}+\frac{V_2}{n_2})^2/[({\frac{V_1}{n_1}})^2/Φ_1+(\frac{V_2}{n_2})^2/Φ_2]\)
5.\(t_0\)の値が棄却域にあれば有意と判定し,\(H_0\)を棄却する
\(σ_1=σ_2\)かどうかで
平均値の差の検定は統計量が
変わってくるんですね!
分散の判断材料として
予備検定といった
手法で判断を
行います
予備検定
分散が等分散であるか判断するには
まず予備検定を行い確認します。
予備検定の手順は最初に
\(H_0\):\(σ_1^2=σ_2^2\)
\(H_1\):\(σ_1^2\neqσ_2^2\)
と設定し、F検定を行い有意水準20%で検定を行います。
分散の検定手順に
ついて知りたい方は
こちらから!
予備検定の結果によって検定手順が
変わってくるので表に纏めました。
分散の検定結果 | 検定手順 |
\(H_0\)が棄却 | \(σ_1^2\neqσ_2^2\)の検定手順に進む |
\(H_0\)が採択 | \(σ_1^2=σ_2^2\)の検定手順に進む |
なぜ予備検定の有意水準が20%なのか
\(n_1\)と\(n_2\)が2倍以上異なってくると
t検定は分散の違いに関してロバストではなくなり
\(σ_1 \neq σ_2\)の場合\(σ_1^2=σ_2^2\)の
検定を行ってしまうと検定は正しいものでは
なくなってしまう。
なので本来\(H_1:σ_1^2\neqσ_2^2\)であるのに
\(H_0\)と判定されてしまう確率を
小さくするために有意水準20%を取る
2つの母集団の検定を正しく行うにはデータ数\(n_1,n_2\)
をできるだけ等しくすることが大切です!
検出率に関しては
以下の記事に記載しています!
例題
ある工場で機械1と機械2を利用して
飲料をビンに詰める工程があった
目標は80gである
機械1で作った製品を11個機械2で作った製品を10個
ずつ取得した結果以下のデータが得られた
No | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
機械1 | 78 | 81 | 78 | 82 | 86 | 85 | 78 | 72 | 77 | 79 | 80 |
機械2 | 81 | 84 | 82 | 81 | 78 | 77 | 88 | 89 | 87 | 91 | – |
機械1から作られた製品の母集団の分布を\(N(μ_1,σ_1^2)\)
機械2から作られた製品の母集団の分布を\(N(μ_2,σ_2^2)\)と仮定する
\(μ_1\)と\(μ_2\)が等しいかどうかの検定を行え
等分散の検定(予備検定)を行う
帰無仮説 \(H_0:σ_1^2=σ_2^2\)
対立仮説 \(H_0:σ_1^2\neq σ_2^2\)
有意水準は\(α=0.2\)
\(S_1=150.54\)
\(V_1=15.05\)
\(S_2=205.6\)
\(V_2=22.8\)
\(V_2>V_1\)より
\(\displaystyle \frac{V_2}{V_1}=1.51\)
\(F(Φ_2,Φ_1;α/2)=F(9,10;0.1)\)
\(F(9,10;0.1)=2.35\)
\(F_0<F(9,10,0.1)\)となるので有意ではない
\(H_0\)を採択し母平均の差の検定に進む
\(σ_1,σ_2未知\) \(σ_1^2=σ_2^2\)の検定を行う
棄却域を設定する
\(R:❘t_0❘>t(18,0.05)=2.101\)
検定統計量を計算する
\(\displaystyle V=\frac{S_1+S_2}{n_1+n_2-2}\)
\(\displaystyle V=\frac{150.54+205.6}{18}=19.78\)
\(\displaystyle t_0=\frac{\bar x_1-\bar x_2}{\sqrt{V(1/n_1+1/n_2)}}\)
\(\bar x_1=79.63\)
\(\bar x_2=83.8\)
\(\displaystyle t_0=\frac{79.63-83.8}{\sqrt{19.78(1/11+1/10)}}=-2.14\)
検定結果
\(R:❘t_0❘>t(18,0.05)=2.101\)となるので有意である。
\(H_0\)を棄却し\(μ_1はμ_2\)と異なると言える
結果が出ました
最後に母分散が
異なっていたとして
検定をやっていきます
Welchの検定例題
帰無仮説,対立仮説を立てる
\(H_0:μ_1=μ_2\)
\(H_1:μ_1\neqμ_2\)
有意水準を決める
\(α=0.05\)
棄却域を設定する
\(❘t_0❘≧t(Φ*,0.05)\)
\(\displaystyle t_0=\frac{\bar x_1-\bar x_2 }{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
\(\displaystyle t_0=\frac{79.63-83.8}{\sqrt{\frac{15.05}{11}+\frac{22.8}{10}}}=-2.18\)
\(Φ*=(\frac{V_1}{n_1}+\frac{V_2}{n_2})^2/[({\frac{V_1}{n_1}})^2/Φ_1+(\frac{V_2}{n_2})^2/Φ_2]\)
\(Φ*=17.4\)
\(❘t_0❘≧t(17,0.05)=2.11\)
検定結果
\(R:❘t_0❘>t(17,0.05)=2.11\)となるので有意である。
\(H_0\)を棄却し
\(μ_1はμ_2\)と異なると言える
推定
点推定と区間推定
について紹介していきます
2つの母平均の差の推定公式
\(σ_1^2,σ_2^2未知,σ_1^2=σ_2^2の場合\)
点推定:\(μ_1-μ_2=\bar x_1-\bar x_2\)
区間推定:信頼率100(1-α)%の\(μ_1-μ_2\)の信頼区間
\(\bar x_1-\bar x_2 -t(Φ_1+Φ_2,α)\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}\)
\(\bar x_1-\bar x_2 +t(Φ_1+Φ_2,α)\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}\)
2つの母平均の差の推定公式
点推定:\(μ_1-μ_2=\bar x_1-\bar x_2\)
区間推定:信頼率100(1-α)%の\(μ_1-μ_2\)の信頼区間
\(\bar x_1-\bar x_2 -t(Φ*,α)\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}\)
\(\bar x_1-\bar x_2 +t(Φ*,α)\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}\)
参考文献
まとめ
今回は2つの母集団の平均の差の検定について
解説を行っていきます