【仮説検定】2つの母平均の差に関する検定と推定

検定推定
あい
あい

今回は2つの
母平均の差に
関する検定と
推定を
説明
していきます!

[PR]※本サイトには、プロモーションが含まれています

2つの母平均の差に関する検定

例題

ある工場で機械1と機械2を利用して
飲料をビンに詰める工程があった
目標は80gである
機械1で作った製品を11個

機械2で作った製品を10個
ずつ取得した結果以下のデータが得られた

No1234567891011
機械17881788286857872777980
機械281848281787788898791

機械1から作られた製品の母集団の分布を\(N(μ_1,σ_1^2)\)
機械2から作られた製品の母集団の分布を\(N(μ_2,σ_2^2)\)と仮定する
\(μ_1\)と\(μ_2\)が等しいかどうかの検定を行え

Yamu
Yamu

母平均から取得できる
値は以下の性質を
持つことを利用します

\(x_{11},x_{12},x_{13},…,x_{1n}\)が
\(N(μ_1,σ_1^2)\)に従い
\(x_{21},x_{22},x_{33},…,x_{3n}\)が
\(N(μ_2,σ_2^2)\)に従う時

\(\bar x_1-\bar x_2\)は\(\displaystyle N(μ_1-μ_2,\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2})\)
に従う

Yamu
Yamu

この性質を利用すると
検定統計量の計算は
以下のようになります

\(\displaystyle u_0=\frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{\frac{σ_1^2}{n_1}+\frac{σ_2^2}{n_2}}}\)

Yamu
Yamu

\(σ_1 , σ_2\)の
値を考えて
行きます

母分散の関係

Yamu
Yamu

分散が一致している
ものとしていない

もので統計量の計算を
分けます

条件統計量
\(σ_1,σ_2\)未知
\(σ_1^2=σ_2^2\)
\(\displaystyle \frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
\(σ_1,σ_2\)未知
\(σ_1^2=σ_2^2\)かわからない場合
\(\displaystyle \frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}}\)

\(σ_1^2=σ_2^2\)と推定する場合

統計量は

\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\)

Vは

\(V=\frac{S_1+S_2}{(n_1-1)+(n_2-1)}\)

tは自由度\(n_1+n_2-2\)のt分布に従う

\(σ_1^2≠σ_2^2\)の場合

統計量tは

\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)-(μ_1-μ_2)}{\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}}\)

統計量tは自由度\(Φ*\)のt分布に近似的に従う

\(Φ*\)等価自由度とよばれ次式により求められる

\(Φ*=(\frac{V_1}{n_1}+\frac{V_2}{n_2})^2/[({\frac{V_1}{n_1}})^2/Φ_1+(\frac{V_2}{n_2})^2/Φ_2]\)

2つの母平均に関する検定手順

\(σ_1,σ_2未知\) \(σ_1^2=σ_2^2\)と考えられる場合

1.帰無仮説,対立仮説を設定す

帰無仮説\(H_0\)\(μ_1=μ_2\)
対立仮説\(H_1\)\(μ_1 \neq μ_2\)
対立仮説\(H_1\)\(μ_1 > μ_2\)
対立仮説\(H_1\)\(μ_1 < μ_2\)

2.有意水準αを定める

3.手順1,2を見て棄却域を求める

対立仮説棄却域
\(H_1:μ_1\neqμ_2\)\(❘t_0❘≧t(Φ_1+Φ_2,α)\)
\(H_1:μ_1<μ_2\)\(t_0<-t(Φ_1+Φ_2,2α)\)
\(H_1:μ_1>μ_2\)\(t_0>t(Φ_1+Φ_2,2α)\)

4.データから検定統計量\(t_0\)を求める
\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}\)
\(\displaystyle V=\frac{S_1+S_2}{(n_1-1)+(n_2-1)}\)
\(Φ_1=n_1-1\),\(Φ_2=n_2-1\)

5.\(t_0\)の値が棄却域にあれば有意と判定,\(H_0\)を棄却する

\(σ_1,σ_2未知\) \(σ_1^2\neqσ_2^2\)と考えられる場合

1.帰無仮説,対立仮説を設定する(welchの検定)

帰無仮説\(μ_1=μ_2\)
対立仮説\(μ_1 \neq μ_2\)
対立仮説\(μ_1 > μ_2\)
対立仮説\(μ_1 < μ_2\)

2.有意水準αを定める

3.手順1,2を見て棄却域を求める

対立仮説棄却域
\(H_1:μ_1\neqμ_2\)\(❘t_0❘≧t(Φ*,α)\)
\(H_1:μ_1<μ_2\)\(t_0<-t(Φ*,2α)\)
\(H_1:μ_1>μ_2\)\(t_0>t(Φ*,2α)\)

4.データから検定統計量\(t_0\)を求める

\(\displaystyle t_0=\frac{(\bar x_1-\bar x_2)}{\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}}\)
\(Φ*=(\frac{V_1}{n_1}+\frac{V_2}{n_2})^2/[({\frac{V_1}{n_1}})^2/Φ_1+(\frac{V_2}{n_2})^2/Φ_2]\)

5.\(t_0\)の値が棄却域にあれば有意と判定,\(H_0\)を棄却する

Yamu
Yamu

\(σ_1=σ_2\)かどうかで
平均値の差の検定は統計量が
変わってくるんですね!

分散の判断材料として
予備検定といった
手法で判断を
行います

予備検定

分散が等分散であるか判断するには
まず予備検定を行い確認します。
予備検定の手順は最初に
\(H_0\)
:\(σ_1^2=σ_2^2\)
\(H_1\):\(σ_1^2\neqσ_2^2\)
と設定し、F検定を行い有意水準20%で検定を行います。

あい
あい

分散の検定手順に
ついて知りたい方は
こちらから!

予備検定の結果によって検定手順が
変わってくるので表に纏めました。

分散の検定結果検定手順
\(H_0\)が棄却\(σ_1^2\neqσ_2^2\)の検定手順に進む
\(H_0\)が採択\(σ_1^2=σ_2^2\)の検定手順に進む

なぜ予備検定の有意水準が20%なのか

\(n_1\)と\(n_2\)が2倍以上異なってくると
t検定は分散の違いに関してロバストではなくなり
\(σ_1 \neq σ_2\)の場合\(σ_1^2=σ_2^2\)の
検定を行ってしまうと検定は正しいものでは
なくなってしまう
なので本来\(H_1:σ_1^2\neqσ_2^2\)であるのに
\(H_0\)と判定されてしまう確率を
小さくするために有意水準20
%を取る

2つの母集団の検定を正しく行うにはデータ数\(n_1,n_2\)
をできるだけ等しくすることが大切です!

検出率に関しては
以下の記事に記載しています!

例題

例題

ある工場で機械1と機械2を利用して
飲料をビンに詰める工程があった
目標は80gである
機械1で作った製品を11個機械2で作った製品を10個
ずつ取得した結果以下のデータが得られた

No1234567891011
機械17881788286857872777980
機械281848281787788898791

機械1から作られた製品の母集団の分布を\(N(μ_1,σ_1^2)\)
機械2から作られた製品の母集団の分布を\(N(μ_2,σ_2^2)\)と仮定する
\(μ_1\)と\(μ_2\)が等しいかどうかの検定を行え

等分散の検定(予備検定)を行う

帰無仮説 \(H_0:σ_1^2=σ_2^2\)
対立仮説 \(H_0:σ_1^2\neq σ_2^2\)

有意水準は\(α=0.2\)

\(S_1=150.54\)
\(V_1=15.05\)

\(S_2=205.6\)
\(V_2=22.8\)

\(V_2>V_1\)より
\(\displaystyle \frac{V_2}{V_1}=1.51\)

\(F(Φ_2,Φ_1;α/2)=F(9,10;0.1)\)
\(F(9,10;0.1)=2.35\)

\(F_0<F(9,10,0.1)\)となるので有意ではない
\(H_0\)を採択し母平均の差の検定に進む

\(σ_1,σ_2未知\) \(σ_1^2=σ_2^2\)の検定を行う

棄却域を設定する

\(R:❘t_0❘>t(18,0.05)=2.101\)

検定統計量を計算する

\(\displaystyle V=\frac{S_1+S_2}{n_1+n_2-2}\)
\(\displaystyle V=\frac{150.54+205.6}{18}=19.78\)

\(\displaystyle t_0=\frac{\bar x_1-\bar x_2}{\sqrt{V(1/n_1+1/n_2)}}\)

\(\bar x_1=79.63\)
\(\bar x_2=83.8\)

\(\displaystyle t_0=\frac{79.63-83.8}{\sqrt{19.78(1/11+1/10)}}=-2.14\)

検定結果

\(R:❘t_0❘>t(18,0.05)=2.101\)となるので有意である
\(H_0\)を棄却し\(μ_1はμ_2\)と異なると言える

Yamu
Yamu

結果が出ました

最後に母分散が
異なっていたとして
検定をやっていきます

Welchの検定例題

帰無仮説,対立仮説を立てる

\(H_0:μ_1=μ_2\)
\(H_1:μ_1\neqμ_2\)

有意水準を決める

\(α=0.05\)

棄却域を設定する

\(❘t_0❘≧t(Φ*,0.05)\)

\(\displaystyle t_0=\frac{\bar x_1-\bar x_2 }{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}\)
\(\displaystyle t_0=\frac{79.63-83.8}{\sqrt{\frac{15.05}{11}+\frac{22.8}{10}}}=-2.18\)

\(Φ*=(\frac{V_1}{n_1}+\frac{V_2}{n_2})^2/[({\frac{V_1}{n_1}})^2/Φ_1+(\frac{V_2}{n_2})^2/Φ_2]\)

\(Φ*=17.4\)
\(❘t_0❘≧t(17,0.05)=2.11\)

検定結果

\(R:❘t_0❘>t(17,0.05)=2.11\)となるので有意である
\(H_0\)を棄却し
\(μ_1はμ_2\)と異なると言える

推定

Yamu
Yamu

点推定と区間推定
について紹介していきます

2つの母平均の差の推定公式
\(σ_1^2,σ_2^2未知,σ_1^2=σ_2^2の場合\)
点推定:\(μ_1-μ_2=\bar x_1-\bar x_2\)
区間推定:信頼率100(1-α)%の\(μ_1-μ_2\)の信頼区間
\(\bar x_1-\bar x_2 -t(Φ_1+Φ_2,α)\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}\)
\(\bar x_1-\bar x_2 +t(Φ_1+Φ_2,α)\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}\)

2つの母平均の差の推定公式
点推定:\(μ_1-μ_2=\bar x_1-\bar x_2\)
区間推定:信頼率100(1-α)%の\(μ_1-μ_2\)の信頼区間
\(\bar x_1-\bar x_2 -t(Φ*,α)\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}\)
\(\bar x_1-\bar x_2 +t(Φ*,α)\sqrt{(\frac{V_1}{n_1}+\frac{V_2}{n_2})}\)

参考文献

入門統計解析法

まとめ

今回は2つの母集団の平均の差の検定について
解説を行っていきます

タイトルとURLをコピーしました