今回は標本調査の
検討段階で利用する
サンプルサイズ
許容誤差,信頼水準,回収率
について説明します
[PR]※本サイトには、プロモーションが含まれています
調査の対象を設定し母集団を決める
標本調査を行う時
どのような集団かはっきりと
設定する必要がある
日本人25歳~29歳を対象に
大谷翔平はなんのプロスポーツ選手か尋ねる
世論調査を行った。
この世論調査の対象となる母集団は何か?
日本人25歳~29歳
今回の対象は日本人25~29歳を対象に
しているので60歳の人や、外国人に聞き取りを
行っても意味はありません
調査対象をはっきり
させることが
大切なんだね
許容誤差を決める
許容誤差とは標本調査を行った時
母集団から標本調査の結果から
何%誤差があっても許容するか?
といった誤差の許容範囲です。
例えば許容誤差を5%とし
日本人に一番売れているチョコレートは何かと
調査を行ったとします。
誤差が20%あった場合
調査結果で判明したチョコレートは
日本で一番売れているチョコレートではないのです
標本調査は統計学的に有用な調査ですが
母集団の一部を抽出する調査なので誤差が発生します。
なので許容誤差を設定する必要があります
一般的な許容誤差は
1~10%です
統計学上5%であれば十分信頼できると言えます
先ほどの例題に許容誤差を加えてみます
日本人25歳~29歳を対象に
大谷翔平はなんのプロスポーツ選手か尋ねる
世論調査を行った。
許容誤差を5%と設定する。
5%以内の誤差に
収まるように
調査方法を
考えないとね!
信頼水準を考える
信頼水準とはサンプリングの結果が
許容誤差の範囲内に収まる信頼度です。
許容誤差を5%信頼水準95%と設定した場合
100回検査したら95回は誤差範囲に収まるということです。
統計学上95%あれば十分信頼できます。
100回検査したら
95回は
検査の誤差は
誤差範囲内に
収まるのね!
サンプルサイズを決める。
サンプルサイズは以下の式で求められる
(n=\frac{λ^2p(1-p)}{d^2})
信頼水準 | λの値 |
90% | 1.65 |
95% | 1.96 |
99% | 2.58 |
日本人25歳~29歳を対象に
大谷翔平はなんのプロスポーツ選手か尋ねる
世論調査を行った。
許容誤差を5%信頼水準95%
母集団の大きさを628万
回答率を70%とする。
サンプルサイズの計算式を使って
サンプルサイズを求めよ。
上記の結果より628万人に対し僅か
n=323人のサンプリングで
統計学的には十分である。
難しいこと
考えなくても
公式を使えば
自動的に
決まるんだね!
回収率(回答率)を考慮に入れて調査数を決める
回答率とはn人に調査を行った時に
回答が返ってくる確率です
100人に調査を行って回答率が
70%の場合70人から回答が
得られるものとします
街頭でアンケートを配り600人を対象に
世論調査を行うことにした。
過去同じ世論調査を行っていて
回収率がおおよそ30%を見込めるものとする。
アンケート用紙は何枚準備すればよいだろうか?
\(\frac{600}{0.3}=1800\)
理論上は1800枚準備すれば
600人のサンプリングができると見込めるが
5%位の誤差も想定して・・
1800×1.05 = 1890
1890枚用意します