標本調査シリーズ③です。
今回はサンプル抽出方法の種類、内容について解説していこうと思います。
サンプリング手法一覧
下記に手法を纏める。
サンプリング手法 | 特徴 |
単純無作為抽出法 | サンプルサイズNの母集団から一様な確率でデータを抽出 |
系統抽出法 | サイズNの母集団に番号をつけ規則的にデータを抽出 |
層別抽出法 | 1.母集団をグループ分け(層別) 2.層別されたグループから無作為にデータを抽出 *層のサイズの違いの考慮は必要 |
二層化抽出法 | 母集団の情報がない場合、標本を抽出してその情報を元に層化抽出を行う |
多段抽出法 | 1.母集団を小集団にグループ分け 2.無作為に小集団を抽出する。 3.1,2を繰り返し選んだ集団からにデータを抽出 |
クラスター抽出法 | 1.母集団をクラスターに分ける 2.クラスターを無作為に抽出する。 3.抽出したクラスターで全数調査を行う |
上記の手法について上から解説していきます。
単純無作為抽出法
サンプルサイズNの母集団から一様な確率でデータを抽出する手法です。
母集団の中から標本数を決めてランダムに抽出します
無作為抽出法は確率抽出とも呼ばれています。
くじ引きなど
タイはくじで徴兵が決まるらしいです
「くじが赤だったら」2年間の兵役
「黒だったら兵役免除」になるそうです。
確率は1/5恐ろしい・・
単純無作為抽出法
メリット:ランダム抽出なので公平性がある。精度の評価も簡単
デメリット:データ抽出に時間がかかる。
メリット:ランダム抽出なので公平性がある。精度の評価も簡単
デメリット:データ抽出に時間がかかる。
系統抽出法
サイズNの母集団に番号をつけ規則的にデータを抽出する手法です。
下に手順を示します。
1.ランダムに調査対象を抽出する。
2.次の調査対象を一定の間隔で規則で気に抽出する。
2.次の調査対象を一定の間隔で規則で気に抽出する。
次に図で説明するとこんな感じです。
上の図を言葉で説明します。
1.12人の集団を1~12まで番号をつける。
2.3番の人を選ぶ
3.+3の間隔でサンプリングを行う。
2.3番の人を選ぶ
3.+3の間隔でサンプリングを行う。
系統抽出法
メリット:無作為にデータを取るのは最初だけで間隔を決めれば
サンプリングの対象が自動で決まるので手間がかからない。
デメリット:異なるデータ群などが母集団に存在していると
抽出されたデータに偏りがでる可能性がある。
メリット:無作為にデータを取るのは最初だけで間隔を決めれば
サンプリングの対象が自動で決まるので手間がかからない。
デメリット:異なるデータ群などが母集団に存在していると
抽出されたデータに偏りがでる可能性がある。
層別抽出法
層別抽出法の手順を示す。
1.母集団をグループ分け(層別)
2.層別されたグループから無作為にデータを抽出
*層のサイズの違いの考慮は必要
2.層別されたグループから無作為にデータを抽出
*層のサイズの違いの考慮は必要
次に図で説明するとこんな感じです。
上の図を言葉で説明します。
1.12人の母集団の内男女で層別する。
2.男子は8人女子は4人なので
2:1の比率で男女のグループから無作為に抽出すると男子が2人女子が1人抽出された。
2.男子は8人女子は4人なので
2:1の比率で男女のグループから無作為に抽出すると男子が2人女子が1人抽出された。
層別抽出法
メリット:複数のグループがある母集団に対して有効である
デメリット:母集団の集団を正確につかむ必要がある
メリット:複数のグループがある母集団に対して有効である
デメリット:母集団の集団を正確につかむ必要がある
二層抽出法
母集団の情報がない場合
標本を抽出してその情報を元に層化抽出を行う
二層抽出法の手順を示す。
1.母集団の標本を無作為に抽出
2.抽出した情報を元に層化抽出を行う
2.抽出した情報を元に層化抽出を行う
次に図で説明するとこんな感じです。
層別抽出法
メリット:母集団の比率が分からない場合、標本から推定することによって層化識別を行える。
デメリット:上記のようにサンプルサイズが小さい場合偏りが出る可能性がある。
メリット:母集団の比率が分からない場合、標本から推定することによって層化識別を行える。
デメリット:上記のようにサンプルサイズが小さい場合偏りが出る可能性がある。
多段抽出方法
多段抽出方法の手順を下記に示す。
1.母集団を小集団にグループ分け
2.無作為に小集団を抽出する。
3.1,2を繰り返し選んだ集団からにデータを抽出
2.無作為に小集団を抽出する。
3.1,2を繰り返し選んだ集団からにデータを抽出
次に具体例を使って多段抽出法を説明します。
1.日本を47都道府県に層別する
2.47都道府県から4県を抽出する
3.2県から無作為に2市抽出する
4.各市から30人無作為に抽出する
2.47都道府県から4県を抽出する
3.2県から無作為に2市抽出する
4.各市から30人無作為に抽出する
多段抽出方法
メリット:効率が良い
デメリット:サンプルサイズが小さい場合偏りが出る可能性がある。
メリット:効率が良い
デメリット:サンプルサイズが小さい場合偏りが出る可能性がある。
クラスター抽出法
クラスター抽出方法の手順を下記に示す。
1.母集団をクラスターに分ける
2.クラスターを無作為に抽出する。
3.抽出したクラスターで全数調査を行う
2.クラスターを無作為に抽出する。
3.抽出したクラスターで全数調査を行う
メリット:クラスターの情報があれば効率よく抽出できる。
デメリット:クラスターが層別できる場合同じ層だと偏りが出る可能性がある。
デメリット:クラスターが層別できる場合同じ層だと偏りが出る可能性がある。
まとめ
以上が標本調査について徹底解説第③でした。
いかがだったでしょうか?一旦標本調査は締めたいと思います。
標本調査を使ってまた面白い解析方法思いつきましたら記事にしていこうと思います。