どうも、”のなめ”です。
今回は、QC検定に登場するサンプリングの問題についてまとめます。といいつつ、QC検定の受験対策的な感じなので、詳しくはないです!(きっぱり!)
こういうブログ形式の記事だと、結構詳しく記載あると思いますが、ここでは詳しくは書かずゆる~く行きたいと思います。
サンプリングとは?
サンプリングとは、母集団から標本を抜き出すことをいいます。
母集団とは、調査をしたい集まり(全体)のことを指しています。例えば、「部品メーカから納入した部品1,000個」とか「〇〇大学の学生500人」等です。
標本とは、母集団から抜き取ったもの(上の文でいうと、例えば部品1,000個中の10個や、500人中25人等)になります。
なんとなくはイメージつくかなと思います。
サンプリングをすることで、標本の特性が分かります。その特性を母集団の特性として仮定することができます。大量にある母集団を全部調べるのは大変ですからね。。。
単純ランダムサンプリング
まずは、単純ランダムサンプリングです。私にとってはなじみ?があるサンプリングになります。
母集団から無作為に標本を抜き出す方法になります。例えば、下記写真のように、箱に部品が全部(母集団)入っていて、適当にバッ!と10個取り出す感じですね。抜き出す人の意思は関係ないのです!
Excelでも「ランダム関数」なんてのもありますので、イメージがつきやすいと思いかな?
系統サンプリング
つぎに、系統サンプリングです。
生産ライン等の母集団を一定間隔に標本を抜き出す方法になります。
例えば、マヨネーズの容器がベルトコンベアに乗って連なっている場面が、たまにテレビとかで見かけるかと思います。その連なった状態で、100個おきとか1,000個おきなんかで抜き出したりします。(数は適当です。)
また、社員に番号を振って10人置きに抜き出したりなんてのも系統サンプリングになります。
下記は、プレス品ですけどイメージつきますかね~
層別サンプリング
3つ目に層別サンプリングになります。正直この後から自分にとっては少しややこしく理解できてるかな?って感じです。。。
母集団をいくつかの層(まとまり)に分けてから、各層でランダムサンプリングをします。
「なんで、いくつかの層にまとめるの?」って思うかもしれませんが、サンプリングをする母集団に偏りがあったりするときに使うようです。例えば、男性と女性で傾向が違うデータとか、大学生と高校生で傾向が違うデータ等、全部ひっくるめてサンプリングをしちゃうと、正しい特性が得られないときに使われる。
サンプリングの誤差を小さくするためには、層内のばらつきは小さくする必要があります。(層間のばらつきは大きくすること)
集落サンプリング
4つ目に集落サンプリングになります。集落サンプリングも母集団を一度分けます。
母集団をいくつかの集落にし、集落をランダムサンプリング。その後、サンプリングした集落をすべてを確認します。(下記写真のような集落をイメージするとわかりやすいのかな?)
もう少しだけ。
たとえば、一箱6本入りの2Lペットボトルが100箱(計600本)あったとします。この一つ一つの箱が集落になるということですね。100箱全部を確認するのは大変なので、100箱中5箱を選んで、5箱にあるすべて(5×6=30本)を調べることで、母集団の特性を仮定するわけです。
集落サンプリングは、集落間の差を小さく、集落内のばらつきを大きくなるように設定します。
2段サンプリング
最後に2段サンプリングになります。
第一段階として、母集団から部分母集団に分かれているとき、部分母集団からランダムサンプリングをします。第二段階として、第一段階で抜き出した標本をそれぞれをさらに抜き出します。
「どういうこっちゃ?」って思います?
たとえば、とある企業に10の部署があったとします。この10部署が部分母集団に位置します。第一段階として、10部署から3部署をランダムサンプリングします。第二段階として、サンプリングした3部署それぞれから5人をランダムサンプリングをして完了です。
ランダムサンプリングを段階を踏んで実施しているということですね!
まとめ
まとめになります。5つのサンプリングを記載しましたが、層別サンプリング、集落サンプリング、2段サンプリングについては、どれも段階を踏んでいる感じで、ちょっと迷う時があります。
しかし本記事でまとめてみてわかったのは、「しっかりとイメージをすること」「サンプリングにも特性・使える場面が違う」ことがわかりました!
そのほかにも有意サンプリングがあるみたいですが、割愛します!