標本調査

統計のための調査(アンケートなど)は、全員に行うのが大変なため、ほとんどの場合サンプル(標本)を抽出して行う。


全員に対して行うのが全数調査(census survey)国勢調査など)、調査対象者を選んで行うのが標本調査(sample survay)である。


標本を選ぶ作業が標本抽出(サンプリング)であり、その抽出方法はいくつかある。(後述)
標本が選ばれると、その標本データを分析し、部分から全体(母集団)の特徴について推測を行うことになる。


標本についていえることが、母集団についてそのままあてはまるわけではない
たとえば標本の特徴から母集団の分布の特徴を推測するには、いくつか注意点がある。(別途)
また、標本でいえる特徴がどのくらいの精度で母集団についても言えるかを表す尺度がある。(標準誤差・信頼度・区間推定)
さらに、標本から母集団についての仮説を立て(母集団の平均や比率についての仮説)、それがどのくらいの精度で母集団についても言えるかを計算し、精度が高い場合(間違っている可能性が低い場合)にその仮説を採用する、といったこともできる。(仮説検定)


<標本抽出の方法>
標本は、偏りなく集めた方が、母集団についてより正確に推測することができる。


1)無作為抽出法(random sampling)
調査する人が、意図的でなく、まったくの偶然で標本を選ぶやり方。
単純無作為抽出・・・母集団の誰もがまったく同じ確率で選ばれる可能性がある。
全対象者に通し番号をふっておき、乱数表から選ぶ。ただしこのやり方はとても手間がかかる。
系統無作為抽出(等間隔サンプリング)・・・最初のひとつの抽出のみ乱数を使用し、そこから等間隔の番号の人を選ぶ。
層別(層化)無作為抽出・・・母集団をいくつかの層(年齢、性別、職業など)に分け、その層内から単純無作為抽出によってそれぞれサンプルを選ぶ。ただし人数の多い層からはそれに比例した人数のサンプルを選ぶようにする。
多段無作為抽出・・・母集団を何段階かに分けて抽出を行う。
例)第一段階は市町村を抽出し、第二段階では選挙区を抽出し、最後に個人を抽出する、など)


2)有意抽出法
調査する人が意図的に基準を設けて標本を選び出すもの。
たとえば、化粧品会社が、OLを対象としたアンケートを行うのに、20代の都市部に住む女性に限定して行う、など。