統計的仮説検定

前回書いた区間推定というのは、標本から母集団に対する推測を行うことである。 (たとえば標本から母集団の平均値を推測する) これを統計的推測という。 これに対して、統計的仮説検定というのは、母集団についてある仮説を立て、それが正しいかどうかを標…

区間推定(信頼度・信頼区間)

母集団の性質(平均値など)を知りたいが全員に調査するのは大変なので、サンプルを選んで行う調査が標本調査だった。 何回も標本抽出を繰り返して標本を集め、それぞれの標本の平均値の分布(標本分布)の平均値は、母集団の平均値とみなしてよいということ…

標本分布

母集団では人数が多くて調査しきれないため、サンプルを選んで行う調査が標本調査だった。 標本調査についてはこちら 標本調査を行う目的は、あくまで母集団の性質を知ることである。 しかし標本でわかる特徴(たとえば平均値)は、たまたま選ばれた人たちの…

標本調査

統計のための調査(アンケートなど)は、全員に行うのが大変なため、ほとんどの場合サンプル(標本)を抽出して行う。 全員に対して行うのが全数調査(census survey)(国勢調査など)、調査対象者を選んで行うのが標本調査(sample survay)である。 標本を選…

ばらつきを表すー分散・標準偏差

集めたデータの特徴をあらわすものに、データのばらつきというものがある。ばらつきとは、個々のデータが平均値からどれだけ離れているか、ということである。 ばらつきが大きいとは、平均から離れたデータが多いということであり、グラフに表すと個々のデー…

ばらつきを表すー多様性指数

集めたデータの特徴をあらわすものに、データのばらつきというものがある。 データのばらつき具合(つまり、個々のデータがどれだけ平均値から離れているか)を表すものには次のものがある。 ひとつは離散変数に対して用いるもので、「多様性指数(D)」とい…

代表値

あるデータの性質をあらわすものに、代表値とばらつき具合がある。 (このふたつがわかれば、どんなデータかがある程度わかる)代表値とは、文字通りそのデータを代表する値のこと。 以下のようなものがある。 最頻値・・・最も分布の多い値。あてはまるデー…

離散変数と連続変数

変数というのは、調査対象者によって変化する値(状態)のことをいう。 たとえば「生活満足度に男女差があるか」という調査だったら、 「生活満足度」も変数だし、男・女という状態も変数である。 (ちなみにこの場合、男女の違いという原因によって生活満足…

独立変数と従属変数

統計学では、因果関係について調べる。 因果関係とは、ある要因によってもう一方の要因の結果に差が出るかどうか、ということである。 そのとき、原因となる要因のことを「独立変数」 その結果現れるものを「従属変数」 という。 例)牛乳を飲む小学生ほど、…

統計学とは

統計学とは、社会や科学などの事象(それも集団)についてデータを集め、それを分析・解釈し、背後にある構造についてなんらかの結論(関連性など)を導き出して、それを今後に生かすための学問である。 データをきちんと見ることができないと、誤った結論に…