統計用語

記述統計:データの集積する手続きのこと。最も一般的なものは平均値と標準偏差である。この手続きは,単にそのデータの特徴を記述するだけで,それについて何の推論も行わないため、記述的といわれる。

推測統計:サンプルから得られたデータに基づいて,母集団の一般的な特徴を推測するために用いられる統計的手続き。数学的な確率理論に基づく。一般的なものとしては、t検定や分散分析が有名。

サンプル:測定しようとする母集団の部分集合。場合によっては、母集団を代表していない可能性があることに注意。

無作為抽出したサンプル:無作為抽出したサンプルとは,その母集団のあらゆる成員が,その選択において互いに等しい確率で取り出されたサンプルである。サンプルが母集団を代表した状態を実現するために無作為抽出を行う。

仮説:現象に介在する要因(変数)の間の関係を,統一的に説明するために設けた仮定。仮説は実験的に検証することが可能なように,データによって支持されたか否かが確認できるような形式で表現されなければならない。仮説を統計的に検定する場合は、背理法に似た否定の論法を用いる。ある実験仮説“]aと]bの間に差がある:]a>]bまたは]aく]b”を証明したいときは,その仮説と反対の“]aと]bの間に差はない:]a=]b”という統計的仮説を設ける。この統計的仮説が,一定の基準以下の確率でしか起こらないまれな関係(事象)であるときは,統計的仮説を棄却し,実験仮説を受け入れる。統計的仮説は棄却されることを目的として立てられた仮説という意味で,帰無仮説とよび,帰無仮説以外の仮説,“]a>]b”,“]a<]b”,“]a≠]b”を対立仮説という。

統計的に有意:実験や調査の結果えられた値に条件の間で差があったとしても、偶然(誤差による変動)によって生じたものである可能性が考えられる。その差が誤差による変動のみによって生じる確率を計算して,その確率が十分に小さいとき,その差は(統計的に)有意であるという。統計的有意性を判断する際の基準となる確率を有意水準あるいは危険率とよぶ。

正規分布:測定値の確率分布として想定される最も基本的な分布。左右対称で,最頻値,中央値,平均値が一致する。この他に,統計的仮説検定でよく用いられる確率分布として, χ2分布(chi-square distribution), t分布(t-distribution),F分布(F-distribution)などがある。

対応がある:比較する2つ以上のデータが,すべて同じ被験者から得られたものである場合,それらのデータには対応があるという。

対応がない:比較する2つ以上のデータが,それぞれ異なる被験者から得られたものである場合,それらのデータには対応がないという。

t検定:2つの平均値の差を比較するための統計的仮説検定の手続きの1つ。検定の際にt分布を用いることからこの名がある。

分散:分布のひろがりを表わす測度の1つ。偏差(deviation)(観測値と算術平均の差)の2乗の総和を,観測値の個数または個数−1で割ったもの。

分散分析2つ以上の平均値や2つ以上の変数・要因を組み合わせた条件下での平均値を比較するための統計的仮説検定の手続きの1つ。

参考文献
利島・生和(1993)心理学のための実験マニュアル,北大路書房