調査研究に適した統計的仮説検定を選ぶ際の7つの重要項目
実験などから得られたデータの統計処理を行う場合、どの統計手法を用いればよいのか、この方法でよいのか分からないということも多いと思います。統計的仮説検定の選択を誤ると、研究結果への信頼性に疑問を持たれたり、論文が不採用にされたりすることになりかねません。この記事では、母集団の分布の型(パラメトリック/ノンパラメトリック)の違いから、統計的仮説検定の手法を選択するために重要な項目について解説します。 統計的仮説検定とは 統計検定(hypothesis testing)、あるいは統計的仮説検定(statistical hypothesis testing)とは、ある仮説が正しいのか否かを統計学的に検証する方法です。2つのデータセットが互いに有意に異なるかどうかを数学的に検定するもので、母集団分布の母数に関する仮説を標本から得た情報(データ)に基づいて統計学的な方法で検証し、対象となる変数の母集団に関する条件になんらかの差があるといえるかどうかについて確率論的な分析を行うものです。統計的仮説検定では、平均、標準偏差、変動係数などいくつかの統計的尺度を用いて計算し、それらをあらかじめ決められた基準のセットと比較します。もしデータが基準を満たせば、2つのデータセット間に有意差があると結論づけることができます。 分析するデータの種類によって、使用できる統計的仮説検定は異なりますが、一般的な手法としては、t検定、カイ二乗検定、分散分析(ANOVA)などが挙げられます。 統計的仮説検定の種類 統計的仮説検定にはいくつかの手法があり、解析の種類 や母集団の分布などに適した手法を選択する必要があります。最初に母集団のデータ分布を事前に仮定している(パラメトリック検定)か、仮定していない(ノンパラメトリック検定)かを大別して、解析の種類を狭めていきます。 1.パラメトリック検定 パラメトリック検定とは、データの母集団が何らかの分布に従っていると仮定している場合に用いられる検定手法です。分布を決める際の重要な要素(パラメータ)を持っており、事前にデータの分布が仮定できるものに用いられます。特定の分布に従っていると想定できる観測値(データ)に対して実施することで、データの分布が想定したモデルと一致しているか否かを主張する際の定量的な根拠となります。一般的なパラメトリック検定としては、回帰分析、比較分析、相関分析が挙げられます。 1.1.回帰分析 回帰分析とは、データにおける関係性や影響力を調べる統計的な手法で、主に原因と結果の関係を推測する際に利用されます。回帰分析には、単回帰分析と、その応用ともいえる重回帰分析、さらにロジスティック回帰分析があります。 単回帰分析は、従属変数と独立変数の間の関係を直線で示すもので、2つの量的変数の関係、つまり目的の変数に対して説明の変数がどのように影響を与えているかを示す式(回帰式)を導き出されます。…