ねこらぼノート

Practice and Theory of Thinking for Business, Science and Life

2変数データ(質的データの定量的把握)

2変数データ(質的データ)の定量的把握についてスピアマンの順位相関係数を説明する。

目次

関係の向きと強さの指標

関係があり、1つの関係であり、直線関係であることを前提として、質的データ(順序尺度)の定量的な指標として、スピアマンの順位相関係数とケンドールの順位相関係数がある。ここではスピアマンの順位相関係数について説明する。

なお、名義尺度でも順序尺度として扱えば、順位相関係数を求めることができる。

スピアマンの順位相関係数

スピアマンの順位相関係数と名前はついているが、計算方法はピアソンの積率相関係数と同じである。xとyの共分散を $COV(x, y)$ 、標準偏差をそれぞれ、$S_{x}$、$S_{y}$とすると、順位相関係数は次式となる。

$$ \begin{equation} r = \frac{ COV(x, y) }{ S_{x} S_{y} } \end{equation} $$

スピアマンの順位相関係数とピアソンの積率相関係数の違いは入力データにある。スピアマンの順位相関係数の場合はxとyが順位である。

具体的には次のようなデータとなる(参考文献1より好きな花の順番)。

バラ ユリ チューリップ カーネーション 椿
男(x) 1 2 3 4 5 6 7 8
女(y) 3 1 2 5 4 7 6 8

ピアソンの積率相関係数については、過去記事を参照ください。

note.nekolabs.net

まとめ

2変数データ(質的データ)の定量的把握について、スピアマンの順位相関係数を説明した。

参考文献

  1. 統計学入門, 東京大学教養学部統計学教室 編, 東京大学出版会

統計学入門 (基礎統計学?)

統計学入門 (基礎統計学?)