スピアマンの相関係数:定義
スピアマンの順位相関係数またはスピアマン相関係数は、順位相関(2つの変数間の順位の統計的依存性)のノンパラメトリック尺度である。
チャールズ・スピアマンにちなんで命名され、ギリシャ文字の「 ρ」 (ロー)で表記されることが多く、主にデータ分析に用いられる。
ランク付けされた2つの変数の間の関連性の強さと方向を測定する。 しかし、スピアマンの相関係数について話す前に、まずピアソンの相関を理解することが重要である。 ピアソン相関は、一対のデータ間の線形関係の強さを示す統計的尺度である。
ランキング変数の計算と有意性検定には、以下のデータ仮定が成り立つことが必要である:
データが上記の仮定を満たさない場合は、スピアマンの係数が必要になります。 スピアマン相関係数を理解するためには、単調関数とは何かを知る必要がある。 単調関数とは、独立変数の増加に伴って、減少することも増加することもない関数のことである。 単調関数は以下の画像を使って説明できる:
画像は単調関数の3つの概念を説明しています:
- 単調増加:x’変数が増加し、’y’変数が減少しないとき。
- 単調減少:x’変数は増加するが、’y’変数は増加しない場合。
- 単調ではない:x’変数が増加し、’y’変数が時に増加し、時に減少するとき。
単調関係は、ピアソン係数で使用される線形関係に比べて制約が少ない。 単調性はスピアマンの相関係数の最終的な要件ではないが、変数間の関係が非単調であることがすでに分かっていた場合、単調な関係の強さと方向を実際に決定せずにスピアマンの相関を追求することは意味がない。
もっと詳しく例で見る芝の分析
スピアマンの相関係数:計算式と計算例
ここで
n=2変数のデータ点数
di=「i番目」の要素のランクの差
スピアマン係数⍴は+1から-1の間の値をとる、
- 値が+1であれば、ランクの完全な関連を意味する。
- ⍴ の値が0であれば、ランク間の関連はないことを意味する。
- ⍴ の値が-1であれば、順位間の関連は完全に否定的であることを意味する。
の値が0に近いほど、2つのランク間の関連性は弱い。
スピアマンの順位相関係数に進む前に、データの順位付けができなければならない。 一方の変数を増加させると、他方の変数が単調関係に従うかどうかを観察することが重要である。
どのレベルでも、2つの変数の値を比較する必要がある。 計算方法はこうだ:
歴史と地理の9人の成績は下表の通り。
ステップ1-得られたデータの表を作成する。
ステップ2-2つのデータセットの順位付けから始める。 データの順位付けは、列の中で最も大きい数字に「1」、2番目に大きい数字に「2」というように、順位を割り当てることで実現できる。 通常、最小の値が最下位となる。 これは、両方の測定セットに対して行う必要がある。
ステップ3-データセットに3列目のdを追加する。ここでdはランク間の差を示す。 例えば、最初の生徒の物理のランクが3で数学のランクが5であれば、ランクの差は3である。 4列目にd値を二乗する。
歴史 | 順位 | 地理 | 順位 | d | Dスクエア |
35 | 3 | 30 | 5 | 2 | 4 |
23 | 5 | 33 | 3 | 2 | 4 |
47 | 1 | 45 | 2 | 1 | 1 |
17 | 6 | 23 | 6 | 0 | 0 |
10 | 7 | 8 | 8 | 1 | 1 |
43 | 2 | 49 | 1 | 1 | 1 |
9 | 8 | 12 | 7 | 1 | 1 |
6 | 9 | 4 | 9 | 0 | 0 |
28 | 4 | 31 | 4 | 0 | 0 |
12 |
ステップ4- dスクエアの値をすべて足すと、12(∑dスクエア)になる。
ステップ5-計算式にこれらの値を入れる
=1-(6*12)/(9(81-1))
=1-72/720
=1-01
=0.9
このデータのスピアマンの順位相関は0.9であり、前述の通り、⍴の値が+1に近ければ、両者の順位は完全に関連していることになる。
さらに詳しくコンジョイント分析-定義、種類、例、アルゴリズムとモデル
QuestionProで相関係数を実施する方法
このセクションでは、アンケートのスピアマンの順位相関係数を実行する方法について説明します。
ステップ 1:マイアンケートにアクセスし、アンケートを選択します。
ステップ2:「分析」の「相関分析」をクリックする
ステップ 3:詳細なレポートを得るには、スピアマン係数の生成ボタンをクリックします。
上記の例では、仕事経験と月収という2つの変数の関係を調べるために、スピアマンの相関係数が使われている。 一般的な考え方として、月収は職務経験とともに増加するはずであり、これは2つの変数の間に正の関連があるはずであることを意味し、これはrs値0.97によって証明されている。
さらに詳しくGAP分析 – 定義、方法、テンプレート(例付き