Calculați coeficientul de corelare a rangului lui Spearman

Cu coeficientul de corelație Spearman rang puteți determina dacă relația dintre cele două variabile printr-o funcție monotonă (care este, în cazul în care un număr este mai mare, celălalt este mai mare și vice-versa) pot fi exprimate. Urmați acest ghid simplu pentru a face calculul manual sau pentru a calcula coeficientul de corelație în Excel sau R.

metodă

Metoda 1
Cu mâna

Imaginea intitulată Table_338
1
Faceți un tabel de date. Acest lucru vă va ajuta să înțelegeți dimensiunile pe care trebuie să le calculați pentru coeficientul de corelare Spearman rank. Tabelul trebuie să aibă următorul format:
  • 6 coloane cu titlurile prezentate mai jos.
  • Cât de multe linii aveți ca perechi de date.
  • Imaginea intitulată Table2_983
    2
    Introduceți perechile de date în primele două coloane.
  • Imaginea intitulată Table3_206
    3
    Dați datele din prima coloană din coloana a treia un rang de la 1 la n (numărul de date pe care îl aveți). Dați cel mai mic număr un rang de 1, cel de-al doilea cel mai mic număr de rang 2 și așa mai departe.
  • Imaginea intitulată Table4_228
    4
    Faceți același lucru în coloana a patra ca la pasul 3, dar aranjați datele în coloana a doua.
    • Imaginea intitulată Mean_742
      Dacă două (sau mai multe) date dintr-o coloană sunt identice, determinați media rangurilor pe care ar avea-o în mod normal date și le acordați rangul lor ca rang.
      În exemplul de pe dreapta, există două 5s care ar avea în mod normal rândurile 2 și 3. Din moment ce există două 5s, luați-le pe rândul lor. Media 2 și 3 este de 2,5, astfel încât cei 5 ai dvs. să obțină rangul 2.5.
  • Imaginea intitulată Table5_263
    5
    În coloana "d", se calculează diferența dintre cele două numere din fiecare pereche de ranguri. Adică, dacă cineva are rangul 1 și celălalt la rangul 3, atunci diferența este 2 (semnul nu contează, pentru că pasul următor, acest număr este pătrat).
  • Imaginea intitulată Table6_205
    6
    Testați fiecare dintre numerele din coloana "d" și scrieți aceste valori în coloana "d"2“.
  • 7
    Adăugați toate valorile în coloana "d2“. Această valoare este Σd2.
    Imaginea intitulată Step7_812
  • 8
    Alegeți una dintre aceste formule:
    • Dacă nu a existat nici o obligație (aceleași valori) în pașii anteriori, atunci puneți această valoare în formula simplificată a Spearman coeficientului de corelație


      Imaginea intitulată Step8_271

      și înlocuiți "n" cu numărul de perechi de date pe care le aveți la dispoziție pentru calcul.
      Imaginea intitulată Step9_402
    • Dacă au existat legături (aceleași valori) în oricare dintre pașii anteriori, utilizați în schimb coeficienții de corelare produs-moment al rangurilor.
  • 9
    Interpretați rezultatul. Poate fi între -1 și 1.
    • Lângă -1 - Corelație negativă.
    • Aproape 0 - nu există o corelație liniară.
    • Aproape de 1 - Corelație pozitivă.
  • Metoda 2
    În Excel

    1. 1
      Creați noi coloane cu rangurile coloanelor existente. De exemplu, în cazul în care datele din coloana A2: A11, puteți folosi formula „= RANK (A2, A $ 2: $ A 11)“ utilizare și copia în mod corespunzător pentru toate rândurile și coloanele.
    2. 2
      Tratați legăturile așa cum este descris în etapele 3 și 4 din Metoda 1.
    3. 3
      Într-o celulă nouă, faceți corelația între cele două coloane de rang folosind ceva de genul "= CORREL (C2: C11, D2: D11)". În acest caz, C și D ar corespunde coloanelor de rang. Celula de corelare conține apoi coeficientul de corelare Spearman rank.

    Metoda 3
    Cu R

    1. 1
      Obțineți R dacă nu îl aveți deja (vezi https://r-project.org).
    2. 2
      Salvați datele dvs. ca fișier CSV cu datele pe care doriți să le corelați în primele două coloane. De obicei, puteți face acest lucru cu meniul "Salvați ca".
    3. 3
      Deschideți editorul R. Dacă utilizați un terminal, trebuie doar să scrieți R. Pe desktop, puteți face clic pe sigla R.
    4. 4
      Introduceți următoarele comenzi:
      • d <- read.csv("NAME_DEINER_CSV-DATEI.csv") und drücke auf Eingabe
      • cor (rank (d [1]), rangul (d) [2])

    Sfaturi

    • Setul dvs. de date ar trebui să conțină cel puțin 5 perechi de date pentru a detecta o tendință (în acest exemplu, 3 au fost utilizate pentru a face mai ușoară).

    avertismente

    • Coeficientul de corelație a rangului Spearman poate identifica doar puterea corelației deoarece datele cresc sau scad constant. Dacă un complot scatter al datelor arată alte tendințe, atunci Spearman Rank nu reprezentarea corectă a corelației.
    • Această formulă se bazează pe ipoteza că nu există obligațiuni. Dacă există legături ca în exemplu, definiția ar trebui să folosească: coeficientul de corelație produs-moment al randurilor.
    Distribuiți pe rețelele sociale:

    înrudit