Calculați covarianța

Covariance este un calcul statistic care vă ajută să înțelegeți cum se raportează două seturi de date între ele. De exemplu, să presupunem că antropologii studiază mărimea și greutatea unei populații umane într-o cultură. Pentru fiecare persoană din studiu, mărimea și greutatea pot fi reprezentate de o pereche de date (x, y). Aceste valori pot fi utilizate într-o formulă standard pentru a calcula relația de covarianță. Acest articol explică mai întâi calculele care afișează covarianța unui set de date. Apoi se adresează celorlalte două metode automatizate pentru a afla rezultatul.

metodă

Metoda 1
Calculați manual covarianța cu formula standard

Imaginea intitulată Calculate Covariance Step 1
1
Aflați formula covarianță standard și părțile sale. Formula standard pentru calcularea covarianței este Σ(xeu-xi.m.)(yeu-yi.m.)/(n-1){ Display Style Sigma (X_ {i} _ {-x text {I.M ..}}) (Y_ {i} _ {-y text {I.M ..}}) / (N-1)}. Pentru a utiliza această formulă, trebuie să înțelegeți semnificația variabilelor și simbolurilor:
  • Σ{ displaystyle Sigma} - Acest simbol este litera greacă "Sigma". În funcțiile matematice, se adaugă o serie de lucruri pe care le urmăriți. În această formulă, semnul Σ înseamnă că calculați valorile care urmează unul pe celălalt în numărarea pauzei. Apoi îi adăugați pe toți împreună înainte de a le împărți de numitor.
  • xeu{ displaystyle x_ {i}} - Această variabilă este citită ca "x over i". Subscriptul i reprezintă un contor. Aceasta înseamnă că faci calculul pentru fiecare valoare a lui x pe care o ai în setul de date.
  • xeu.M.{ displaystyle x_ {i.M}} - "I.M." indică faptul că x (i.M.) este media tuturor punctelor de date x. Valoarea medie este uneori scrisă ca un x cu o linie orizontală scurtă deasupra ei. În acest stil, variabila este citită ca "x-bar", dar înseamnă în continuare media înregistrării.
  • yeu{ displaystyle y_ {i}} - Această variabilă este citită ca "y over i". Subscriptul i reprezintă un contor. Aceasta înseamnă că faceți calculul pentru fiecare valoare a y-ului pe care o aveți în setul de date.
  • yeu.M.{ displaystyle y_ {i.M}} - "I.M." indică faptul că y (i.M.) este media tuturor punctelor de date x. Valoarea medie este uneori scrisă și ca o y cu o linie orizontală scurtă deasupra ei. În acest stil, variabila este citită ca "y-bar", dar înseamnă totuși media înregistrării.
  • n{ displaystyle n} - Această variabilă reprezintă numărul de elemente din înregistrarea dvs. Nu uitați că într-o sarcină de covarianță, un singur "element" este compus atât din valoarea x, cât și din valoarea y. Valoarea n este numărul de perechi de puncte de date, nu de numere individuale.
  • Imaginea intitulată Calculate Covariance Step 2
    2
    Configurați tabelul de date. Înainte de a începe să lucrați, este util să vă colectați datele. Ar trebui să faceți un tabel format din cinci coloane. Ar trebui să etichetați fiecare coloană după cum urmează:
  • x{ displaystyle x} - Completați această coloană cu valorile punctelor de date x.
  • y{ displaystyle y} - Completați această coloană cu valorile punctelor dvs. de date y. Aveți grijă să aliniați valorile y cu valorile corespunzătoare x. Pentru o sarcină de covarianță, ordinea punctelor de date și împerecherea lui x și y este importantă.
  • (xeu-xi.m.){ displaystyle (x_ {i} -x _ { text {i.M}}}} - Lăsați această coloană la început. Se completează cu date după calcularea mediei punctelor de date x.
  • (yeu-yi.m.){ displaystyle (y_ {i} -y _ { text {i.M}}}} - Lăsați această coloană la început. Se completează cu date după calcularea mediei punctelor de date y.
  • produs{ displaystyle { text {produs}}} - Eliberați și ultima coloană. Le umpleți în timp ce continuați să lucrați.
  • Imaginea intitulată Calculate Covariance Step 3
    3
    Calculați media punctelor de date x. Acest eșantion conține nouă numere. Adăugați-le împreună și împărțiți suma cu 9 pentru a calcula media. Acest lucru dă 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Dacă îl împărțiți cu 9, media este de 4,89. Aceasta este valoarea pe care o utilizați pentru calculele viitoare ca x (i.M.).
  • Imaginea intitulată Calculate Covariance Step 4
    4
    Calculați media punctelor de date y. În mod similar, coloana y ar trebui să fie formată din nouă puncte de date care coincid cu punctele de date x. Calculați media. Pentru acest exemplu de înregistrare, este 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Împărțiți această sumă cu 9 pentru a obține o medie de 5.44. Utilizați 5.44 ca valoare a lui y (i.M.) pentru calculele viitoare.
  • Imaginea intitulată Calculate Covariance Step 5
    5
    Calculați valoarea (xeu-xi.m.){ displaystyle (x_ {i} -x _ { text {i.M}}}}-Valori. Pentru fiecare element din coloana x, trebuie să calculați diferența dintre acest număr și valoarea medie. În această sarcină de exemplu, aceasta înseamnă scăderea a 4,89 din fiecare punct de date x. Dacă punctul dvs. original de date este mai mic decât media, rezultatul dvs. este negativ. Dacă punctul original de date este mai mare decât media, rezultatul dvs. este pozitiv. Asigurați-vă că țineți cont de semnele negative.
  • De exemplu, primul punct de date din coloana x este 1. Valoarea introdusă în prima linie a coloanei (xeu-xi.m.){ displaystyle (x_ {i} -x _ { text {i.M}}}} -Coloana este de 1 - 4.89, care dă -3.89.
  • Repetați procesul cu fiecare punct de date. Astfel, a doua linie este de 3 - 4,89, ceea ce dă -1,89. A treia linie este 2-4.89 sau -2.89. Continuați procesul cu toate punctele de date. Cele nouă numere din această coloană trebuie să fie -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89, -0,89.
  • Imaginea intitulată Calculate Covariance Step 6
    6
    Calculați valoarea (yeu-yi.m.){ displaystyle (y_ {i} -y _ { text {i.M}}}}-Valori. În această coloană efectuați scăderi similare utilizând punctele de date y și media y. Dacă punctul inițial de date este mai mic decât media, rezultatul dvs. este negativ. Dacă punctul original de date este mai mare decât media, rezultatul dvs. este pozitiv. Asigurați-vă că țineți cont de semnele negative.
  • În prima linie, calculul dvs. este de 8 - 5,44, ceea ce dă 2,56.
  • A doua linie este de 6 - 5,44, dând 0,56.
  • Continuați aceste scăderi până la sfârșitul listei de date. Când ați terminat, cele nouă valori din această coloană ar trebui să fie 2.56, 0.56, 3.56, -1.44, -2.44, -2.44, -3.44, 1.56, 1, 56 sunt.
  • Imaginea intitulată Calculate Covariance Step 7
    7
    Calculați produsele pentru fiecare linie de date. Completați liniile din ultima coloană introducând numerele pe care le aveți în ultimele două coloane (xeu-xi.m.){ displaystyle (x_ {i} -x _ { text {i.M}}}} și (yeu-yi.m.){ displaystyle (y_ {i} -y _ { text {i.M}}}}calculate, înmulțite împreună. Asigurați-vă că lucrați linia în linie și înmulțiți cele două numere pentru punctele de date corespunzătoare. Urmăriți semnele negative.
  • În primul rând al acestui exemplu, acesta este (xeu-xi.m.){ displaystyle (x_ {i} -x _ { text {i.M}}}}, pe care le-ați calculat, -3,89 și (yeu-yi.m.){ displaystyle (y_ {i} -y _ { text {i.M}}}}-Valoarea este 2,56. Produsul acestor două numere este -3,89 * 2,56 = -9,96.
  • În al doilea rând, înmulțiți cele două numere -1,88 * 0,56 = -1,06.
  • Continuați să multiplicați rândul cu linia la sfârșitul înregistrării Când ați terminat, această coloană ar trebui să fie -9.96, -1.06, -10.29, -0.16, -7.59, -5, 15, -24,46, -4,51, -1,39.
  • Imaginea intitulată Calculate Covariance Step 8
    8
    Calculați suma valorilor din ultima coloană. Acesta este locul unde simbolul Σ intră în joc. După finalizarea tuturor calculelor efectuate până acum, adăugați rezultatele împreună. Pentru această înregistrare de eșantion, ar trebui să aveți nouă valori în ultima coloană. Adăugați aceste nouă numere împreună. Acordați o atenție deosebită dacă numărul este pozitiv sau negativ.
  • Pentru acest exemplu de înregistrare, suma ar trebui să fie -64.57. Scrieți acest total în câmpul de sub linie. Aceasta reprezintă valoarea contorului din formula de covarianță standard.
  • Imaginea intitulată Calculate Covariance Step 9
    9
    Calculați numitorul pentru formula de covarianță. Contorul pentru formula covarianță standard este valoarea pe care tocmai ați calculat-o. Numitorul este reprezentat de (n-1), care este pur și simplu mai mic decât numărul de perechi de date din setul de date.
  • Există nouă perechi de date în acest exemplu de înregistrare, deci n este 9. Valoarea (n-1) este, prin urmare, 8.
  • Imaginea intitulată Calculate Covariance Step 10
    10
    Împărțiți numitorul cu numitorul. Ultimul pas în calcularea covarianței este contorul Σ(xeu-xi.m.)(yeu-yi.m.){ displaystyle Sigma (x_ {i} -x _ { text {i.M}}) {y_ {i} -y _ { de numitor (n-1){ displaystyle (n-1)} pentru a împărtăși. Cotația este covarianța datelor dvs.
  • Pentru acest exemplu de înregistrare, calculul este -64.57 / 8, rezultând un rezultat de -8.07.
  • Metoda 2
    Calculați covarianța cu o foaie de calcul Excel

    Imaginea intitulată Calculate Covariance Step 11
    1
    Observați calculele repetitive. Covariance este un calcul pe care trebuie să-l faci de câteva ori manual pentru a înțelege semnificația rezultatului. Cu toate acestea, dacă utilizați în mod curent covarianță în interpretarea datelor, ar trebui să căutați o modalitate mai rapidă și mai automată de a obține rezultatele. Calculele pentru setul nostru relativ mic de date de numai nouă perechi de date au constat din două valori medii, optsprezece subtrații individuale, nouă multiplicări separate, o adăugare și o diviziune finală. Sunt 31 de calcule relativ mici pentru a găsi o soluție. Pe parcurs, riscați să omiteți omens negativ sau să vă prezentați greșit rezultatele și să distrugeți rezultatul.
  • Imaginea intitulată Calculate Covariance Step 12
    2
    Creați un tabel pentru a calcula covarianța. Dacă sunteți familiarizați cu Excel (sau orice altă foaie de calcul), puteți configura cu ușurință un tabel pentru a calcula covarianța. Etichetați rândurile de sus a cinci coloane ca și pentru calculele cu mâna: x, y, (x (i) -x (i.M.)), (Y (i) -y (i.M.)) Și produsul.
  • Pentru a vă simplifica titlul, trebuie să denumiți a treia coloană "x Difference" și a patra coloană "y Difference" sau ceva similar, atâta timp cât înțelegeți semnificația datelor.
  • Dacă începeți cu tabelul dvs. în colțul din stânga sus al fișei de date, celula A1 este eticheta x, în timp ce celelalte etichete sunt până la celula E1.
  • Imaginea intitulată Calculate Covariance Step 13
    3
    Completați punctele de date. Introduceți valorile datelor în cele două coloane etichetate x și y. Nu uitați că ordinea punctelor de date joacă un rol. Deci, trebuie să combinați fiecare y cu valoarea corespunzătoare x.
  • Valorile dvs. x încep în celula A2 și continuă să coboare cât mai multe puncte de date de care aveți nevoie.
  • Valorile dvs. y încep în celula B2 și continuă să coboare cât mai multe puncte de date de care aveți nevoie.
  • Imaginea intitulată Calculate Covariance Step 14
    4


    Calculați valorile medii ale valorilor x și y. Excel calculează mediile foarte rapid pentru dvs. În prima celulă liberă din fiecare coloană de date, introduceți formula = AVG (A2: A ___). Completați spațiul liber cu numărul de celule care corespund ultimului punct de date.
  • De exemplu, dacă aveți 100 de puncte de date, completați celulele A2 până la A101, deci introduceți = AVG (A2: A101).
  • Introduceți formula = AVG (B2: B101) pentru datele y.
  • Nu uitați că Excel începe o formulă cu semnul =.
  • Imaginea intitulată Calculate Covariance Step 15
    5
    Dați formula pentru (x (i) -x (i.M.)) Coloana. În celula C2 trebuie să introduceți formula pentru a calcula prima scădere. Această formulă este = A2 -____. Completați spațiul liber cu adresa celulară, care conține valoarea medie a datelor x.
  • Pentru exemplul celor 100 de puncte de date, această medie ar fi în celula A103, deci formula dvs. este A2-A103.
  • Imaginea intitulată Calculate Covariance Step 16
    6
    Repetați formula pentru (y (i) -y (i.M.)) - puncte de date. Urmând același exemplu, acestea ar veni în celula D2. Formula este = B2-B103.
  • Imaginea intitulată Calculate Covariance Step 17
    7
    Introduceți formula pentru coloana "Produs". În coloana a cincea, în celula E2, trebuie să introduceți formula pentru a calcula produsul celor două celule anterioare. Asta ar fi ușor = C2 * D2.
  • Imaginea intitulată Calculate Covariance Step 18
    8
    Copiați formula pentru a umple tabelul. Până acum ați programat doar prima pereche de puncte de date în rândul 2. Utilizați mouse-ul pentru a evidenția celulele C2, D2 și E2. Poziționați cursorul peste cutia mică din colțul din dreapta jos până când apare un semn +. Faceți clic pe butonul mouse-ului, țineți-l în jos și trageți în jos pentru a extinde caseta evidențiată și completați întregul tabel de date. Acest pas copiază automat cele trei formule din celulele C2, D2 și E2 în întreaga masă. Ar trebui să vedeți foaia de calcul completată automat cu toate calculele.
  • Imaginea intitulată Calculate Covariance Step 19
    9
    Programați suma ultimei coloane. Trebuie să aflați suma elementelor din coloana "Produs". Introduceți formula = sumă (E2: E ___) în celula goală chiar sub ultimul punct de date din coloană. Completați spațiul liber cu adresa celulară a ultimului punct de date.
  • Pentru exemplul a 100 de puncte de date, această formulă apare în celula E103. Introduceți = sumă (E2: E102).
  • Imaginea intitulată Calculate Covariance Step 20
    10
    Calculați covarianța. Puteți, de asemenea, permite Excel să facă ultimul calcul pentru dvs. Ultimul calcul, în exemplul nostru din celula E103, reprezintă numitorul formulei de covarianță. Chiar sub această celulă puteți introduce formula = E103 / ___. Completați spațiul liber cu numărul de puncte de date pe care le aveți. În exemplul nostru, este de 100. Rezultatul este covarianța datelor dvs.
  • Metoda 3
    Cu site-uri de calculator pentru covarianță

    Imaginea intitulată Calculate Covariance Step 21
    1
    Căutați pe internet calculatoarele de covarianță. Diferite școli, programatori sau alte surse au creat pagini web care calculează pur și simplu valorile de covarianță pentru tine. Introduceți termenul de căutare "calculator de covarianță" în orice motor de căutare.
  • Imaginea intitulată Calculate Covariance Step 22
    2
    Introduceți datele. Citiți cu atenție instrucțiunile de pe site pentru a vă asigura că introduceți corect detaliile. Este important ca perechile de date să rămână în ordinea corectă, altfel veți genera un rezultat de covarianță fals. Site-urile diferite au stiluri diferite pentru introducerea datelor dvs.
  • De exemplu, există pe site-ul web https://rcalculators.com/statistics/covariance-calculator.htm un câmp orizontal pentru introducerea valorilor x și un al doilea câmp orizontal pentru introducerea valorilor y. Sunteți instruiți să introduceți termenii separați doar prin virgule. Astfel, setul de date x calculat anterior în acest articol va fi introdus ca 1,3,2,5,8,7,12,2,4. Recordul y ar fi 8,6,9,4,3,3,2,7,7.
  • Pe o altă parte, https://thecalculator.co/math/Covariance-Calculator-705.html, vi se va solicita să introduceți datele dvs. x în primul câmp. Datele sunt introduse vertical, cu un element pe linie. Prin urmare, datele de pe această pagină ar arăta astfel:
  • 1
  • 3
  • 2
  • 5
  • 8
  • 7
  • 12
  • 2
  • 4
  • Imaginea intitulată Calculate Covariance Step 23
    3
    Calculați rezultatele. Atracția acestor pagini de calcul este că, după introducerea datelor, trebuie să faceți clic pe butonul "Calculate". Rezultatele apar automat. Cele mai multe pagini vă oferă calcule intermediare pentru x (i.M.), y (i.M.) și n.
  • Metoda 4
    Interpretați rezultatele covarianței

    Imaginea intitulată Calculate Covariance Step 24
    1
    Căutați dependență pozitivă sau negativă. Covariance este un singur număr statistic care reprezintă modul în care setul de date depinde de altul. În exemplul menționat în introducere, mărimea și greutatea sunt măsurate. V-ați aștepta ca greutatea lor să crească, pe măsură ce oamenii cresc, ceea ce duce la un număr pozitiv de covarianță. Ca un alt exemplu, să presupunem că datele sunt colectate reprezentând numărul de ore pe care cineva practică golful și scorurile pe care le poate obține. În acest caz, vă așteptați la o covarianță negativă, ceea ce înseamnă că scorul scade odată cu creșterea numărului de ore de practică. (În golf, un scor mai mic este mai bun.)
    • Uită-te la setul de date eșantion calculat mai sus. Covarianța rezultată este -8,07. Semnul negativ aici indică faptul că valorile y tind să scadă odată cu creșterea valorilor x. Puteți chiar să vedeți că este adevărat căutând câteva valori. De exemplu, valorile x ale lui 1 și 2 corespund valorilor y de 7, 8 și respectiv 9, iar valorile x ale valorilor 8 și 12 y de 3 și, respectiv, 2.
  • Imaginea intitulată Calculate Covariance Step 25
    2
    Interpretați amploarea covarianței. Dacă numărul de scoruri de covarianță este mare (fie un număr pozitiv mare sau un număr negativ mare), puteți interpreta acest lucru pentru a însemna că cele două elemente de date sunt foarte puternic conectate (fie pozitive, fie negative).
  • În setul de date exemplu, covarianța de -8,07 este destul de mare. Rețineți că valorile datelor variază de la 1 la 12, deci 8 este un număr destul de mare. Aceasta indică o conexiune puternică între înregistrările x și y.
  • Imaginea intitulată Calculate Covariance Step 26
    3
    Înțelegeți o lipsă de relație. Dacă ajungeți la o covarianță egală sau foarte apropiată de 0, puteți concluziona că punctele de date sunt relativ independente una de cealaltă. Aceasta înseamnă că o creștere a unei valori poate duce sau nu la o creștere a celeilalte. Cei doi termeni sunt aproape coincidenți conectați.
  • De exemplu, să presupunem că comparați dimensiunile pantofilor cu evaluările în cadrul testului de capacitate de studiu. Deoarece există atât de mulți factori care afectează capacitatea unui student de a studia, ne-am aștepta la o valoare de covarianță de aproape 0. Aceasta ar indica aproape nicio legătură între cele două valori.
  • Imaginea intitulată Calculate Covariance Step 27
    4
    Uită-te la relația grafic. Pentru a înțelege vizual covarianța, puteți compila punctele de date într-un sistem de coordonate x-y. Dacă faceți acest lucru, ar trebui să observați cu ușurință că punctele (deși nu formează o linie exactă) se apropie de o diagonală de sus în stânga în dreapta jos. Aceasta este descrierea unei covarianțe negative. De asemenea, rețineți că valoarea covarianței este -8.07. Acesta este un număr destul de mare în comparație cu punctele de date. Numărul mare presupune că covarianța este destul de puternică, pe care o puteți vedea în aspectul liniar al punctelor de date.
  • Hobby-uri: Desenați puncte într-un sistem de coordonate pentru a vedea cum să atragă puncte într-un sistem de coordonate.
  • avertismente

    • Covariance are o aplicație limitată în statistici. Este adesea un pas spre calcularea coeficienților de corelație sau a altor expresii. Fii atent și nu interpreta prea mult într-o valoare de covarianță.
    Distribuiți pe rețelele sociale:

    înrudit