Calculați covarianța
Covariance este un calcul statistic care vă ajută să înțelegeți cum se raportează două seturi de date între ele. De exemplu, să presupunem că antropologii studiază mărimea și greutatea unei populații umane într-o cultură. Pentru fiecare persoană din studiu, mărimea și greutatea pot fi reprezentate de o pereche de date (x, y). Aceste valori pot fi utilizate într-o formulă standard pentru a calcula relația de covarianță. Acest articol explică mai întâi calculele care afișează covarianța unui set de date. Apoi se adresează celorlalte două metode automatizate pentru a afla rezultatul.
conținut
metodă
Metoda 1
Calculați manual covarianța cu formula standard
1
Aflați formula covarianță standard și părțile sale. Formula standard pentru calcularea covarianței este . Pentru a utiliza această formulă, trebuie să înțelegeți semnificația variabilelor și simbolurilor:
- - Acest simbol este litera greacă "Sigma". În funcțiile matematice, se adaugă o serie de lucruri pe care le urmăriți. În această formulă, semnul Σ înseamnă că calculați valorile care urmează unul pe celălalt în numărarea pauzei. Apoi îi adăugați pe toți împreună înainte de a le împărți de numitor.
- - Această variabilă este citită ca "x over i". Subscriptul i reprezintă un contor. Aceasta înseamnă că faci calculul pentru fiecare valoare a lui x pe care o ai în setul de date.
- - "I.M." indică faptul că x (i.M.) este media tuturor punctelor de date x. Valoarea medie este uneori scrisă ca un x cu o linie orizontală scurtă deasupra ei. În acest stil, variabila este citită ca "x-bar", dar înseamnă în continuare media înregistrării.
- - Această variabilă este citită ca "y over i". Subscriptul i reprezintă un contor. Aceasta înseamnă că faceți calculul pentru fiecare valoare a y-ului pe care o aveți în setul de date.
- - "I.M." indică faptul că y (i.M.) este media tuturor punctelor de date x. Valoarea medie este uneori scrisă și ca o y cu o linie orizontală scurtă deasupra ei. În acest stil, variabila este citită ca "y-bar", dar înseamnă totuși media înregistrării.
- - Această variabilă reprezintă numărul de elemente din înregistrarea dvs. Nu uitați că într-o sarcină de covarianță, un singur "element" este compus atât din valoarea x, cât și din valoarea y. Valoarea n este numărul de perechi de puncte de date, nu de numere individuale.
2
Configurați tabelul de date. Înainte de a începe să lucrați, este util să vă colectați datele. Ar trebui să faceți un tabel format din cinci coloane. Ar trebui să etichetați fiecare coloană după cum urmează:
3
Calculați media punctelor de date x. Acest eșantion conține nouă numere. Adăugați-le împreună și împărțiți suma cu 9 pentru a calcula media. Acest lucru dă 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Dacă îl împărțiți cu 9, media este de 4,89. Aceasta este valoarea pe care o utilizați pentru calculele viitoare ca x (i.M.).
4
Calculați media punctelor de date y. În mod similar, coloana y ar trebui să fie formată din nouă puncte de date care coincid cu punctele de date x. Calculați media. Pentru acest exemplu de înregistrare, este 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Împărțiți această sumă cu 9 pentru a obține o medie de 5.44. Utilizați 5.44 ca valoare a lui y (i.M.) pentru calculele viitoare.
5
Calculați valoarea ) { displaystyle (x_ {i} -x _ { text {i.M}}}} -Valori. Pentru fiecare element din coloana x, trebuie să calculați diferența dintre acest număr și valoarea medie. În această sarcină de exemplu, aceasta înseamnă scăderea a 4,89 din fiecare punct de date x. Dacă punctul dvs. original de date este mai mic decât media, rezultatul dvs. este negativ. Dacă punctul original de date este mai mare decât media, rezultatul dvs. este pozitiv. Asigurați-vă că țineți cont de semnele negative.
6
Calculați valoarea ) { displaystyle (y_ {i} -y _ { text {i.M}}}} -Valori. În această coloană efectuați scăderi similare utilizând punctele de date y și media y. Dacă punctul inițial de date este mai mic decât media, rezultatul dvs. este negativ. Dacă punctul original de date este mai mare decât media, rezultatul dvs. este pozitiv. Asigurați-vă că țineți cont de semnele negative.
7
Calculați produsele pentru fiecare linie de date. Completați liniile din ultima coloană introducând numerele pe care le aveți în ultimele două coloane și calculate, înmulțite împreună. Asigurați-vă că lucrați linia în linie și înmulțiți cele două numere pentru punctele de date corespunzătoare. Urmăriți semnele negative.
8
Calculați suma valorilor din ultima coloană. Acesta este locul unde simbolul Σ intră în joc. După finalizarea tuturor calculelor efectuate până acum, adăugați rezultatele împreună. Pentru această înregistrare de eșantion, ar trebui să aveți nouă valori în ultima coloană. Adăugați aceste nouă numere împreună. Acordați o atenție deosebită dacă numărul este pozitiv sau negativ.
9
Calculați numitorul pentru formula de covarianță. Contorul pentru formula covarianță standard este valoarea pe care tocmai ați calculat-o. Numitorul este reprezentat de (n-1), care este pur și simplu mai mic decât numărul de perechi de date din setul de date.
10
Împărțiți numitorul cu numitorul. Ultimul pas în calcularea covarianței este contorul de numitor pentru a împărtăși. Cotația este covarianța datelor dvs.
Metoda 2
Calculați covarianța cu o foaie de calcul Excel
1
Observați calculele repetitive. Covariance este un calcul pe care trebuie să-l faci de câteva ori manual pentru a înțelege semnificația rezultatului. Cu toate acestea, dacă utilizați în mod curent covarianță în interpretarea datelor, ar trebui să căutați o modalitate mai rapidă și mai automată de a obține rezultatele. Calculele pentru setul nostru relativ mic de date de numai nouă perechi de date au constat din două valori medii, optsprezece subtrații individuale, nouă multiplicări separate, o adăugare și o diviziune finală. Sunt 31 de calcule relativ mici pentru a găsi o soluție. Pe parcurs, riscați să omiteți omens negativ sau să vă prezentați greșit rezultatele și să distrugeți rezultatul.
2
Creați un tabel pentru a calcula covarianța. Dacă sunteți familiarizați cu Excel (sau orice altă foaie de calcul), puteți configura cu ușurință un tabel pentru a calcula covarianța. Etichetați rândurile de sus a cinci coloane ca și pentru calculele cu mâna: x, y, (x (i) -x (i.M.)), (Y (i) -y (i.M.)) Și produsul.
3
Completați punctele de date. Introduceți valorile datelor în cele două coloane etichetate x și y. Nu uitați că ordinea punctelor de date joacă un rol. Deci, trebuie să combinați fiecare y cu valoarea corespunzătoare x.
4
Calculați valorile medii ale valorilor x și y. Excel calculează mediile foarte rapid pentru dvs. În prima celulă liberă din fiecare coloană de date, introduceți formula = AVG (A2: A ___). Completați spațiul liber cu numărul de celule care corespund ultimului punct de date.
5
Dați formula pentru (x (i) -x (i.M.)) Coloana. În celula C2 trebuie să introduceți formula pentru a calcula prima scădere. Această formulă este = A2 -____. Completați spațiul liber cu adresa celulară, care conține valoarea medie a datelor x.
6
Repetați formula pentru (y (i) -y (i.M.)) - puncte de date. Urmând același exemplu, acestea ar veni în celula D2. Formula este = B2-B103.
7
Introduceți formula pentru coloana "Produs". În coloana a cincea, în celula E2, trebuie să introduceți formula pentru a calcula produsul celor două celule anterioare. Asta ar fi ușor = C2 * D2.
8
Copiați formula pentru a umple tabelul. Până acum ați programat doar prima pereche de puncte de date în rândul 2. Utilizați mouse-ul pentru a evidenția celulele C2, D2 și E2. Poziționați cursorul peste cutia mică din colțul din dreapta jos până când apare un semn +. Faceți clic pe butonul mouse-ului, țineți-l în jos și trageți în jos pentru a extinde caseta evidențiată și completați întregul tabel de date. Acest pas copiază automat cele trei formule din celulele C2, D2 și E2 în întreaga masă. Ar trebui să vedeți foaia de calcul completată automat cu toate calculele.
9
Programați suma ultimei coloane. Trebuie să aflați suma elementelor din coloana "Produs". Introduceți formula = sumă (E2: E ___) în celula goală chiar sub ultimul punct de date din coloană. Completați spațiul liber cu adresa celulară a ultimului punct de date.
10
Calculați covarianța. Puteți, de asemenea, permite Excel să facă ultimul calcul pentru dvs. Ultimul calcul, în exemplul nostru din celula E103, reprezintă numitorul formulei de covarianță. Chiar sub această celulă puteți introduce formula = E103 / ___. Completați spațiul liber cu numărul de puncte de date pe care le aveți. În exemplul nostru, este de 100. Rezultatul este covarianța datelor dvs.
Metoda 3
Cu site-uri de calculator pentru covarianță
1
Căutați pe internet calculatoarele de covarianță. Diferite școli, programatori sau alte surse au creat pagini web care calculează pur și simplu valorile de covarianță pentru tine. Introduceți termenul de căutare "calculator de covarianță" în orice motor de căutare.
2
Introduceți datele. Citiți cu atenție instrucțiunile de pe site pentru a vă asigura că introduceți corect detaliile. Este important ca perechile de date să rămână în ordinea corectă, altfel veți genera un rezultat de covarianță fals. Site-urile diferite au stiluri diferite pentru introducerea datelor dvs.
3
Calculați rezultatele. Atracția acestor pagini de calcul este că, după introducerea datelor, trebuie să faceți clic pe butonul "Calculate". Rezultatele apar automat. Cele mai multe pagini vă oferă calcule intermediare pentru x (i.M.), y (i.M.) și n.
Metoda 4
Interpretați rezultatele covarianței
1
Căutați dependență pozitivă sau negativă. Covariance este un singur număr statistic care reprezintă modul în care setul de date depinde de altul. În exemplul menționat în introducere, mărimea și greutatea sunt măsurate. V-ați aștepta ca greutatea lor să crească, pe măsură ce oamenii cresc, ceea ce duce la un număr pozitiv de covarianță. Ca un alt exemplu, să presupunem că datele sunt colectate reprezentând numărul de ore pe care cineva practică golful și scorurile pe care le poate obține. În acest caz, vă așteptați la o covarianță negativă, ceea ce înseamnă că scorul scade odată cu creșterea numărului de ore de practică. (În golf, un scor mai mic este mai bun.)
- Uită-te la setul de date eșantion calculat mai sus. Covarianța rezultată este -8,07. Semnul negativ aici indică faptul că valorile y tind să scadă odată cu creșterea valorilor x. Puteți chiar să vedeți că este adevărat căutând câteva valori. De exemplu, valorile x ale lui 1 și 2 corespund valorilor y de 7, 8 și respectiv 9, iar valorile x ale valorilor 8 și 12 y de 3 și, respectiv, 2.
2
Interpretați amploarea covarianței. Dacă numărul de scoruri de covarianță este mare (fie un număr pozitiv mare sau un număr negativ mare), puteți interpreta acest lucru pentru a însemna că cele două elemente de date sunt foarte puternic conectate (fie pozitive, fie negative).
3
Înțelegeți o lipsă de relație. Dacă ajungeți la o covarianță egală sau foarte apropiată de 0, puteți concluziona că punctele de date sunt relativ independente una de cealaltă. Aceasta înseamnă că o creștere a unei valori poate duce sau nu la o creștere a celeilalte. Cei doi termeni sunt aproape coincidenți conectați.
4
Uită-te la relația grafic. Pentru a înțelege vizual covarianța, puteți compila punctele de date într-un sistem de coordonate x-y. Dacă faceți acest lucru, ar trebui să observați cu ușurință că punctele (deși nu formează o linie exactă) se apropie de o diagonală de sus în stânga în dreapta jos. Aceasta este descrierea unei covarianțe negative. De asemenea, rețineți că valoarea covarianței este -8.07. Acesta este un număr destul de mare în comparație cu punctele de date. Numărul mare presupune că covarianța este destul de puternică, pe care o puteți vedea în aspectul liniar al punctelor de date.
avertismente
- Covariance are o aplicație limitată în statistici. Este adesea un pas spre calcularea coeficienților de corelație sau a altor expresii. Fii atent și nu interpreta prea mult într-o valoare de covarianță.
Distribuiți pe rețelele sociale:
înrudit
- 2 Modalități de a calcula o formulă pătratică
- Calculați deviația absolută de măsurare
- Determinați aria unui poligon obișnuit
- Calculați o circumferință
- Calculul mediei, deviației standard și erorii standard
- Calculul ratei de creștere
- Determinați cartilajul superior
- Calculați volumul unei prisme
- Determinați coeficientul de corelație
- Calculați eroarea standard
- Calculați lățimea unui dreptunghi
- Utilizați formula de distanță pentru a afla lungimea unei linii
- Determinați aria unui semicerc
- Calculați energia cinetică
- Calculați deviația standard
- Calculați ziua din săptămână în Excel
- Calculați abaterea standard cu Excel
- Creați o formulă pentru a reduce data cu o lună
- Rezolva problemele de fizică
- Calculați intervalele de încredere
- Calculați circuitele paralele