Calculați valorile pentru Grubbs
În statistici, un outlier este un punct de măsurare care diferă numeric de celelalte măsurători din seriile de măsurare. Excedentele adesea indică nereguli într-o serie de date observate sau pot descoperi erori în măsurători. Atunci când sunt neglijate valorile excepționale, pot apărea adesea schimbări semnificative în evaluarea rezultatelor studiului. Pentru o înțelegere corectă a datelor, este important să știi cum să calculezi și să evaluezi valorile excesive. Acest lucru vă va permite să trageți concluzii mai precise din datele dvs. statistice.
conținut
metodă
1
Aflați cum să recunoașteți posibilitățile de depășire. Înainte de a putea decide dacă puteți neglija o valoare neobișnuită într-un anumit set de date, trebuie mai întâi să identificați valorile potențiale. În general vorbind, valorile extreme sunt puncte de date care deviază semnificativ de la tendința altor valori într-o serie - cu alte cuvinte, ele lacrimă. Ele sunt de obicei destul de ușor de identificat în tabele sau (mai ales) în grafice. Dacă seria de date este afișată într-un grafic, există valori exagerate departe de la celelalte valori. Dacă de ex. Dacă majoritatea punctelor dintr-o serie de date se află pe o linie dreaptă, valorile negative nu pot contribui în mod rezonabil la acea linie.
- Să presupunem, de exemplu, că aveți o înregistrare a temperaturii de 12 diferite obiecte într-o cameră. Dacă 11 obiecte au o temperatură în jur de 70 de grade Celsius, dar a douăsprezecea obiect (probabil un cuptor) are o temperatură de 300 grade Celsius, o examinare superficială poate indica faptul că temperatura cuptorului este un outlier probabil.
2
Aranjați punctele de date de la cea mai mică la cea mai mare valoare. Primul pas în calcularea valorii de valori dintr-un set de date este de a găsi meridianul (media) al setului de date. Această sarcină este mult mai ușoară dacă puneți valorile în ordine de la cea mai mică la cea mai mare valoare. Deci, înainte de a continua, aranjați valorile seriei de date în acest fel.
3
Calculați valoarea mediană a setului de date. Mediana este punctul de date din seria de date în care jumătate dintre punctele de date sunt sub și o jumătate deasupra ei - deci este exact în mijlocul seriei de date. Dacă setul de date are un număr impar de puncte, este ușor de găsit - este punctul care are cât mai multe puncte pe care le are în sine. Cu toate acestea, dacă o serie de date are un număr par de puncte, deoarece nu există un centru real, trebuie să se formeze media celor două puncte medii de date. Atunci când se calculează valori extreme, meridianului i se atribuie adesea variabila Q2 - deoarece se află între Q1 și Q3, quartila inferioară și superioară, pe care o vom defini mai târziu.
4
Calculați cartilajul inferior. Acest punct, numit Q1, este punctul de date sub care se află 25% (sau un sfert) din lecturi. Cu alte cuvinte, jumătate din suprafața punctelor tale de mai jos meridianul. Dacă aveți un număr par de valori sub meridian, va trebui să redimensionați media celor două valori medii pentru a găsi Q1, la fel ca în cazul calculării meridianului în sine.
5
Calculați cartilajul superior. Acest punct, numit Q3, reprezintă punctul de date deasupra căruia se află 25% din citiri. Puteți găsi Q3 la fel cum ați găsit Q1, cu excepția faptului că acum aveți punctele despre trebuie să folosească meridianul, nu cele de mai jos.
6
Calculați intervalul interquartilat. După definirea Q1 și Q3, trebuie să calculam distanța dintre aceste două variabile. Distanța de la Q1 la Q3 se calculează scăzând Q1 de la Q3. Valoarea pentru spațierea intercuartilă este importantă pentru determinarea limitelor pentru non-outliers din seriile de date.
7
Găsiți gard interior seria de date. Rezultatele sunt identificate examinând dacă acestea se află în anumite limite numerice interior și exterior Garduri. Un punct în afara gardului interior este numit "outlier ușor", în timp ce punctele din afara gardului exterior sunt numite "extreme outliers". Pentru a găsi gardul interior al seriei de date, trebuie mai întâi să multiplicați intervalul interquartilat cu 1,5. Apoi, adăugați rezultatul la Q3 și scade-l din Q1. Cele două valori rezultate sunt limitele gardului interior al seriilor dvs. de date.
8
Găsiți gard exterior seria de date. Acest lucru se face în același mod ca gardul interior, cu excepția faptului că înmulțim intervalul interquartilat cu 3 în loc de 1,5. Pentru a găsi limitele inferioare și superioare ale gardului nostru exterior, rezultatul este apoi adăugat înapoi la Q3 și scăzut din Q1.
9
Efectuați o evaluare calitativă pentru a determina dacă sunteți un excedent arunca poate. Folosind metoda descrisă mai sus, puteți determina dacă un anumit punct este un excedent blând, o depășire extremă sau chiar o depășire. Dar, nu trebuie să înțelegeți greșit - doar pentru că ați identificat un punct ca un outlier nu înseamnă că îl puteți neglija. Nu este un punct care va fi eliminat must. motiv, de ce un deviere se abate de la restul punctelor de date la rând este factorul decisiv în ignorarea acestuia sau nu. În principiu, de obicei, puteți omite depășiri care se datorează unei erori de un fel - o greșeală în măsurarea, înregistrarea sau configurarea experimentală. Dar, pe de altă parte, puteți utiliza valori excepționale care nu pot fi definite ca greșeli și care dezvăluie noi informații sau tendințe care nu au fost inițial anticipate, nu omite.
10
Înțelegeți de ce trebuie să fie (uneori) menținute valori excepționale. În timp ce unele valori extreme ar trebui șterse din serii de date din cauza erorilor și / sau falsificărilor, altele ar trebui păstrate. Dacă de ex. Excenderele au fost într-adevăr atât de absorbite (adică nu de rezultatul unei greșeli) și / sau să ofere noi perspective asupra fenomenului studiat, nu ar trebui ignorate. Experimentele științifice sunt deosebit de sensibile atunci când vine vorba de valori excepționale - omiterea eronată a unui extraterar poate genera informații cruciale, noi tendințe sau descoperiri care pot fi pierdute.
Sfaturi
- Dacă descoperiți valori negative, încercați să le explicați prezența înainte de a le neglija - ceea ce poate indica erori de măsurare sau nereguli în distribuție.
Ce ai nevoie
- Calculator de buzunar
Distribuiți pe rețelele sociale:
înrudit
- Calculați deviația absolută de măsurare
- Determinați aria unui poligon obișnuit
- Calculul ratei de creștere
- Determinați cartilajul superior
- Determinați coeficientul de corelație
- Calculați eroarea standard
- Determinați domeniul de valori și domeniul de aplicare al unei funcții
- Se calculează deviația medie medie în raport cu valoarea medie
- Calculați intervalul (statistici)
- Calculați deviația standard
- O interpolare dublă liniară
- Desenați un complot cutie
- Calculați o medie ponderată
- Grafelează o parabolă
- Introduceți date în SPSS
- Calculați abaterea standard cu Excel
- Calculați intervalele de încredere
- Calculați circuitele paralele
- Învățați valori speciale ale funcțiilor trigonometrice utilizând o masă
- Evaluați semnificația statistică
- Z Calculați valorile