1
Înțelegeți terminologia. Cuvântul "mediu" apare în mod constant la discutarea datelor statistice. La prima vedere, termenul pare destul de clar: media returnează un număr care reprezintă media totalului valorilor numerice. Cu toate acestea, există o serie de medii diferite care vă pot induce în eroare dacă nu le puteți spune separat.
- media aritmetică se calculează prin adăugarea tuturor numerelor într-un set de date și apoi prin împărțirea acestora pe numărul de puncte de date. Cu alte cuvinte, dacă aveți numerele 3, 3, 5, 4 și 7, le adăugați și obțineți 22 și împărțiți suma cu 5 (deoarece înregistrarea este formată din 5 numere).
- În acest exemplu, media aritmetică este de 4,4.
- mediană Un set de date reprezintă valoarea care se află la jumătatea distanței dintre numerele mici și cele înalte. Folosind aceleași numere ca în exemplul anterior (3, 3, 5, 4 și 7), valoarea mediană este de 4, deoarece două numere sunt mai mici și două sunt mai mari.
- mod reprezintă numărul cel mai comun al unei înregistrări. În exemplul nostru, modul este 3 deoarece numărul apare de două ori.
2
Cheat cu media aritmetică. Media aritmetică poate părea cea mai logică modalitate de a calcula o medie, dar, desigur, nu este cazul. Motivul pentru aceasta este că valorile foarte mari sau joase dintr-un set de date pot denatura grav media. Pentru a trișa cu media aritmetică, colectați valori de valori din setul de date și permiteți-le să curgă în calcul.
- Să presupunem că ați intervievat 50 de gospodării într-un cartier în funcție de venitul lor. Majoritatea gospodăriilor câștigă între 25.000 și 45.000 de euro pe an, însă o gospodărie are un venit de 5 milioane de euro. Dacă acum calculați venitul mediu, este mult mai mare decât venitul mediu "real" al acestei zone, deoarece cele 5 milioane de euro sunt mult mai mari decât venitul unei gospodării normale.
- În mod similar, dacă aveți date care arată că 9 persoane au 1000 de euro în contul lor, dar a zecea este doar 1 euro, media este de 900,10 euro - cu aproape 10% mai mică decât cea mai comună sumă.
- Prin urmare, în sondaje serioase, punctele de date foarte mari și foarte scăzute sunt adesea eliminate înainte de calcularea mediei. Dar nu toate sondajele care apar în mass-media sunt serioase. Dacă nu puteți accesa înregistrările colectate și nu există nici o asigurare scrisă că au fost eliminate valorile depășite, trebuie să presupunem că acest lucru nu a fost făcut.
3
Cheat cu mediana. De fapt, este relativ dificil să trișezi cu mediana, deoarece nu poate fi niciodată prea mare sau prea scăzut în comparație. Trebuie să fie nevoit să trișeze în mijloc. Mediana este, prin urmare, potrivită pentru a ascunde numere foarte mari sau mici. De exemplu, dacă înregistrarea dvs. este 1, 1, 2, 3, 4, 5, 3000, valoarea mediană este de 3.
- Dacă aveți un număr par de puncte de date, puteți găsi mediana calculând media celor două intrări de mijloc. Dar atunci aveți în continuare problema cu valori excepționale.
- Deveniți alertați dacă mediana este utilizată pentru a reprezenta schimbările în timp. O companie ale cărei prețuri cresc cu 3% în fiecare an ar putea să le crească cu 20% într-un an, iar acest lucru ar putea fi B. prin indicarea valorii mediane pentru ultimii 9 ani.
4
Cheat cu modul. Pentru unele lucruri, este aproape imposibil să se trișeze cu modul, de ex. De exemplu, în medie, numărul de bilete achiziționate de o persoană pentru un meci de fotbal. Aceasta este aproape întotdeauna reprodusă corect de mod. Cu toate acestea, chiar și cu modul, punctele importante de date pot fi ascunse, în special în seturi de date mici.
- De exemplu, dacă aveți o înregistrare cu toate numerele în intervalul de la 1 la 100, dar numărul 1 apare de trei ori, modul este Record 1, deși media (mult mai rezonabilă în acest exemplu) ar fi 50.
- Orice sondaj a cărui întrebare este răspuns la o scară largă poate fi ușor de manipulat cu modul. Dacă z. De exemplu, dacă 100 de persoane au evaluat ceva de la 1 la 10 și mai multe persoane răspund la întrebarea cu "10" decât orice alt număr, modul este de 10, chiar dacă doar o persoană a evaluat întrebarea 10 mai mult decât numărul de persoane care au făcut le-a calificat drept 1
5
Cheat cu figuri reprezentative. Dacă aveți un set de date care nu conține numere concrete, ci abstracte (de exemplu, un sondaj al satisfacției clienților), este foarte ușor de manipulat. Dacă vă cere oamenilor pentru a evalua satisfacția lor pe o scară de la 1 la 3, care nu dovedește neapărat că clienții au ales trei, sunt de trei ori mai mulțumiți decât clienții care evaluează situația de la 1. În acest fel, mediile sunt manipulate foarte des, dar se întâmplă și cu mediana și, uneori, cu modul.