Priemerná vs. medián vs.režim
Priemerná hodnota, medián a modus sú primárne miery centrálnej tendencie používané v deskriptívnej štatistike. Sú navzájom úplne odlišné a prípady, v ktorých sa používajú na zhrnutie údajov, sú tiež odlišné.
Mean
Aritmetický priemer je súčet hodnôt údajov vydelený počtom hodnôt údajov, t.j.
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Ak údaje pochádzajú z priestoru vzoriek, nazývajú sa to výberový priemer ([latex]\bar{x} [/latex]), čo je popisná štatistika vzorky. Hoci je to najbežnejšie používaná popisná miera vzorky, nejde o robustnú štatistiku. Je veľmi citlivý na odľahlé hodnoty a oscilácie.
Zvážte napríklad priemerný príjem obyvateľov konkrétneho mesta. Keďže všetky hodnoty údajov sú sčítané a potom rozdelené, príjem extrémne bohatého človeka výrazne ovplyvňuje priemer. Preto priemerné hodnoty nie sú vždy dobrým vyjadrením údajov.
V prípade striedavého signálu sa prúd prechádzajúci prvkom periodicky mení z kladného smeru do záporného smeru a naopak. Ak vezmeme priemerný prúd prechádzajúci prvkom za jednu periódu, dostane 0, čo znamená, že prvkom neprešiel žiadny prúd, čo samozrejme nie je pravda. Preto ani v tomto prípade nie je aritmetický priemer dobrým meradlom.
Aritmetický priemer je dobrým ukazovateľom, keď sú údaje rovnomerne rozdelené. Pre normálne rozdelenie sa priemer rovná modusu a mediánu. Má tiež najnižšie rezíduá, keď sa berie do úvahy stredná druhá mocnina chyby; preto je to najlepšia popisná miera, keď sa vyžaduje reprezentovať množinu údajov jedným číslom.
Median
Hodnoty stredného dátového bodu po usporiadaní všetkých dátových hodnôt vo vzostupnom poradí sú definované ako medián dátového súboru. Medián je 2. kvartil, 5. decil a 50. percentil.
• Ak je počet pozorovaní (dátových bodov) nepárny, potom medián je pozorovanie presne v strede zoradeného zoznamu.
• Ak je počet pozorovaní (dátových bodov) párny, potom je medián priemerom dvoch stredných pozorovaní v zoradenom zozname.
Medián rozdeľuje pozorovanie do dvoch skupín; t.j. skupina (50 %) hodnôt vyšších a skupina (50 %) hodnôt nižších ako je medián. Mediány sa špecificky používajú v skreslených rozdeleniach a predstavujú údaje oveľa lepšie ako aritmetický priemer.
Režim
Režim je najčastejšie sa vyskytujúce číslo v skupine pozorovaní. Režim množiny údajov sa vypočítava zistením frekvencie každého prvku v množine.
• Ak sa žiadna hodnota nevyskytuje viac ako raz, množina údajov nemá žiadny režim.
• V opačnom prípade je každá hodnota, ktorá sa vyskytuje s najvyššou frekvenciou, režimom súboru údajov.
V súprave môže existovať viac ako 1 režim; režim preto nie je jedinečnou štatistikou súboru údajov. Pri rovnomernom rozdelení existuje jeden režim. Režim diskrétneho rozdelenia pravdepodobnosti je bod, v ktorom funkcia hmotnosti pravdepodobnosti dosiahne svoj najvyšší bod. Na základe vyššie uvedených interpretácií môžeme povedať, že globálne maximá sú režimy.
Zvážte aplikáciu všetkých troch opatrení na nasledujúci súbor údajov.
ÚDAJE: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15
Priemer=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Medián=9 (13. prvok)
Režim=9 (frekvencia 9=5)
Aký je rozdiel medzi priemerom, mediánom a režimom?
• Aritmetický priemer je súčet hodnôt (pozorovaní) vydelený počtom pozorovaní. Nie je to robustná štatistika a silne závisí od povahy normálneho rozdelenia v rámci uvažovaného rozdelenia. Jediná odľahlá hodnota môže spôsobiť významný posun v priemere, čo dáva relatívne zavádzajúce hodnoty. Pojem možno rozšíriť na geometrický priemer, harmonický priemer, vážený priemer atď.
• Medián sú stredné hodnoty súboru pozorovaní a je relatívne menej ovplyvnený odľahlými hodnotami. Môže poskytnúť dobrý odhad ako súhrnná štatistika vo veľmi skreslených prípadoch.
• Režim je najbežnejšie pozorované hodnoty v súbore údajov. Ak je rozdelenie kladne zošikmené, režim leží vľavo k mediánu a ak je záporne skosené, režim leží vpravo k mediánu.
• Ak je kladne vychýlený, priemer sa rovná mediánu; ak je záporne zošikmený, priemer je vľavo od mediánu.
• V normálnom rozdelení sú všetky tri, priemer, režim a medián rovnaké.