Štandardná odchýlka vs. priemer
V deskriptívnej a inferenčnej štatistike sa používa niekoľko indexov na opis súboru údajov zodpovedajúcich jeho centrálnej tendencii, rozptylu a šikmosti. V štatistickej inferencii sú tieto bežne známe ako odhady, pretože odhadujú hodnoty parametrov populácie.
Centrálna tendencia označuje a lokalizuje stred distribúcie hodnôt. Priemer, modus a medián sú najčastejšie používané indexy pri opise centrálnej tendencie súboru údajov. Rozptyl je množstvo šírenia údajov z centra distribúcie. Rozsah a štandardná odchýlka sú najbežnejšie používané miery rozptylu. Pearsonove koeficienty šikmosti sa používajú na opis šikmosti rozloženia údajov. Tu sa zošikmenie týka toho, či je množina údajov symetrická podľa stredu alebo nie, a ak nie, ako je skreslená.
Čo to znamená?
Mean je najčastejšie používaný index centrálnej tendencie. Pre daný súbor údajov sa priemer vypočíta tak, že sa zoberie súčet všetkých hodnôt údajov a potom sa vydelí počtom údajov. Napríklad hmotnosti 10 ľudí (v kilogramoch) sa zmerajú na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Potom môže byť priemerná hmotnosť desiatich ľudí (v kilogramoch) vypočítané nasledovne. Súčet váh je 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Priemer=(súčet) / (počet údajov)=710 / 10=71 (v kilogramoch).
Ako v tomto konkrétnom príklade, stredná hodnota súboru údajov nemusí byť bodom údajov súboru, ale bude jedinečná pre daný súbor údajov. Priemer bude mať rovnaké jednotky ako pôvodné údaje. Preto môže byť označený na rovnakej osi ako údaje a môže byť použitý pri porovnávaní. Taktiež neexistuje žiadne obmedzenie znamienka pre priemer súboru údajov. Môže byť záporný, nulový alebo kladný, keďže súčet množiny údajov môže byť záporný, nulový alebo kladný.
Čo je štandardná odchýlka?
Štandardná odchýlka je najčastejšie používaným indexom rozptylu. Na výpočet štandardnej odchýlky sa najprv vypočítajú odchýlky hodnôt údajov od priemeru. Stredná odmocnina odchýlok sa nazýva štandardná odchýlka.
V predchádzajúcom príklade sú príslušné odchýlky od priemeru (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 a (79-71)=8. Súčet štvorcov odchýlky je (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Štandardná odchýlka je √(366/10)=6,05 (v kilogramoch). Z toho možno usúdiť, že väčšina údajov je v intervale 71±6.05, za predpokladu, že množina údajov nie je výrazne skreslená, a je to naozaj tak v tomto konkrétnom príklade.
Keďže štandardná odchýlka má rovnaké jednotky ako pôvodné údaje, poskytuje nám mieru toho, ako veľmi sa údaje odchyľujú od stredu; väčšia štandardná odchýlka väčšia disperzia. Štandardná odchýlka bude tiež nezáporná hodnota bez ohľadu na povahu údajov v množine údajov.
Aký je rozdiel medzi štandardnou odchýlkou a priemerom?
• Štandardná odchýlka je mierou rozptylu od stredu, zatiaľ čo stredná hodnota meria polohu stredu súboru údajov.
• Štandardná odchýlka je vždy nezáporná hodnota, ale stredná hodnota môže nadobudnúť akúkoľvek skutočnú hodnotu.