Populácia verzus vzorová štandardná odchýlka
V štatistikách sa používa niekoľko indexov na opis súboru údajov zodpovedajúcich jeho centrálnej tendencii, rozptylu a šikmosti. Smerodajná odchýlka je jednou z najbežnejších mier rozptylu údajov od stredu súboru údajov.
Vzhľadom na praktické ťažkosti nebude možné pri testovaní hypotézy použiť údaje z celej populácie. Preto používame hodnoty údajov zo vzoriek na vyvodenie záverov o populácii. V takejto situácii sa nazývajú odhady, pretože odhadujú hodnoty parametrov populácie.
Je mimoriadne dôležité používať pri vyvodzovaní nezaujaté odhady. Odhad je považovaný za nezaujatý, ak sa očakávaná hodnota tohto odhadu rovná parametru populácie. Napríklad používame výberový priemer ako nestranný odhad pre priemer populácie. (Matematicky je možné ukázať, že očakávaná hodnota priemeru vzorky sa rovná priemeru populácie). V prípade odhadu smerodajnej odchýlky populácie je nestranným odhadom aj vzorová smerodajná odchýlka.
Čo je štandardná odchýlka populácie?
Keď je možné vziať do úvahy údaje za celú populáciu (napríklad v prípade sčítania ľudu), je možné vypočítať smerodajnú odchýlku populácie. Na výpočet štandardnej odchýlky populácie sa najprv vypočítajú odchýlky hodnôt údajov od priemernej hodnoty populácie. Odmocnina (kvadratický priemer) odchýlok sa nazýva štandardná odchýlka populácie.
V triede s 10 študentmi je možné jednoducho zbierať údaje o študentoch. Ak sa hypotéza testuje na tejto populácii študentov, potom nie je potrebné používať vzorové hodnoty. Napríklad hmotnosti 10 študentov (v kilogramoch) sa zmerajú na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Potom je priemerná hmotnosť desiatich ľudí (v kilogramoch) (70+62+65+72+80+70+63+72+77+79)/10, čo je 71 (v kilogramoch). Toto je priemerná populácia.
Teraz na výpočet štandardnej odchýlky populácie vypočítame odchýlky od priemeru. Príslušné odchýlky od priemeru sú (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 a (79 – 71)=8. Súčet štvorcov odchýlky je (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Štandardná odchýlka populácie je √(366/10)=6,05 (v kilogramoch). 71 je presná priemerná váha študentov triedy a 6.05 je presná štandardná odchýlka hmotnosti od 71.
Čo je vzorová smerodajná odchýlka?
Keď sa na odhad parametrov populácie použijú údaje zo vzorky (veľkosti n), vypočíta sa štandardná odchýlka vzorky. Najprv sa vypočítajú odchýlky hodnôt údajov od priemeru vzorky. Keďže sa namiesto priemeru populácie (ktorý nie je známy) používa priemer vzorky, nie je vhodné brať kvadratický priemer. Aby sa kompenzovalo použitie výberového priemeru, súčet štvorcov odchýlok sa vydelí (n-1) namiesto n. Vzorová štandardná odchýlka je druhou odmocninou tejto hodnoty. V matematických symboloch S=√{∑(xi-ẍ)2 / (n-1)}, kde S je vzorová štandardná odchýlka, ẍ je vzorový priemer a xi sú dátové body.
Teraz predpokladajme, že v predchádzajúcom príklade sú populáciou študenti celej školy. Potom bude trieda len ukážkou. Ak sa pri odhade použije táto vzorka, štandardná odchýlka vzorky bude √(366/9)=6.38 (v kilogramoch), pretože 366 bolo delené 9 namiesto 10 (veľkosť vzorky). Faktom je, že nie je zaručené, že ide o presnú hodnotu štandardnej odchýlky populácie. Je to len odhad.
Aký je rozdiel medzi štandardnou odchýlkou populácie a štandardnou odchýlkou vzorky?
• Štandardná odchýlka populácie je presná hodnota parametra použitá na meranie rozptylu od stredu, zatiaľ čo štandardná odchýlka vzorky je pre ňu nezaujatým odhadom.
• Smerodajná odchýlka populácie sa vypočíta, keď sú známe všetky údaje týkajúce sa každého jednotlivca v populácii. V opačnom prípade sa vypočíta štandardná odchýlka vzorky.
• Smerodajná odchýlka populácie je daná vzťahom σ=√{ ∑(xi-µ)2/ n} kde µ je priemer populácie a n je veľkosť populácie, ale vzorová smerodajná odchýlka je daná ako S=√{ ∑(xi-ẍ)2 / (n-1)} kde ẍ je priemer vzorky a n je veľkosť vzorky.