Odchýlka verzus štandardná odchýlka
Odchýlka verzus štandardná odchýlka
V deskriptívnej a inferenčnej štatistike sa používa niekoľko indexov na opis súboru údajov zodpovedajúcich jeho centrálnej tendencii, rozptylu a šikmosti. V štatistickej inferencii sú tieto bežne známe ako odhady, pretože odhadujú hodnoty parametrov populácie.
Disperzia je miera šírenia údajov okolo stredu súboru údajov. Smerodajná odchýlka je jednou z najbežnejšie používaných mier rozptylu. Odchýlky každého údajového bodu od priemeru sa berú do úvahy pri výpočte štandardnej odchýlky. Preto možno tvrdiť, že štandardná odchýlka spolu s priemerom poskytnú takmer dostatočný obraz o súbore údajov.
Zvážte nasledujúci súbor údajov. Hmotnosť 10 ľudí (v kilogramoch) sa meria 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Potom je priemerná hmotnosť desiatich ľudí (v kilogramoch) 71 (v kilogramoch).).
Čo je odchýlka?
V štatistike odchýlka znamená hodnotu, o ktorú sa jeden údajový bod líši od pevnej hodnoty, ako je napríklad priemer. Vo všeobecnosti nech k je pevná hodnota a x1, x2, …, xn označuje údaj nastaviť. Potom je odchýlka xj od k definovaná ako (xj– k).
Napríklad vo vyššie uvedenom súbore údajov sú príslušné odchýlky od priemeru (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 a (79 – 71)=8.
Čo je štandardná odchýlka?
Keď je možné brať do úvahy údaje za celú populáciu (napríklad v prípade sčítania ľudu), je možné vypočítať smerodajnú odchýlku populácie. Na výpočet štandardnej odchýlky populácie sa najprv vypočítajú odchýlky hodnôt údajov od priemernej hodnoty populácie. Kvadratický priemer (kvadratický priemer) odchýlok sa nazýva štandardná odchýlka populácie. V symboloch σ=√{ ∑(xi-µ)2 / n} kde µ je priemer populácie a n je veľkosť populácie.
Keď sa na odhad parametrov populácie použijú údaje zo vzorky (veľkosti n), vypočíta sa štandardná odchýlka vzorky. Najprv sa vypočítajú odchýlky hodnôt údajov od priemeru vzorky. Keďže sa namiesto priemeru populácie (ktorý nie je známy) používa priemer vzorky, nie je vhodné brať kvadratický priemer. Aby sa kompenzovalo použitie výberového priemeru, súčet štvorcov odchýlok sa vydelí (n-1) namiesto n. Vzorová štandardná odchýlka je druhou odmocninou tejto hodnoty. V matematických symboloch S=√{ ∑(xi-ẍ)2 / (n-1)}, kde S je vzorová štandardná odchýlka, ẍ je vzorový priemer a xi sú dátové body.
V predchádzajúcom súbore údajov je súčet štvorcov odchýlky (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Štandardná odchýlka populácie je teda √(366/10)=6,05 (v kilogramoch). (Za predpokladu, že uvažovaná populácia pozostáva z 10 ľudí, od ktorých boli prevzaté údaje).
Aký je rozdiel medzi odchýlkou a štandardnou odchýlkou?
• Štandardná odchýlka je štatistický index a odhad, ale odchýlka nie je.
• Štandardná odchýlka je miera rozptylu zhluku údajov od stredu, zatiaľ čo odchýlka predstavuje množstvo, o ktoré sa jeden údajový bod líši od pevnej hodnoty.