Rozdiel medzi centrálnou tendenciou a rozptylom

Rozdiel medzi centrálnou tendenciou a rozptylom
Rozdiel medzi centrálnou tendenciou a rozptylom

Video: Rozdiel medzi centrálnou tendenciou a rozptylom

Video: Rozdiel medzi centrálnou tendenciou a rozptylom
Video: Flashback Friday: How Not to Die 2024, December
Anonim

Centrálna tendencia verzus rozptýlenie

V deskriptívnej a inferenčnej štatistike sa na opis súboru údajov používa niekoľko indexov zodpovedajúcich jeho centrálnej tendencii, rozptylu a šikmosti: tri najdôležitejšie vlastnosti, ktoré určujú relatívny tvar distribúcie súboru údajov.

Čo je ústredná tendencia?

Centrálna tendencia označuje a lokalizuje stred distribúcie hodnôt. Priemer, modus a medián sú najčastejšie používané indexy pri opise centrálnej tendencie súboru údajov. Ak je súbor údajov symetrický, potom sa medián aj priemer súboru údajov navzájom zhodujú.

Pri množine údajov sa priemer vypočíta tak, že sa zoberie súčet všetkých hodnôt údajov a potom sa vydelí počtom údajov. Napríklad hmotnosti 10 ľudí (v kilogramoch) sa zmerajú na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Potom môže byť priemerná hmotnosť desiatich ľudí (v kilogramoch) vypočítané nasledovne. Súčet váh je 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Priemer=(súčet) / (počet údajov)=710 / 10=71 (v kilogramoch). Rozumie sa, že odľahlé hodnoty (údajové body, ktoré sa odchyľujú od normálneho trendu) majú tendenciu ovplyvňovať priemer. Preto v prítomnosti odľahlých hodnôt samotná stredná hodnota neposkytne správny obraz o strede súboru údajov.

Medián je údajový bod, ktorý sa nachádza presne v strede množiny údajov. Jedným zo spôsobov, ako vypočítať medián, je zoradiť dátové body vo vzostupnom poradí a potom nájsť dátový bod v strede. Napríklad, ak po objednaní vyzerá predchádzajúci súbor údajov ako 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Preto je (70+72)/2=71 v strede. Z toho je zrejmé, že medián nemusí byť v súbore údajov. Medián nie je ovplyvnený prítomnosťou odľahlých hodnôt. Medián bude teda slúžiť ako lepšia miera centrálnej tendencie v prítomnosti odľahlých hodnôt.

Režim je najčastejšie sa vyskytujúca hodnota v súbore údajov. V predchádzajúcom príklade sa hodnoty 70 a 72 vyskytnú dvakrát, takže oba sú režimy. To ukazuje, že v niektorých distribúciách existuje viac ako jedna modálna hodnota. Ak existuje iba jeden režim, súbor údajov sa považuje za unimodálny, v tomto prípade je súbor údajov bimodálny.

Čo je rozptyl?

Rozptyl je množstvo šírenia údajov o strede distribúcie. Rozsah a štandardná odchýlka sú najčastejšie používané miery rozptylu.

Rozsah je jednoducho najvyššia hodnota mínus najnižšia hodnota. V predchádzajúcom príklade je najvyššia hodnota 80 a najnižšia hodnota je 62, takže rozsah je 80-62=18. Rozsah však neposkytuje dostatočný obraz o rozptyle.

Na výpočet štandardnej odchýlky sa najprv vypočítajú odchýlky hodnôt údajov od priemeru. Stredná odmocnina odchýlok sa nazýva štandardná odchýlka. V predchádzajúcom príklade sú príslušné odchýlky od priemeru (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 a (79 – 71)=8. Súčet štvorce odchýlky sú (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Štandardná odchýlka je √(366/10)=6,05 (v kilogramoch). Pokiaľ nie je množina údajov výrazne skreslená, možno z toho vyvodiť záver, že väčšina údajov je v intervale 71±6,05 a je tomu tak aj v tomto konkrétnom príklade.

Aký je rozdiel medzi centrálnou tendenciou a rozptylom?

• Centrálna tendencia označuje a lokalizuje stred distribúcie hodnôt

• Rozptyl je množstvo rozšírení údajov o strede množiny údajov.

Odporúča: