Popisná verzus odvodená štatistika
Štatistika je disciplína zberu, analýzy a prezentácie údajov. Teória štatistiky je rozdelená do dvoch odvetví na základe informácií, ktoré produkujú analýzou údajov.
Čo je to popisná štatistika?
Popisná štatistika je odvetvie štatistiky, ktoré kvantitatívne popisuje hlavné vlastnosti súboru údajov. S cieľom čo najpresnejšie reprezentovať vlastnosti súboru údajov sú údaje sumarizované pomocou grafických alebo numerických nástrojov.
Grafická sumarizácia sa vykonáva pomocou tabuliek, zoskupení a grafov hodnôt záujmových premenných. Takýmito reprezentáciami sú histogramy distribúcie frekvencie a relatívnej distribúcie frekvencie. Zobrazujú distribúciu hodnôt v rámci populácie.
Číselná sumarizácia zahŕňa výpočet popisných mier, ako sú priemer, režim a priemer. Opisné miery sú ďalej kategorizované do dvoch tried; sú to miery centrálnej tendencie a miery rozptylu/variácie. Miery centrálnej tendencie sú priemer/priemer, medián a modus. Každý z nich má svoju vlastnú úroveň použiteľnosti a užitočnosti. Ak jeden zlyhá, druhý môže lepšie reprezentovať množinu údajov.
Ako už názov napovedá, miery rozptylu zahŕňajú meranie distribúcie údajov. Rozsah, štandardná odchýlka, rozptyl, percentily a kvartilové rozsahy a variačný koeficient sú miery disperzie. Poskytujú informácie o šírení údajov.
Jednoduchým príkladom použitia deskriptívnej štatistiky je výpočet priemernej známky študenta. GPA je v podstate vážený priemer výsledkov študentov a je odrazom celkového akademického výkonu daného študenta.
Čo je inferenčná štatistika?
Inferenčná štatistika je odvetvie štatistiky, ktoré odvodzuje závery o príslušnej populácii zo súboru údajov získaných zo vzorky podrobenej náhodným, pozorovacím a výberovým variáciám. Vo všeobecnosti sa výsledky získajú z náhodnej vzorky populácie a závery odvodené zo vzorky sa potom zovšeobecnia, aby reprezentovali celú populáciu.
Vzorka je podmnožinou populácie a miery popisnej štatistiky pre údaje získané zo vzorky sú jednoducho známe ako štatistika. Miery deskriptívnej štatistiky získané z analýzy vzorky sú známe ako parametre, keď sa aplikujú na populáciu a predstavujú celú populáciu.
Inferenčné štatistiky sa zameriavajú na to, ako čo najpresnejšie zovšeobecniť štatistiky získané zo vzorky, aby reprezentovali populáciu. Jedným z faktorov, ktoré vyvolávajú obavy, je povaha vzorky. Ak je vzorka skreslená, potom sú skreslené aj výsledky a parametre založené na nich nereprezentujú správne celú populáciu. Preto je odber vzoriek jednou z dôležitých štúdií inferenčnej štatistiky. Štatistické predpoklady, teória štatistického rozhodovania a teória odhadov, testovanie hypotéz, návrh experimentov, analýza rozptylu a analýza regresie sú hlavnými témami štúdia teórie inferenčných štatistík.
Dobrým príkladom inferenčnej štatistiky v praxi je predpovedanie výsledkov volieb pred hlasovaním prostredníctvom prieskumov.
Aký je rozdiel medzi deskriptívnou a odvodenou štatistikou?
• Popisná štatistika je zameraná na zhrnutie údajov zhromaždených zo vzorky. Táto technika vytvára miery centrálnej tendencie a rozptylu, ktoré predstavujú, ako sú hodnoty premenných koncentrované a rozptýlené.
• Inferenčná štatistika zovšeobecňuje štatistiky získané zo vzorky na všeobecnú populáciu, do ktorej vzorka patrí. Miery populácie sa nazývajú parametre.
• Opisná štatistika iba sumarizuje vlastnosti vzorky, z ktorej boli získané údaje, ale v inferenčnej štatistike sa miera zo vzorky používa na odvodenie vlastností populácie.
• V inferenčnej štatistike boli parametre získané zo vzorky, ale nie z celej populácie; preto vždy existuje určitá neistota v porovnaní so skutočnými hodnotami.