Variancia vs kovariancia
Variancia a kovariancia sú dve miery používané v štatistike. Rozptyl je mierou rozptylu údajov a kovariancia označuje stupeň zmeny dvoch náhodných premenných spolu. Rozptyl je skôr intuitívny koncept, ale kovariancia je definovaná matematicky, pretože spočiatku nie je tak intuitívna.
Viac o rozptyle
Variancia je miera rozptylu údajov od strednej hodnoty rozdelenia. Hovorí, ako ďaleko ležia dátové body od strednej hodnoty rozdelenia. Je to jeden z primárnych deskriptorov rozdelenia pravdepodobnosti a jeden z momentov rozdelenia. Rozptyl je tiež parametrom populácie a rozptyl vzorky od populácie pôsobí ako odhad rozptylu populácie. Z jednej perspektívy je definovaný ako druhá mocnina štandardnej odchýlky.
Jednoducho to možno opísať ako priemer druhých mocnín vzdialenosti medzi každým dátovým bodom a strednou hodnotou rozdelenia. Na výpočet rozptylu sa používa nasledujúci vzorec.
Var(X)=E[(X-µ)2] pre populáciu a
Var(X)=E[(X-‾x)2] pre vzorku
Môže byť ďalej zjednodušené tak, že dá Var(X)=E[X2]-(E[X])2.
Variancia má niektoré vlastnosti podpisu a často sa používa v štatistikách na uľahčenie používania. Rozptyl nie je záporný, pretože ide o druhú mocninu vzdialeností. Rozsah rozptylu však nie je obmedzený a závisí od konkrétneho rozdelenia. Rozptyl konštantnej náhodnej premennej je nula a rozptyl sa nemení vzhľadom na parameter polohy.
Viac o kovariancii
V štatistickej teórii je kovariancia mierou toho, do akej miery sa spolu menia dve náhodné premenné. Inými slovami, kovariancia je mierou sily korelácie medzi dvoma náhodnými premennými. Tiež to možno považovať za zovšeobecnenie konceptu rozptylu dvoch náhodných premenných.
Kovariancia dvoch náhodných premenných X a Y, ktoré sú spoločne rozdelené s konečnou sekundou hybnosti, je známa ako σXY=E[(X-E[X])(Y-E[Y])]. Z toho možno na rozptyl vnímať ako na špeciálny prípad kovariancie, kde sú dve premenné rovnaké. Cov(X, X)=Var(X)
Normalizáciou kovariancie možno získať lineárny korelačný koeficient alebo Pearsonov korelačný koeficient, ktorý je definovaný ako ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Graficky možno kovarianciu medzi dvojicou údajových bodov považovať za oblasť obdĺžnika s údajovými bodmi v opačných vrcholoch. Dá sa interpretovať ako miera veľkosti oddelenia medzi dvoma dátovými bodmi. Ak vezmeme do úvahy obdĺžniky pre celú populáciu, prekrytie obdĺžnikov zodpovedajúcich všetkým údajovým bodom možno považovať za silu oddelenia; rozptyl dvoch premenných. Kovariancia je v dvoch dimenziách kvôli dvom premenným, ale zjednodušením na jednu premennú dostaneme rozptyl jednej ako oddelenie v jednej dimenzii.
Aký je rozdiel medzi varianciou a kovarianciou?
• Rozptyl je miera šírenia/disperzie v populácii, zatiaľ čo kovariancia sa považuje za mieru variácie dvoch náhodných premenných alebo sily korelácie.
• Rozptyl možno považovať za špeciálny prípad kovariancie.
• Rozptyl a kovariancia závisia od veľkosti hodnôt údajov a nemožno ich porovnávať; preto sú normalizované. Kovariancia je normalizovaná na korelačný koeficient (delený súčinom štandardných odchýlok dvoch náhodných premenných) a rozptyl je normalizovaný na štandardnú odchýlku (odmocnením)