Lineárna verzus logistická regresia
Pri štatistickej analýze je dôležité identifikovať vzťahy medzi premennými, ktorých sa štúdia týka. Niekedy to môže byť jediný účel samotnej analýzy. Jedným zo silných nástrojov na zistenie existencie vzťahu a jeho identifikáciu je regresná analýza.
Najjednoduchšou formou regresnej analýzy je lineárna regresia, kde vzťah medzi premennými je lineárny vzťah. Zo štatistického hľadiska poukazuje na vzťah medzi vysvetľujúcou premennou a premennou odozvy. Napríklad pomocou regresie môžeme určiť vzťah medzi cenou komodity a spotrebou na základe údajov zozbieraných z náhodnej vzorky. Regresná analýza vytvorí regresnú funkciu súboru údajov, čo je matematický model, ktorý najlepšie zodpovedá dostupným údajom. To možno ľahko znázorniť bodovým grafom. Graficky regresia je ekvivalentná nájdeniu najlepšej krivky pre daný súbor údajov. Funkciou krivky je regresná funkcia. Pomocou matematického modelu je možné predpovedať použitie komodity pre danú cenu.
Preto je regresná analýza široko používaná pri predpovedaní a prognózovaní. Používa sa tiež na stanovenie vzťahov v experimentálnych údajoch, v oblasti fyziky, chémie av mnohých prírodných vedách a technických disciplínach. Ak je vzťah alebo regresná funkcia lineárnou funkciou, potom je proces známy ako lineárna regresia. V bodovom grafe môže byť znázornená ako priamka. Ak funkcia nie je lineárnou kombináciou parametrov, potom je regresia nelineárna.
Logistická regresia je porovnateľná s mnohorozmernou regresiou a vytvára model na vysvetlenie vplyvu viacerých prediktorov na premennú odozvy. Pri logistickej regresii by však premenná konečného výsledku mala byť kategorická (zvyčajne rozdelená; t. j. pár dosiahnuteľných výsledkov, ako je smrť alebo prežitie, hoci špeciálne techniky umožňujú modelovanie kategorizovanejších informácií). Nepretržitá výsledná premenná môže byť transformovaná na kategorickú premennú, ktorá sa má použiť na logistickú regresiu; zbaľovanie spojitých premenných týmto spôsobom sa však väčšinou neodporúča, pretože to znižuje presnosť.
Na rozdiel od lineárnej regresie, smerom k priemeru, prediktorové premenné v logistickej regresii nemusia byť nútené byť lineárne spojené, bežne distribuované alebo mať rovnaký rozptyl v každom zhluku. Výsledkom je, že vzťah medzi prediktorovými a výslednými premennými pravdepodobne nebude lineárnou funkciou.
Aký je rozdiel medzi logistickou a lineárnou regresiou?
• Pri lineárnej regresii sa predpokladá lineárny vzťah medzi vysvetľujúcou premennou a premennou odozvy a pomocou analýzy sa zistia parametre vyhovujúce modelu, čím sa získa presný vzťah.
• Lineárna regresia sa vykonáva pre kvantitatívne premenné a výsledná funkcia je kvantitatívna.
• Pri logistickej regresii môžu byť použité údaje buď kategorické alebo kvantitatívne, ale výsledok je vždy kategorický.