Kľúčový rozdiel medzi klasifikáciou a regresným stromom je v tom, že v klasifikácii sú závislé premenné kategorické a neusporiadané, zatiaľ čo v regresii sú závislé premenné spojité alebo usporiadané celé hodnoty.
Klasifikácia a regresia sú techniky učenia sa na vytváranie modelov predpovedí zo zhromaždených údajov. Obidve techniky sú graficky prezentované ako klasifikačné a regresné stromy, alebo skôr vývojové diagramy s rozdelením údajov po každom kroku, alebo skôr ako „vetva“v strome. Tento proces sa nazýva rekurzívne rozdelenie. Oblasti, ako je baníctvo, používajú tieto klasifikačné a regresné techniky učenia. Tento článok sa zameriava na klasifikačný strom a regresný strom.
Čo je klasifikácia?
Klasifikácia je technika používaná na dosiahnutie schémy, ktorá ukazuje organizáciu údajov počnúc prekurzorovou premennou. Závislé premenné sú to, čo klasifikuje údaje.
Obrázok 01: Data Mining
Strom klasifikácie začína nezávislou premennou, ktorá sa rozvetvuje do dvoch skupín podľa existujúcich závislých premenných. Je určený na objasnenie odpovedí vo forme kategorizácie vyvolanej závislými premennými.
Čo je regresia
Regresia je metóda predikcie, ktorá je založená na predpokladanej alebo známej číselnej výstupnej hodnote. Táto výstupná hodnota je výsledkom série rekurzívneho delenia, pričom každý krok má jednu číselnú hodnotu a ďalšiu skupinu závislých premenných, ktoré sa rozvetvujú na ďalší pár, ako je tento.
Regresný strom začína jednou alebo viacerými prekurzorovými premennými a končí jednou konečnou výstupnou premennou. Závislé premenné sú buď spojité alebo diskrétne numerické premenné.
Aký je rozdiel medzi klasifikáciou a regresiou?
Klasifikácia verzus regresia |
|
Stromový model, kde cieľová premenná môže nadobudnúť samostatnú množinu hodnôt. | Stromový model, kde cieľová premenná môže nadobúdať spojité hodnoty, zvyčajne reálne čísla. |
Závislá premenná | |
Pre klasifikačný strom sú závislé premenné kategorické. | Pre regresný strom sú závislé premenné numerické. |
Hodnoty | |
Má nastavené množstvo neusporiadaných hodnôt. | Má buď diskrétne, ale usporiadané hodnoty, alebo indiskrétne hodnoty. |
Účel stavby | |
Účelom konštrukcie regresného stromu je prispôsobiť regresný systém každej vetve determinantu tak, aby sa dosiahla očakávaná výstupná hodnota. | Strom klasifikácie sa rozvetvuje, ako je určené závislou premennou odvodenou z predchádzajúceho uzla. |
Súhrn – Klasifikácia verzus regresia
Regresné a klasifikačné stromy sú užitočné techniky na zmapovanie procesu, ktorý poukazuje na študovaný výsledok, či už ide o klasifikáciu alebo jednu číselnú hodnotu. Rozdiel medzi klasifikačným stromom a regresným stromom je ich závislou premennou. Klasifikačné stromy majú závislé premenné, ktoré sú kategorické a neusporiadané. Regresné stromy majú závislé premenné, ktoré sú spojité hodnoty alebo usporiadané celé hodnoty.