Kľúčový rozdiel – strojové učenie pod dohľadom a bez dozoru
Učenie pod dohľadom a učenie bez dozoru sú dva základné koncepty strojového učenia. Supervised Learning je úloha strojového učenia na učenie funkcie, ktorá mapuje vstup na výstup na základe príkladov vstupno-výstupných párov. Unsupervised Learning je úlohou strojového učenia odvodiť funkciu na opis skrytej štruktúry z neoznačených údajov. Kľúčový rozdiel medzi strojovým učením pod dohľadom a bez dozoru spočíva v tom, že učenie pod dohľadom používa označené údaje, zatiaľ čo učenie bez dozoru používa neoznačené údaje.
Strojové učenie je oblasť počítačovej vedy, ktorá umožňuje počítačovým systémom učiť sa z údajov bez toho, aby boli explicitne naprogramované. Umožňuje analyzovať údaje a predpovedať v nich vzorce. Existuje mnoho aplikácií strojového učenia. Niektoré z nich sú rozpoznávanie tváre, rozpoznávanie gest a rozpoznávanie reči. Existujú rôzne algoritmy súvisiace so strojovým učením. Niektoré z nich sú regresia, klasifikácia a zhlukovanie. Najbežnejšie programovacie jazyky na vývoj aplikácií založených na strojovom učení sú R a Python. Je možné použiť aj iné jazyky ako Java, C++ a Matlab.
Čo je učenie pod dohľadom?
V systémoch založených na strojovom učení model funguje podľa algoritmu. Pri učení pod dohľadom je model pod dohľadom. Najprv je potrebné model vycvičiť. Na základe získaných poznatkov dokáže predpovedať odpovede pre budúce prípady. Model je trénovaný pomocou označeného súboru údajov. Keď sa do systému dostanú údaje mimo vzorky, môže predpovedať výsledok. Nasleduje malý výňatok z populárneho súboru údajov IRIS.
Podľa vyššie uvedenej tabuľky sa atribúty nazývajú dĺžka sepalu, šírka sepalu, dĺžka patela, šírka patela a druhy. Stĺpce sú známe ako funkcie. Jeden riadok obsahuje údaje pre všetky atribúty. Preto sa jeden riadok nazýva pozorovanie. Údaje môžu byť číselné alebo kategorické. Model dostane pozorovania so zodpovedajúcim názvom druhu ako vstupom. Keď sa zadá nové pozorovanie, model by mal predpovedať typ druhu, ku ktorému patrí.
V učení pod dohľadom existujú algoritmy na klasifikáciu a regresiu. Klasifikácia je proces klasifikácie označených údajov. Model vytvoril hranice, ktoré oddeľovali kategórie údajov. Keď sa modelu poskytnú nové údaje, môže sa kategorizovať podľa toho, kde daný bod existuje. K-Nearest Neighbors (KNN) je klasifikačný model. V závislosti od hodnoty k sa rozhoduje o kategórii. Napríklad, keď k je 5, ak je konkrétny dátový bod blízko ôsmim dátovým bodom v kategórii A a šiestim dátovým bodom v kategórii B, potom bude dátový bod klasifikovaný ako A.
Regresia je proces predpovedania trendu predchádzajúcich údajov s cieľom predpovedať výsledok nových údajov. Pri regresii môže výstup pozostávať z jednej alebo viacerých spojitých premenných. Predikcia sa vykonáva pomocou čiary, ktorá pokrýva väčšinu údajových bodov. Najjednoduchším regresným modelom je lineárna regresia. Je rýchly a nevyžaduje ladiace parametre ako v KNN. Ak údaje ukazujú parabolický trend, potom model lineárnej regresie nie je vhodný.
Toto sú niektoré príklady algoritmov učenia pod dohľadom. Vo všeobecnosti sú výsledky generované metódami učenia pod dohľadom presnejšie a spoľahlivejšie, pretože vstupné údaje sú dobre známe a označené. Preto musí stroj analyzovať iba skryté vzory.
Čo je učenie bez dozoru?
Pri učení bez dozoru nie je model pod dohľadom. Model funguje samostatne, aby predpovedal výsledky. Používa algoritmy strojového učenia, aby dospela k záverom o neoznačených údajoch. Vo všeobecnosti sú algoritmy učenia bez dozoru ťažšie ako algoritmy učenia pod dohľadom, pretože existuje málo informácií. Klastrovanie je typ učenia bez dozoru. Môže sa použiť na zoskupenie neznámych údajov pomocou algoritmov. K-priemer a klastrovanie založené na hustote sú dva klastrovacie algoritmy.
Algoritmus k-strednej hodnoty, náhodne umiestni k ťažisko pre každý klaster. Potom je každý dátový bod priradený k najbližšiemu ťažisku. Euklidovská vzdialenosť sa používa na výpočet vzdialenosti od dátového bodu k ťažisku. Dátové body sú rozdelené do skupín. Znovu sa vypočítajú polohy pre k ťažísk. Nová poloha ťažiska je určená priemerom všetkých bodov v skupine. Opäť je každý dátový bod priradený k najbližšiemu ťažisku. Tento proces sa opakuje, kým sa centroidy prestanú meniť. k-mean je rýchly klastrovací algoritmus, ale nie je špecifikovaná inicializácia klastrovacích bodov. Existuje tiež veľká variácia modelov zoskupovania založených na inicializácii bodov zoskupenia.
Ďalším klastrovacím algoritmom je klastrovanie založené na hustote. Je tiež známy ako aplikácie priestorového klastrovania založené na hustote so šumom. Funguje tak, že definuje klaster ako maximálnu množinu bodov spojených hustotou. Sú to dva parametre používané na zhlukovanie založené na hustote. Sú to Ɛ (epsilon) a minimálny počet bodov. Ɛ je maximálny polomer okolia. Minimálne body predstavujú minimálny počet bodov v susedstve Ɛ na definovanie klastra. Toto je niekoľko príkladov zoskupovania, ktoré spadá do učenia bez dozoru.
Vo všeobecnosti nie sú výsledky generované algoritmami učenia bez dozoru príliš presné a spoľahlivé, pretože stroj musí definovať a označiť vstupné dáta pred určením skrytých vzorcov a funkcií.
Aká je podobnosť medzi strojovým učením pod dohľadom a bez dozoru?
Učenie pod dohľadom aj učenie bez dozoru sú typy strojového učenia
Aký je rozdiel medzi strojovým učením pod dohľadom a bez dozoru?
Strojové učenie pod dohľadom vs. bez dozoru |
|
Supervised Learning je úlohou strojového učenia sa naučiť funkciu, ktorá mapuje vstup na výstup na základe príkladov vstupno-výstupných párov. | Unsupervised Learning je úlohou strojového učenia odvodiť funkciu na opis skrytej štruktúry z neoznačených údajov. |
Hlavná funkcia | |
Pri učení pod dohľadom model predpovedá výsledok na základe označených vstupných údajov. | Pri učení bez dozoru model predpovedá výsledok bez označených údajov tak, že sám identifikuje vzory. |
Presnosť výsledkov | |
Výsledky generované metódami učenia pod dohľadom sú presnejšie a spoľahlivejšie. | Výsledky generované metódami učenia bez dozoru nie sú príliš presné a spoľahlivé. |
Hlavné algoritmy | |
Existujú algoritmy na regresiu a klasifikáciu v učení pod dohľadom. | Existujú algoritmy na zhlukovanie v učení bez dozoru. |
Súhrn – Strojové učenie pod dohľadom vs. bez dozoru
Učenie pod dohľadom a učenie bez dozoru sú dva typy strojového učenia. Supervised Learning je úlohou strojového učenia sa naučiť funkciu, ktorá mapuje vstup na výstup na základe príkladov vstupno-výstupných párov. Unsupervised Learning je úlohou strojového učenia odvodiť funkciu na opis skrytej štruktúry z neoznačených údajov. Rozdiel medzi strojovým učením pod dohľadom a bez dozoru spočíva v tom, že učenie pod dohľadom používa označené údaje, zatiaľ čo zosúladenie bez dozoru používa neoznačené údaje.