Kľúčový rozdiel – dolovanie dát a strojové učenie
Data mining a strojové učenie sú dve oblasti, ktoré idú ruka v ruke. Keďže sú príbuzní, sú si podobní, ale majú rozdielnych rodičov. Ale v súčasnosti sa obaja stále viac podobajú; skoro podobne ako dvojičky. Niektorí ľudia preto na dolovanie dát používajú slovo strojové učenie. Pri čítaní tohto článku však pochopíte, že strojový jazyk sa líši od dolovania údajov. Kľúčový rozdiel je v tom, že dolovanie údajov sa používa na získanie pravidiel z dostupných údajov, zatiaľ čo strojové učenie učí počítač učiť sa a rozumieť daným pravidlám.
Čo je dolovanie údajov?
Hľadanie údajov je proces získavania implicitných, predtým neznámych a potenciálne užitočných informácií z údajov. Hoci dolovanie dát znie ako nové, technológia nie je. Data mining je hlavnou metódou výpočtového odhalenia vzorov vo veľkých súboroch údajov. Zahŕňa aj metódy na priesečníku strojového učenia, umelej inteligencie, štatistických a databázových systémov. Oblasť dolovania údajov zahŕňa databázu a správu údajov, predbežné spracovanie údajov, úvahy o odvodzovaní, úvahy o zložitosti, následné spracovanie objavených štruktúr a online aktualizáciu. Bagdovanie údajov, lov údajov a snooping údajov sú bežnejšie výrazy pri získavaní údajov.
Spoločnosti dnes používajú výkonné počítače na skúmanie veľkých objemov údajov a analýzu správ z prieskumov trhu už roky. Data mining pomáha týmto spoločnostiam identifikovať vzťah medzi vnútornými faktormi, ako je cena, kvalifikácia personálu, a externými faktormi, ako je konkurencia, ekonomická situácia a demografia zákazníkov.
Diagram procesu dolovania dát CRISP
Čo je strojové učenie?
Strojové učenie je súčasťou informatiky a je veľmi podobné dolovaniu dát. Strojové učenie sa tiež používa na vyhľadávanie v systémoch na hľadanie vzorov a skúmanie konštrukcie a štúdia algoritmov. Strojové učenie je typ umelej inteligencie, ktorá poskytuje počítačom schopnosť učiť sa bez toho, aby boli výslovne naprogramované. Strojové učenie sa zameriava najmä na vývoj počítačových programov, ktoré sa dokážu naučiť rásť a meniť sa podľa nových situácií a má skutočne blízko k výpočtovej štatistike. Má tiež silné väzby na matematickú optimalizáciu. Niektoré z najbežnejších aplikácií strojového učenia sú filtrovanie spamu, optické rozpoznávanie znakov a vyhľadávacie nástroje.
Automatizovaný online asistent je aplikácia strojového učenia
Strojové učenie je niekedy v rozpore s dolovaním údajov, pretože obe sú ako dve tváre na kocke. Úlohy strojového učenia sú zvyčajne rozdelené do troch širokých kategórií, ako je učenie pod dohľadom, učenie bez dozoru a posilňovacie učenie.
Aký je rozdiel medzi dolovaním údajov a strojovým učením?
Ako fungujú
Data mining: Data mining je proces začínajúci od zjavne neštruktúrovaných údajov s cieľom nájsť zaujímavé vzory.
Strojové učenie: Strojové učenie využíva množstvo algoritmov.
Údaje
Data mining: Data mining sa používa na extrahovanie údajov z akéhokoľvek dátového skladu.
Strojové učenie: Strojové učenie je čítanie stroja, ktorý súvisí so systémovým softvérom.
Aplikácia
Data mining: Data mining využíva hlavne dáta z konkrétnej domény.
Strojové učenie: Techniky strojového učenia sú pomerne všeobecné a možno ich použiť na rôzne nastavenia.
Focus
Data mining: Komunita data miningu sa zameriava hlavne na algoritmy a aplikácie.
Strojové učenie: Komunity strojového učenia platia viac za teórie.
Metodológia
Data mining: Data mining sa používa na získanie pravidiel z údajov.
Strojové učenie: Strojové učenie učí počítač učiť sa a rozumieť daným pravidlám.
Výskum
Data mining: Data mining je oblasť výskumu, ktorá využíva metódy ako strojové učenie.
Strojové učenie: Strojové učenie je metodika, ktorá umožňuje počítačom vykonávať inteligentné úlohy.
Zhrnutie:
dolovanie údajov vs. strojové učenie
Hoci strojové učenie je úplne odlišné od dolovania údajov, zvyčajne sú si navzájom podobné. Data mining je proces extrakcie skrytých vzorov z veľkých dát a strojové učenie je nástroj, ktorý sa dá použiť aj na to. Oblasť strojového učenia sa ďalej rozrástla v dôsledku budovania AI. Data Miners majú zvyčajne veľký záujem o strojové učenie. Data mining aj strojové učenie spolupracujú rovnakou mierou pri vývoji AI, ako aj v oblastiach výskumu.
S láskavým dovolením obrázka:
1. "CRISP-DM Process Diagram" od Kennetha Jensena - vlastná práca. [CC BY-SA 3.0] cez Wikimedia Commons
2. „Automatický online asistent“od Bemidji State University [Public Domain] prostredníctvom Wikimedia Commons