DBMS vs dolovanie dát
DBMS (Database Management System) je kompletný systém používaný na správu digitálnych databáz, ktorý umožňuje ukladanie obsahu databázy, vytváranie/údržbu údajov, vyhľadávanie a ďalšie funkcie. Na druhej strane Data Mining je oblasť informatiky, ktorá sa zaoberá extrakciou dovtedy neznámych a zaujímavých informácií z nespracovaných dát. Údaje používané ako vstup pre proces dolovania údajov sú zvyčajne uložené v databázach. Používatelia, ktorí inklinujú k štatistikám, využívajú dolovanie údajov. Využívajú štatistické modely na hľadanie skrytých vzorcov v údajoch. Dátoví baníci majú záujem nájsť užitočné vzťahy medzi rôznymi dátovými prvkami, čo je v konečnom dôsledku pre podniky ziskové.
DBMS
DBMS, niekedy len databázový manažér, je kolekcia počítačových programov, ktoré sú určené na správu (t.j. organizáciu, ukladanie a vyhľadávanie) všetkých databáz, ktoré sú nainštalované v systéme (t.j. pevný disk alebo sieť). Vo svete existujú rôzne typy systémov správy databáz a niektoré z nich sú navrhnuté na správnu správu databáz nakonfigurovaných na špecifické účely. Najpopulárnejšie komerčné systémy na správu databáz sú Oracle, DB2 a Microsoft Access. Všetky tieto produkty poskytujú prostriedky na prideľovanie rôznych úrovní privilégií pre rôznych používateľov, čo umožňuje, aby bol DBMS riadený centrálne jedným správcom alebo aby bol pridelený niekoľkým rôznym ľuďom. V každom systéme správy databáz sú štyri dôležité prvky. Sú to modelovací jazyk, dátové štruktúry, dopytovací jazyk a mechanizmus pre transakcie. Modelovací jazyk definuje jazyk každej databázy hosťovanej v DBMS. V súčasnosti sa v praxi používa niekoľko populárnych prístupov, ako je hierarchický, sieťový, relačný a objektový. Dátové štruktúry pomáhajú organizovať údaje, ako sú jednotlivé záznamy, súbory, polia a ich definície a objekty, ako sú vizuálne médiá. Jazyk dotazu na údaje udržiava bezpečnosť databázy monitorovaním prihlasovacích údajov, prístupových práv pre rôznych používateľov a protokolov na pridávanie údajov do systému. SQL je populárny dotazovací jazyk, ktorý sa používa v systémoch správy relačných databáz. Nakoniec mechanizmus, ktorý umožňuje transakcie, pomáha súbežnosti a multiplicite. Tento mechanizmus zabezpečí, že rovnaký záznam nebude upravovať viacero používateľov súčasne, čím sa zachová integrita údajov. DBMS navyše poskytuje zálohovanie a ďalšie zariadenia.
Data mining
Data mining je tiež známy ako Knowledge Discovery in Data (KDD). Ako už bolo spomenuté vyššie, ide o odborníka z informatiky, ktorý sa zaoberá extrakciou dovtedy neznámych a zaujímavých informácií z nespracovaných dát. V dôsledku exponenciálneho rastu údajov, najmä v oblastiach, ako je podnikanie, sa dolovanie údajov stalo veľmi dôležitým nástrojom na premenu tohto veľkého množstva údajov na business intelligence, keďže manuálna extrakcia vzorov sa v posledných desaťročiach zdanlivo stala nemožnou. V súčasnosti sa napríklad používa na rôzne aplikácie, ako je analýza sociálnych sietí, odhaľovanie podvodov a marketing. Data mining sa zvyčajne zaoberá nasledujúcimi štyrmi úlohami: zhlukovanie, klasifikácia, regresia a asociácia. Klastrovanie je identifikácia podobných skupín z neštruktúrovaných údajov. Klasifikácia je učenie sa pravidiel, ktoré možno použiť na nové údaje a zvyčajne zahŕňa nasledujúce kroky: predbežné spracovanie údajov, návrh modelovania, výber učenia/funkcie a hodnotenie/overenie. Regresia je hľadanie funkcií s minimálnou chybou pri modelovaní údajov. A asociácia hľadá vzťahy medzi premennými. Dolovanie údajov sa zvyčajne používa na zodpovedanie otázok, ako napríklad aké sú hlavné produkty, ktoré by mohli v budúcom roku pomôcť dosiahnuť vysoký zisk vo Wal-Marte?
Aký je rozdiel medzi DBMS a Data mining?
DBMS je plnohodnotný systém na umiestnenie a správu súboru digitálnych databáz. Data Mining je však technika alebo koncept v informatike, ktorý sa zaoberá extrahovaním užitočných a predtým neznámych informácií z nespracovaných údajov. Vo väčšine prípadov sú tieto nespracované údaje uložené vo veľmi veľkých databázach. Datamineri preto využívajú existujúce funkcie DBMS na spracovanie, správu a dokonca predspracovanie nespracovaných údajov pred a počas procesu dolovania údajov. Samotný systém DBMS však nemožno použiť na analýzu údajov. Niektoré DBMS však v súčasnosti majú vstavané nástroje alebo schopnosti na analýzu údajov.