Rozdiel medzi dolovaním dát a OLAP

Rozdiel medzi dolovaním dát a OLAP
Rozdiel medzi dolovaním dát a OLAP

Video: Rozdiel medzi dolovaním dát a OLAP

Video: Rozdiel medzi dolovaním dát a OLAP
Video: ROZDÍLY MEZI MUŽI A ŽENAMI 2024, November
Anonim

Data mining vs OLAP

Data mining aj OLAP sú dve bežné technológie Business Intelligence (BI). Business intelligence označuje počítačové metódy na identifikáciu a extrahovanie užitočných informácií z obchodných údajov. Data mining je oblasť počítačovej vedy, ktorá sa zaoberá extrahovaním zaujímavých vzorov z veľkých súborov údajov. Spája v sebe mnoho metód z umelej inteligencie, štatistiky a správy databáz. OLAP (online analytické spracovanie), ako už názov napovedá, je kompiláciou spôsobov dotazovania sa v multidimenzionálnych databázach.

Data mining je tiež známy ako Knowledge Discovery in data (KDD). Ako už bolo spomenuté vyššie, ide o oblasť informatiky, ktorá sa zaoberá extrakciou dovtedy neznámych a zaujímavých informácií z nespracovaných dát. V dôsledku exponenciálneho rastu údajov, najmä v oblastiach, ako je podnikanie, sa dolovanie údajov stalo veľmi dôležitým nástrojom na premenu tohto veľkého množstva údajov na business intelligence, keďže manuálna extrakcia vzorov sa v posledných desaťročiach zdanlivo stala nemožnou. V súčasnosti sa napríklad používa na rôzne aplikácie, ako je analýza sociálnych sietí, odhaľovanie podvodov a marketing. Data mining sa zvyčajne zaoberá nasledujúcimi štyrmi úlohami: zhlukovanie, klasifikácia, regresia a asociácia. Klastrovanie je identifikácia podobných skupín z neštruktúrovaných údajov. Klasifikácia je učenie sa pravidiel, ktoré možno použiť na nové údaje a zvyčajne zahŕňa nasledujúce kroky: predbežné spracovanie údajov, návrh modelovania, výber učenia/funkcie a vyhodnotenie/overenie. Regresia je hľadanie funkcií s minimálnou chybou pri modelovaní údajov. A asociácia hľadá vzťahy medzi premennými. Data mining sa zvyčajne používa na zodpovedanie otázok, ako sú hlavné produkty, ktoré by mohli pomôcť dosiahnuť vysoký zisk budúci rok vo Wal-Marte.

OLAP je trieda systémov, ktoré poskytujú odpovede na multidimenzionálne otázky. OLAP sa zvyčajne používa na marketing, rozpočtovanie, prognózovanie a podobné aplikácie. Je samozrejmé, že databázy používané pre OLAP sú nakonfigurované pre zložité a ad-hoc dotazy s ohľadom na rýchly výkon. Na zobrazenie výstupu OLAP sa zvyčajne používa matica. Riadky a stĺpce sú tvorené rozmermi dotazu. Na získanie súhrnov často používajú metódy agregácie na viacerých tabuľkách. Dá sa napríklad použiť na zistenie tržieb za tento rok vo Wal-Marte v porovnaní s minulým rokom? Aká je predpoveď na predaj v nasledujúcom štvrťroku? Čo možno povedať o trende pri pohľade na percentuálnu zmenu?

Hoci je zrejmé, že dolovanie údajov a OLAP sú podobné, pretože pracujú na údajoch s cieľom získať informácie, hlavný rozdiel spočíva v tom, ako pracujú s údajmi. Nástroje OLAP poskytujú multidimenzionálnu analýzu údajov a poskytujú súhrny údajov, ale naopak, dolovanie údajov sa zameriava na pomery, vzory a vplyvy v súbore údajov. Ide o dohodu OLAP s agregáciou, ktorá sa scvrkáva na prevádzku údajov prostredníctvom „pridania“, ale dolovanie údajov zodpovedá „rozdeleniu“. Ďalším významným rozdielom je, že zatiaľ čo nástroje na dolovanie údajov modelujú údaje a vracajú použiteľné pravidlá, OLAP bude vykonávať porovnávacie a kontrastné techniky v rámci obchodnej dimenzie v reálnom čase.

Odporúča: