Kľúčový rozdiel medzi RDBMS a Hadoop je v tom, že RDBMS ukladá štruktúrované dáta, zatiaľ čo Hadoop ukladá štruktúrované, pološtruktúrované a neštruktúrované dáta.
RDBMS je systém správy databáz založený na relačnom modeli. Hadoop je softvér na ukladanie údajov a spúšťanie aplikácií na klastroch komoditného hardvéru.
Čo je RDBMS?
RDBMS je skratka pre Relational Database Management System (Systém správy relačných databáz) založený na relatívnom modeli. V RDBMS sa tabuľky používajú na ukladanie údajov a kľúče a indexy pomáhajú pri spájaní tabuliek. Tabuľka je kolekcia dátových prvkov a sú to entity. Obsahuje riadky a stĺpce. Riadky predstavujú jeden záznam v tabuľke. Stĺpce predstavujú atribúty.
Napríklad databáza predaja môže obsahovať entity zákazníkov a produktov. Zákazník môže mať atribúty ako customer_id, name, address, phone_no. Položka môže mať atribúty ako product_id, name atď. Primárny kľúč zákazníckej tabuľky je customer_id, zatiaľ čo primárny kľúč tabuľky produktov je product_id. Umiestnenie product_id do tabuľky zákazníka ako cudzieho kľúča spája tieto dve entity. Podobne aj tabuľky spolu súvisia. Poskytujú integritu údajov, normalizáciu a mnohé ďalšie. Len málo z bežných RDBMS sú MySQL, MSSQL a Oracle. Na dopytovanie používajú SQL.
Čo je Hadoop?
Hadoop je open source framework Apache napísaný v jazyku Java. Pomáha ukladať a spracovávať veľké množstvo údajov naprieč klastrami počítačov pomocou jednoduchých programovacích modelov. Hlavným cieľom Hadoopu je uchovávať a spracovávať veľké dáta, ktoré sa týkajú veľkého množstva komplexných dát. Priepustnosť Hadoopu, čo je kapacita na spracovanie množstva údajov v určitom časovom období, je vysoká.
V architektúre Hadoop sú štyri moduly. Sú to Hadoop common, YARN, Hadoop Distributed File System (HDFS) a Hadoop MapReduce. Spoločný modul obsahuje Java knižnice a pomocné programy. Má tiež súbory na spustenie Hadoopu. Hadoop YARN vykonáva plánovanie úloh a správu klastrových prostriedkov.
Okrem toho, Hadoop Distributed File System (HDFS) je úložný systém Hadoop. Využíva architektúru master-slave. Hlavný uzol je NameNode a spravuje metadáta systému súborov. Ostatné počítače sú slave uzly alebo DataNodes. Ukladajú skutočné údaje. Na druhej strane Hadoop MapReduce vykonáva distribuovaný výpočet. Má algoritmy na spracovanie údajov. V HDFS má hlavný uzol nástroj na sledovanie úloh. Na podriadených uzloch spúšťa úlohy zníženia mapy. Pre každý podriadený uzol existuje nástroj na sledovanie úloh na dokončenie spracovania údajov a odoslanie výsledku späť do hlavného uzla. Celkovo Hadoop poskytuje masívne ukladanie dát s vysokým výpočtovým výkonom.
Aký je rozdiel medzi RDBMS a Hadoop?
RDBMS vs Hadoop |
|
RDBMS je systémový softvér na vytváranie a správu databáz založených na relačnom modeli. | Hadoop je kolekcia softvéru s otvoreným zdrojovým kódom, ktorý spája mnoho počítačov a rieši problémy s veľkým množstvom údajov a výpočtov. |
Odroda údajov | |
RDBMS ukladá štruktúrované dáta. | Hadoop ukladá štruktúrované, pološtruktúrované a neštruktúrované údaje. |
Úložisko dát | |
RDBMS ukladá priemerné množstvo dát. | Hadoop ukladá veľké množstvo dát ako RDBMS. |
Rýchlosť | |
V RDBMS je čítanie rýchle. | V Hadoop je čítanie a zápis rýchle. |
Škálovateľnosť | |
RDBMS má vertikálnu škálovateľnosť. | Hadoop má horizontálnu škálovateľnosť. |
Hardvér | |
RDBMS používajú špičkové servery. | Hadoop používa komoditný hardvér. |
Priepustnosť | |
Priepustnosť RDBMS je vyššia. | Priepustnosť Hadoop je nižšia. |
Zhrnutie – RDBMS vs Hadoop
Tento článok diskutoval o rozdieloch medzi RDBMS a Hadoop. Kľúčový rozdiel medzi RDBMS a Hadoop je v tom, že RDBMS ukladá štruktúrované dáta, zatiaľ čo Hadoop ukladá štruktúrované, pološtruktúrované a neštruktúrované dáta.