Rozdiel medzi RDBMS a Hadoop

Obsah:

Rozdiel medzi RDBMS a Hadoop
Rozdiel medzi RDBMS a Hadoop

Video: Rozdiel medzi RDBMS a Hadoop

Video: Rozdiel medzi RDBMS a Hadoop
Video: Введение в веб-сервисы Amazon, Лев Жадановский 2024, Júl
Anonim

Kľúčový rozdiel medzi RDBMS a Hadoop je v tom, že RDBMS ukladá štruktúrované dáta, zatiaľ čo Hadoop ukladá štruktúrované, pološtruktúrované a neštruktúrované dáta.

RDBMS je systém správy databáz založený na relačnom modeli. Hadoop je softvér na ukladanie údajov a spúšťanie aplikácií na klastroch komoditného hardvéru.

Obrázok
Obrázok

Čo je RDBMS?

RDBMS je skratka pre Relational Database Management System (Systém správy relačných databáz) založený na relatívnom modeli. V RDBMS sa tabuľky používajú na ukladanie údajov a kľúče a indexy pomáhajú pri spájaní tabuliek. Tabuľka je kolekcia dátových prvkov a sú to entity. Obsahuje riadky a stĺpce. Riadky predstavujú jeden záznam v tabuľke. Stĺpce predstavujú atribúty.

Napríklad databáza predaja môže obsahovať entity zákazníkov a produktov. Zákazník môže mať atribúty ako customer_id, name, address, phone_no. Položka môže mať atribúty ako product_id, name atď. Primárny kľúč zákazníckej tabuľky je customer_id, zatiaľ čo primárny kľúč tabuľky produktov je product_id. Umiestnenie product_id do tabuľky zákazníka ako cudzieho kľúča spája tieto dve entity. Podobne aj tabuľky spolu súvisia. Poskytujú integritu údajov, normalizáciu a mnohé ďalšie. Len málo z bežných RDBMS sú MySQL, MSSQL a Oracle. Na dopytovanie používajú SQL.

Čo je Hadoop?

Hadoop je open source framework Apache napísaný v jazyku Java. Pomáha ukladať a spracovávať veľké množstvo údajov naprieč klastrami počítačov pomocou jednoduchých programovacích modelov. Hlavným cieľom Hadoopu je uchovávať a spracovávať veľké dáta, ktoré sa týkajú veľkého množstva komplexných dát. Priepustnosť Hadoopu, čo je kapacita na spracovanie množstva údajov v určitom časovom období, je vysoká.

Rozdiel medzi RDBMS a Hadoop
Rozdiel medzi RDBMS a Hadoop

V architektúre Hadoop sú štyri moduly. Sú to Hadoop common, YARN, Hadoop Distributed File System (HDFS) a Hadoop MapReduce. Spoločný modul obsahuje Java knižnice a pomocné programy. Má tiež súbory na spustenie Hadoopu. Hadoop YARN vykonáva plánovanie úloh a správu klastrových prostriedkov.

Okrem toho, Hadoop Distributed File System (HDFS) je úložný systém Hadoop. Využíva architektúru master-slave. Hlavný uzol je NameNode a spravuje metadáta systému súborov. Ostatné počítače sú slave uzly alebo DataNodes. Ukladajú skutočné údaje. Na druhej strane Hadoop MapReduce vykonáva distribuovaný výpočet. Má algoritmy na spracovanie údajov. V HDFS má hlavný uzol nástroj na sledovanie úloh. Na podriadených uzloch spúšťa úlohy zníženia mapy. Pre každý podriadený uzol existuje nástroj na sledovanie úloh na dokončenie spracovania údajov a odoslanie výsledku späť do hlavného uzla. Celkovo Hadoop poskytuje masívne ukladanie dát s vysokým výpočtovým výkonom.

Aký je rozdiel medzi RDBMS a Hadoop?

RDBMS vs Hadoop

RDBMS je systémový softvér na vytváranie a správu databáz založených na relačnom modeli. Hadoop je kolekcia softvéru s otvoreným zdrojovým kódom, ktorý spája mnoho počítačov a rieši problémy s veľkým množstvom údajov a výpočtov.
Odroda údajov
RDBMS ukladá štruktúrované dáta. Hadoop ukladá štruktúrované, pološtruktúrované a neštruktúrované údaje.
Úložisko dát
RDBMS ukladá priemerné množstvo dát. Hadoop ukladá veľké množstvo dát ako RDBMS.
Rýchlosť
V RDBMS je čítanie rýchle. V Hadoop je čítanie a zápis rýchle.
Škálovateľnosť
RDBMS má vertikálnu škálovateľnosť. Hadoop má horizontálnu škálovateľnosť.
Hardvér
RDBMS používajú špičkové servery. Hadoop používa komoditný hardvér.
Priepustnosť
Priepustnosť RDBMS je vyššia. Priepustnosť Hadoop je nižšia.

Zhrnutie – RDBMS vs Hadoop

Tento článok diskutoval o rozdieloch medzi RDBMS a Hadoop. Kľúčový rozdiel medzi RDBMS a Hadoop je v tom, že RDBMS ukladá štruktúrované dáta, zatiaľ čo Hadoop ukladá štruktúrované, pološtruktúrované a neštruktúrované dáta.

Odporúča: