Mi a különbség a nagy adat és a Hadoop között?

Szerző: Judy Howell
A Teremtés Dátuma: 5 Július 2021
Frissítés Dátuma: 23 Június 2024
Anonim
Mi a különbség a nagy adat és a Hadoop között? - Technológia
Mi a különbség a nagy adat és a Hadoop között? - Technológia

Tartalom

K:

Mi a különbség a nagy adat és a Hadoop között?


A:

A különbség a nagy adatok és a Hadoop nyílt forráskódú szoftverek között egyértelmű és alapvető különbség. Az előbbi eszköz, gyakran összetett és félreérthető eszköz, míg az utóbbi olyan program, amely célkitűzéseket és célkitűzéseket valósít meg az eszköz kezelésével.

A nagy adatok egyszerűen a nagy adatkészletek, amelyeket az üzleti vállalkozások és más felek összeállítanak, hogy kiszolgálják a konkrét célokat és műveleteket. A nagy adatok sokféle adatot tartalmazhatnak különféle formátumokban. Például a vállalkozások sok munkát végezhetnek több ezer darab adatgyűjtéssel pénznem formátumú vásárlásokról, ügyfél-azonosítókról, például névről vagy társadalombiztosítási számról, vagy termékinformációról modellszám, eladási szám vagy készletszám formájában. Mindezt vagy bármilyen más nagy mennyiségű információt nagy adatnak nevezhetünk. Általános szabály, hogy nyers és válogatás nélküli, amíg különféle szerszámokon és kezelőkön át nem szállítják.


A Hadoop az egyik eszköz a nagy adatok kezelésére. A Hadoop és más szoftvertermékek speciális szabadalmaztatott algoritmusok és módszerek segítségével értelmezik vagy elemzik a nagy adatkeresések eredményeit. A Hadoop az Apache licenc alapján működő nyílt forráskódú program, amelyet a felhasználók globális közössége tart fenn. Különböző fő összetevőket tartalmaz, beleértve a MapReduce funkciókészletet és a Hadoop elosztott fájlrendszerét (HDFS).

A MapReduce mögött meghúzódó ötlet az, hogy a Hadoop először leképezhet egy nagy adatkészletet, majd az adott eredményekhez csökkenti a tartalmat. A redukciós funkciót egyfajta szűrőnek lehet tekinteni a nyers adatokhoz. A HDFS rendszer ezután elosztja az adatokat egy hálózaton keresztül, vagy szükség szerint áttelepíti azokat.


Az adatbázis-adminisztrátorok, fejlesztők és mások a Hadoop különféle szolgáltatásaival bármilyen módon kezelhetik a nagy adatokat. Például a Hadoop felhasználható olyan adatstratégiák végrehajtására, mint a fürtözés és a nem egységes adatokkal történő célzás, vagy olyan adatok, amelyek nem illeszkednek megfelelően a hagyományos táblázathoz, vagy jól reagálnak az egyszerű lekérdezésekre.