Nyílt forráskódú Big Data Analytics

Szerző: Laura McKinney
A Teremtés Dátuma: 1 Április 2021
Frissítés Dátuma: 14 Lehet 2024
Anonim
Nyílt forráskódú Big Data Analytics - Technológia
Nyílt forráskódú Big Data Analytics - Technológia

Tartalom

Meghatározás - Mit jelent a nyílt forrású nagy adatelemzés?

A nyílt forráskódú nagy adatanalitika a nyílt forráskódú szoftverek és eszközök használatát jelenti hatalmas mennyiségű adat elemzéséhez, releváns és gyakorlati információk gyűjtése érdekében, amelyeket a szervezet felhasználhat üzleti céljainak előmozdítása érdekében. A nyílt forráskódú nagy adatanalitika legnagyobb szereplője az Apaches Hadoop - ez a legszélesebb körben használt szoftverkönyvtár, amely hatalmas adatkészletek feldolgozására szolgál egy számítógépcsoportban egy elosztott folyamat segítségével, a párhuzamosság érdekében.


Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, mi szól a felhőalapú számítástechnikából, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.

A Techopedia magyarázza a nyílt forráskódú nagy adatelemzést

A nyílt forrású nagy adatok elemzése nyílt forrású szoftvereket és eszközöket használ annak érdekében, hogy a nagy adatok elemzését akár teljes szoftverplatform, akár különféle nyílt forrású eszközök segítségével végezzék el az adatanalitikai folyamat különböző feladataival. Az Apache Hadoop a legismertebb rendszer a nagy adatelemzéshez, de más összetevőkre van szükség ahhoz, hogy egy valódi elemző rendszer összeállítható legyen.


A Hadoop a Google és a Yahoo által úttörő MapReduce algoritmus nyílt forrású megvalósítása, tehát a legtöbb elemző rendszer alapja. Számos nagy adatanalitikai eszköz használja a nyílt forráskódú rendszereket, ideértve az olyan robusztus adatbázis-rendszereket is, mint például a nyílt forráskódú MongoDB, egy kifinomult és méretezhető NoSQL adatbázis, amely nagyon alkalmas nagy adatok alkalmazására, valamint mások.

A nyílt forráskódú big data elemző szolgáltatások a következőket foglalják magukban:

  • Adatgyűjtő rendszer
  • Vezérlő központ a klaszterek adminisztrációjára és megfigyelésére
  • Gépi tanulás és az adatbányász könyvtár
  • Alkalmazás-koordinációs szolgáltatás
  • Számítsuk ki a motort
  • Végrehajtási keret