Apache Kudu

Szerző: Laura McKinney
A Teremtés Dátuma: 1 Április 2021
Frissítés Dátuma: 14 Lehet 2024
Anonim
Intro to Apache Kudu by Asim Jalis, Galvanize
Videó: Intro to Apache Kudu by Asim Jalis, Galvanize

Tartalom

Meghatározás - Mit jelent az Apache Kudu?

Az Apache Kudu a nyílt forráskódú Apache Hadoop ökoszisztéma tagja. Ez egy strukturált adatokra szánt nyílt forrású tárolómotor, amely támogatja az alacsony késleltetésű véletlenszerű hozzáférést és a hatékony analitikus hozzáférési mintákat. Úgy tervezték és hajtották végre, hogy áthidalják a rést a széles körben használt Hadoop elosztott fájlrendszer (HDFS) és a HBase NoSQL Database között. Noha ezek a rendszerek még mindig előnyösnek bizonyulhatnak, az Apache Kudu sok általános munkaterhelést képes kielégíteni, mivel ez drasztikusan egyszerűsíti azok architektúráját.


Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, mi szól a felhőalapú számítástechnikából, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.

A Techopedia magyarázza az Apache Kudu-t

Az Apache Kudu elsősorban a Cloudera projektjeként került kifejlesztésre. Az eddigi hozzájárulások nagy részét a Cloudera által alkalmazott fejlesztők adták. A kiadás során a kényelmi bináris fájlokat csak a Cloudera tárolói tartalmazták, ám az inkubátorhoz való csatlakozáskor elfogadta az Apache Software Foundation (ASF) forráskiadási folyamatát. Kifejezetten olyan esetekre tervezték, amelyek gyors elemzést igényelnek a gyors adatokkal kapcsolatban. Úgy tervezték, hogy kihasználják a következő generációs hardver és a memóriában történő feldolgozás előnyeit. Jelentősen csökkenti a lekérdezés késleltetését az Apache Impala és az Apache Spark esetében. Az adatokat oszloposzlop-tároló motoron vagy vízszintes partíción keresztül terjeszti, majd minden partíciót replikálja Raft-konszenzussal, így alacsony középidőt jelent a helyreállításig és alacsony farok késleltetést eredményez.


Bár a Kudu az Apache Hadoop ökoszisztéma összefüggésében tervezett termék, támogatja az integrációt más adatanalitikai projektekkel az ASF-en belül és kívül.

Az Apache Kudu hatékonyságának bizonyul, mivel valós idejű elemző munkaterheléseket képes feldolgozni egyetlen tároló rétegen keresztül, így rugalmasságot adva az építészeknek, hogy egzotikus megoldások nélkül kezeljék a sokféle felhasználási esetet.