Apache Spark

Szerző: Eugene Taylor
A Teremtés Dátuma: 8 Augusztus 2021
Frissítés Dátuma: 11 Lehet 2024
Anonim
Что такое Apache Spark
Videó: Что такое Apache Spark

Tartalom

Meghatározás - Mit jelent az Apache Spark?

Az Apache Spark egy nyílt forráskódú program, amelyet adatelemzésre használnak. A nagyobb eszközkészlet része, beleértve az Apache Hadoop-ot és más nyílt forrású forrásokat a mai analitikai közösség számára.


A szakértők ezt a viszonylag új nyílt forráskódú szoftvert adatanalitikai fürtszámítási eszközként írják le. Használható a Hadoop elosztott fájlrendszerével (HDFS), amely egy speciális Hadoop összetevő, amely megkönnyíti a bonyolult fájlkezelést.

Néhány informatikai szakember leírja az Apache Spark használatát az Apache Hadoop MapReduce összetevő potenciális helyettesítőjeként. A MapReduce egy fürtöző eszköz is, amely elősegíti a fejlesztőknek, hogy nagy adatkészleteket dolgozzanak fel. Azok, akik megértik az Apache Spark kialakítását, rámutatnak, hogy bizonyos esetekben sokkal gyorsabb lehet, mint a MapReduce.

Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, hogy mi a lényeg a felhőalapú számítástechnikában, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.

A Techopedia magyarázza az Apache Spark-ot

Az Apache Spark modern használatáról szóló beszámolók azt mutatják, hogy a vállalatok különféle módon használják. Az egyik általános alkalmazás az adatok összesítése és finomabb módon történő strukturálása. Az Apache Spark az analitikai gépi tanulási munkában vagy az adatok osztályozásában is hasznos lehet.


Általában a szervezetek szembesülnek azzal a kihívással, hogy hatékony és kissé automatizált módon finomítsák az adatokat, ahol az Apache Spark felhasználható az ilyen típusú feladatokhoz. Néhányan azt is sugallják, hogy a Spark használata elősegítheti a hozzáférést azok számára, akik kevésbé tudnak a programozásról és szeretnének bekapcsolódni az analitikai kezelésbe.

Az Apache Spark API-kat tartalmaz a Python és a kapcsolódó szoftver nyelvek számára.