6 nagy mítosz a nagy adatok kezeléséről

Szerző: Eugene Taylor
A Teremtés Dátuma: 15 Augusztus 2021
Frissítés Dátuma: 22 Június 2024
Anonim
6 nagy mítosz a nagy adatok kezeléséről - Technológia
6 nagy mítosz a nagy adatok kezeléséről - Technológia

Tartalom


Forrás: Dwnld777 / Dreamstime.com

Elvitel:

A nagy adatok nagy üzlet, de csak akkor, ha azokat helyesen használják.

2014 májusában a Forrester Research két jelentést adott ki, amely bizonyos következtetéseket von le a nagy adatok körüli hype-ről. A kutató cég több mint 250 marketing és üzletfejlesztési vezetőt vizsgált meg. A jelentések szerzői szerint a nagy adat retorika minden idők csúcspontja, és a technológiai gyártók olyan termékeket árusítanak, amelyek hihetetlen állításoknak tűnnek.

Gartner egyetért a Forrester Research-rel; jelentős hype veszi körül a nagy adatokat. A 2014. szeptemberi jelentésben Gartner bemutatja az öt legnagyobb adatmítot, és a Gartner elemzői véleményt adnak arról, hogy mi érti félre a nagy adatokat és azok manipulációját. Tehát mi a big datas legnagyobb mítosz? Nézzük meg.

Mítosz: Mindenki előttünk áll a nagy adatok elfogadásában.

Gartner azt mondja, hogy a nagy adatok iránti érdeklődés minden idők csúcsa. Ennek ellenére a megkérdezettek gyenge 13% -a rendelkezik működő rendszerrel. Ennek oka: a legtöbb vállalatnak még nem sikerült kitalálnia, hogyan lehet az értéket a nagy adattárházakból kinyerni. A Gartner felmérése itt optimizáltabb, mint a Forrester-jelentés, amely szerint a felmérés résztvevőinek mindössze 9% -a nyilatkozta arról, hogy a nagy adatfeldolgozású technológiákat a következő évben tervezi bevezetni. (A nagy adatoknak nagyon sok feladata van. Tudjon meg többet az 5 valós világbeli probléma megoldásáról. A nagy adatok megoldhatók.)

Mítosz: Olyan sok adatunk van; nem kell aggódnunk minden apró adathiány miatt.

Gartner aggodalmát fejezi ki amiatt, hogy mi emberek vagyunk: "Annyiunk van, a kicsi, ami rossz, nem számít." Ted Friedman, a Gartner alelnöke és kiváló elemzője úgy véli, hogy ez a helyzet helytelen megítélése.

"A valóságban, bár minden egyes hibának sokkal kisebb hatása van az egész adatkészletre, mint akkor, amikor kevesebb adat volt, több hiányosság van, mint korábban, mert több adat van" - mondta Friedman. "Ezért a rossz minőségű adatoknak az egész adatkészletre gyakorolt ​​hatása változatlan marad."

Friedman további aggodalomra ad okot. A nagy adatgyűjtés gyakran magában foglalja a vállalkozáson kívüli adatokat is, amelyek felépítése és eredete tehát ismeretlen. Ez növeli a hibák esélyét.

Mítosz: A nagy adattechnológia kiküszöböli az adatintegráció szükségességét.

Két nagy adatelemzési stratégia alkalmazható a nagy adatokra: "séma írásra" vagy "séma olvasásra". A közelmúltig az írási séma volt az egyetlen módszer. Az olvasott séma az adatbázis-kezelés jelenlegi őrületét jelenti. Az írással kapcsolatos sémától eltérően, amely strukturált formátumot igényel, az adatok betöltésre kerülnek a séma alapján olvasható adatbázisokba nyers formátumban. Ezután a fejlesztők - strukturálatlan adatbázis-platformokat használva, mint például a Hadoop - az eltérő adatokat felhasználható formátumba hajlik. Az olvasott sémanak nyilvánvaló előnyei vannak, ám, amint azt Gartner megemlíti, az adatintegrációnak valamikor meg kell történnie.

Mítosz: Az adattárház fejlett elemzésre történő felhasználása értelmetlen.

Az adatraktár létrehozására fordított idő sok információkezelő számára értelmetlennek tűnik, különösen akkor, ha az újonnan rögzített adatok különböznek az adattárház adataitól. A Gartner azonban még egyszer figyelmezteti, hogy még a fejlett adatelemzők adatraktárakat és új adatokat is használnak, ami azt jelenti, hogy az adatintegrátoroknak:
  • Finomítsa az új adattípusokat, hogy azok elemzésre alkalmasak legyenek
  • Döntse el, mely adatok relevánsak, és milyen adatminőségre van szüksége
  • Határozza meg az adatok összesítésének módját
  • Tudja meg, hogy az adatok finomítása az adattárházon kívüli helyeken is megtörténhet

Mítosz: Az adattárak helyettesítik az adattárházat.

Az adattavak eltérő adatok tárolói, szemben az adattárakkal, ahol az adatok strukturált formátumban vannak. Az adattó létrehozása kevés előzetes erőfeszítést igényel (nincs szükség az adatok formázására) az adattárházakhoz képest, ezért az adattavak érdeklődnek.

Gartner hangsúlyozza, hogy az adatok birtoklása nem értelme - a lényeg az, ha tudjuk manipulálni a rögzített adatokat megalapozott döntéshozatal céljából. Ezenkívül problematikus a (némileg bizonyítatlan) adattavak használata a döntéshozatal megkönnyítése érdekében.

"Az adattárházak már képesek támogatni a felhasználók sokféleségét az egész szervezetben" - mondta Nick Heudecker, a Gartner kutatási igazgatója. "Az információkezelési vezetőknek nem kell megvárniuk az adattókat. (Tudjon meg többet a nagy adatok átvételéről a 7 olyan dologban, amelyet tudnia kell a nagy adatokról az elfogadás előtt.)

A Big Data működik - Lehet, hogy nem fognak új adatmanipulációs módszerek

A jelentés elolvasása után világossá válik az az oka, hogy Gartner szerint a „legnagyobb adatmítoszok” a „nagyadatú mítoszok” helyett. A Gartner nem hagyja ki a nagy adatokat. A Gartner sajnálja azokat, akik úgy érzik, hogy a nagy adatok manipulálásának újabb módszerei készen állnak a „prémium időre”.