A mai Big Data Challenge változatosságból származik, nem a hangerőből vagy a sebességből

Tartalom

Három nagy adat
Az adatfajta-probléma kezelése
Nincsenek hibák, nincs stressz - Az Ön életét megváltoztató szoftverek készítésének lépésről lépésre történő leírása az élet megsemmisítése nélkül

Elvitel:

Túl sok IT-részleg mindent megtesz az adatmennyiség és a sebesség kérdéseire, elfelejtve foglalkozni az adatok sokféleségének alapvető kérdésével.

Doug Laney, a Gartner kutatási alelnöke szerint a nagy adatok kezelésének és kiaknázásának kihívása három elemből fakad. Laney először több mint egy évtizeddel ezelőtt észrevette, hogy a nagy adatok ilyen problémát jelentenek a vállalkozás számára, mivel bevezetik a nehezen kezelhető mennyiséget, sebességet és változatosságot. A probléma az, hogy túl sok informatikai részleg mindent megtesz az adatmennyiség és a sebesség kérdéseire, elfelejtve foglalkozni az adatok sokféleségének alapvető kérdésével.

Laney 2001-ben írta, hogy "a vezető vállalkozások egyre inkább központosított adattárházat használnak egy közös üzleti szókincs meghatározására, amely javítja a belső és külső együttműködést". Ennek a szókincsnek a kérdése - és a változékonyság, amely megakadályozza a vállalatokat abban, hogy ma létrejöjjön - továbbra is a nagy adatgyűjtés legkevésbé kezelt aspektusa. (Nézze meg, mit kell mondani más szakértők. Nézze meg a Big Data szakértőket, akiknek nyomon kell követniük.)

Három nagy adat

Számos vállalkozás talált módszereket a megnövekedett adatmennyiség és -sebesség kihasználására. például hatalmas mennyiségű adatot képes elemezni. Természetesen ezeket az adatokat gyakran és újra ugyanazon paraméterekkel mutatják be. Ez ösztönözte a technológiai innovációkat, például az oszlop-adatbázisokat, amelyeket manapság széles körben használnak más vállalkozások, amelyek hasonló adatelemek azonos méretű tárolóival szembesülnek.

A beszabályozási sebesség szempontjából az olyan szállítók, mint a Splunk, segítenek a vállalkozásoknak a létrehozott adatok gyors elemzésében naplófájlok segítségével, amelyek másodpercenként több ezer eseményt rögzítenek. A nagy mennyiségű események ezen elemzése a biztonság és a teljesítmény figyelésének felhasználási eseteire irányul. Az adatmennyiség-kihíváshoz hasonlóan a sebesség-kihívást nagyrészt kifinomult indexelési technikákkal és elosztott adatelemzéssel is megoldották, amelyek lehetővé teszik a feldolgozási kapacitás növelését az adatsebesség mellett.

A változatosság vonatkozásában azonban túl sok vállalkozás továbbra is komoly problémákkal szembesül a nagy adatanalitika megközelítésében. Ezt a problémát három tényező vezérli: Először is, a növekedés, a beszerzések és a környezetbe új rendszereket bevezető technológiai innovációk miatt a vállalkozások nagyon heterogén környezetben vannak bezárva, és ez a heterogenitás csak idővel növekszik. A vállalatoknak sokféle rendszert kell nyomon követniük, és több tízezer adattípust kell kezelniük, valamint ugyanazokat az adatokat különféle nómenklatúrák és formátumok felhasználásával kell ábrázolni.

Másodszor, ezek a rendszerek és adattípusok sok esetben mind a releváns információkat, mind a biztonságosan kiszűrhető információkat jelentik, amelyek irrelevánsak a kezelt probléma szempontjából. Meg kell határozni a befolyásoló információkat.

A fajta kihívásának harmadik dimenziója a környezet állandó változékonysága vagy változása. A rendszerek korszerűsítése, új rendszerek bevezetése, új adattípusok hozzáadása és új nómenklatúra bevezetése. Ez tovább megnehezíti azon képességünket, hogy megbénítsuk az adatfajták kihívását. Ez egy további réteget ad a fajta kihívásnak. (További betekintésért nézd meg a Big Data: Hogyan rögzítették, összenyomták és hogyan használták üzleti döntéseket.)

Az adatfajta-probléma kezelése

Az adatfajta-probléma kezelése érdekében a vállalkozásoknak az IT-területtel kell kezdődniük, mivel ez gyakran a legkülönbözőbb szabálysértőket és a legkülönfélébb áldozatokat képviseli. Az első lépés az összes informatikai elem vagy eszköz átfogó meghatározásával vagy taxonómiájával kezdődik. Ez alapvetõ alapot vagy alapot biztosít az IT-ben vagy az IT-ben bármi hivatkozásához, és lehetõvé teszi a vállalkozások számára, hogy egy ismert taxonómiával vagy terminológiával szemben kezeljék a növekvõ heterogenitást.

Nincsenek hibák, nincs stressz - Az Ön életét megváltoztató szoftverek készítésének lépésről lépésre történő leírása az élet megsemmisítése nélkül

Nem javíthatja a programozási képességeit, ha senki sem törődik a szoftver minőségével.

A következő lépés az azonos objektum ábrázolásának számos módjának azonosítása a különböző nyilvántartási rendszerek között. Ez lehetővé teszi az informatikai szakemberek számára, hogy áttekinthessék heterogén környezetüket, és erősen szűrjék és tömörítsék az adatokat releváns és kezelhető darabokra.

Végül, az informatikai vezetőknek folyamatosan át kell vizsgálniuk a környezetet olyan változások miatt, mint például új típusú elemek bevezetése vagy új nómenklatúra, amelyek ugyanazon elemre utalnak.

Ezekkel a lépésekkel az IT-szervezetek kezelni tudják a különféle problémákat és olyan mély betekintést nyerhetnek, amelyek történelmileg elkerülték az informatikai csapatokat. Sőt, a fajtaprobléma kezelése jelentősen javítja az eszközökbe és technikákba történő beruházásuk megtérülését, amelyek a mennyiség és a sebesség hagyományosabb nagy adatproblémáival foglalkoznak.