Nem strukturált adatbányászat

Szerző: Eugene Taylor
A Teremtés Dátuma: 13 Augusztus 2021
Frissítés Dátuma: 22 Június 2024
Anonim
Nem strukturált adatbányászat - Technológia
Nem strukturált adatbányászat - Technológia

Tartalom

Meghatározás - Mit jelent a nem strukturált adatbányászat?

A nem strukturált adatbányászat az a gyakorlat, amikor megvizsgáljuk a viszonylag strukturálatlan adatokat, és megpróbálunk finomabb adatkészleteket kinyerni belőlük. Ez gyakran az adatok kinyeréséből származik forrásokból, amelyeket hagyományosan nem használnak az adatbányászati ​​tevékenységekhez.

Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, mi szól a felhőalapú számítástechnikából, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.

A Techopedia magyarázza a nem strukturált adatbányászatot

Az adatbányászat általában az a gyakorlat, hogy összegyűjtik az adatkészleteket, és megpróbálják csak a legértékesebb információs biteket beszerezni egy meghatározott formátumba. Ez viszonylag strukturálatlan adatokkal jellemzően nehezebb. Az informatikai szakértők a nem strukturált adatokat olyan adatoknak tekintik, amelyek nem egy meghatározott formátumban vannak, „nehéz” adatok vagy „rejtett” adatok olyan pontatlan dokumentumokban, amelyeket hivatalosan nem rendelnek el műszaki információ szolgáltatására.

A nem strukturált dokumentumra példa lehet levél vagy levelezés két vagy több fél között. A nem strukturált adatbányászatban a technológiák lebontják ezt a levelet, és konkrét azonosítókat és információs bitteket keresnek, például a kapcsolt felek nevét, a levelek küldésének dátumát, az érintett vállalkozások nevét, a pénznem mennyiségét vagy egyéb számszerűsítést adatbitek, vagy az egyes termékekhez, szolgáltatásokhoz vagy üzletekhez rendelt kódok. Az ilyen típusú adatokat kibányozzák, majd olyan formátumba helyezik, amelyet a vállalkozások vagy más felek használhatnak gyors referenciaként vagy fejlett üzleti intelligencia alkalmazásokhoz.