Adattudomány vagy gépi tanulás? Itt vannak, hogyan kell felismerni a különbséget

Tartalom

Adattudomány és gépi tanulás: széles és keskeny terminológia
Adattudományi és gépi tanulási készségek
Nincsenek hibák, nincs stressz - Az Ön életét megváltoztató szoftverek készítésének lépésről lépésre történő leírása az élet megsemmisítése nélkül
Hogyan kell felismerni a gépi tanulást
Két élvonalbeli tudományág

Forrás: Elnur / Dreamstime.com

Elvitel:

Az adattudomány és a gépi tanulás kulcsfontosságú módon különböznek egymástól. Bizonyos értelemben az egyik a másik részhalmazának tekinthető. Mindkettő fontos az IT jelenlegi fejlődésében.

A mesterséges intelligencia és az adatkezelés ezen új világában könnyen összetéveszthető néhány olyan kifejezés, amelyeket az IT-világban leggyakrabban használnak.

Például az adattudománynak és a gépi tanulásnak sok köze van egymáshoz. Nem meglepő, hogy sok embernek, akik csak átmeneti ismeretekkel rendelkeznek ezekről a tudományágakról, nehézségekbe ütközne, hogy különböznek egymástól.

Így lehet a legjobb módszer az adattudomány elválasztására a gépi tanulástól, alapelvként és technológiai megközelítésként.

Adattudomány és gépi tanulás: széles és keskeny terminológia

Mindenekelőtt az adattudomány valóban egy széles, átfogó technológiai kategória, amely számos különféle projektet és alkotást foglal magában. (Az adattudományi feladatokkal kapcsolatos további információkért lásd: Munkakör: Data Scientist.)

Az adattudomány lényegében a nagy adatokkal való munka gyakorlata. A Moore törvényeként alakult ki, és a hatékonyabb tárolóeszközök elterjedése óriási mennyiségű adatgyűjtést eredményezett a vállalatok és más felek számára. Aztán az olyan nagy adatplatformok és eszközök, mint a Hadoop, az adatkezelés működésének megváltoztatásával kezdték újradefiniálni a számítást. Most, a felhő és a konténerek, valamint a vadonatúj modellek révén a nagy adatok a munka és az életmód fő mozgatórugójává váltak.

Az adattudomány a legegyszerűbb formájában az, amellyel ezeket az adatokat kezeljük, attól kezdve, hogy megtisztítsuk és finomítsuk, és a betekintés formájában felhasználjuk.

A gépi tanulás meghatározása sokkal szűkebb. A gépi tanulás során a technológiák begyűjtik az adatokat, és algoritmusokon keresztül teszik át azokat az emberi kognitív folyamatok szimulálása céljából, amelyeket „tanulásnak” neveznek. Más szavakkal: miután befogadták az adatokat és képzték őket, a számítógép képes biztosítani a saját eredményeit. , ahol a technológia úgy tűnik, hogy megtanulta a programozók által bevezetett folyamatokból.

Adattudományi és gépi tanulási készségek

Az adattudomány és a gépi tanulás ellentmondásának másik módja az, hogy megvizsgáljuk azokat a különféle készségeket, amelyek ezeknek a területeknek a szakemberei számára a legértékesebbek.

Nincsenek hibák, nincs stressz - Az Ön életét megváltoztató szoftverek készítésének lépésről lépésre történő leírása az élet megsemmisítése nélkül

Nem javíthatja a programozási képességeit, ha senki sem törődik a szoftver minőségével.

Általános egyetértés van abban, hogy az adattudósok részesülnek a mély elemző és matematikai készségekből, az adatbázis-technológiákkal kapcsolatos gyakorlati tapasztalatokból és a programozási nyelvek ismeretéből, például a Pythonból vagy más, a nagy adatok feldolgozásához használt csomagból.

„Bárki, aki érdekelt egy erős karrier kialakításában az (adattudományban), három részlegben szerezzen kulcsfontosságú készségeket: elemzés, programozás és domain ismeretek” - írja Srihari Sasikumar a Simplilearnban. „Ha egy szinttel mélyebbre jutunk, a következő készségek segítenek kitűnni egy rést adattudósként: A Python, SAS, R (és) Scala erős ismerete, gyakorlati tapasztalat az SQL adatbázis kódolásában, képesség a strukturálatlan adatokkal való együttműködésre különböző források, mint például a videó és a szociális média, megértik a gépi tanulás több elemzési funkcióját (és). ”

A gépi tanulás oldalán a szakértők gyakran említik az adatmodellezési készségeket, a valószínűségi és statisztikai ismereteket, valamint a szélesebb körű programozási készségeket, mint hasznos eszközöket a gépi tanulás mérnökének eszközkészletében.

Hogyan kell felismerni a gépi tanulást

A legfontosabb az, hogy mindenféle dolog tartalmaz adattudományi munkát, de ez nem gépi tanulás, hacsak nincs beállítva egy nagyon szigorú rend, amely segíti a számítógépet a bemeneteiből való tanulásban.

Amikor ez a helyén van, néhány meglepően képes rendszert hoz létre, amelyek széles körű hatással lehetnek életünkre.

„A gépi tanulással sok minden a felszínen megy végbe” - mondta a jelentések szerint az Amazon alapítója, Jeff Bezos, rámutatva az ilyen típusú rendszerek néhány alkalmazására. „A gépi tanulás a kereslet-előrejelzés, a termékkeresés rangsorolása, a termék- és ajánlattételi ajánlások, a forgalmazási elhelyezések, a csalások észlelése, a fordítások és még sok minden más algoritmusain alapszik. Bár kevésbé látható, a gépi tanulás hatásának nagy része ilyen típusú lesz - csendesen, de értelmesen javítja az alapműveleteket. ”

Az egyik leghasznosabb példa erre a neurális hálózat kialakulása - ez egy általános és népszerű módszer a gépi tanulási folyamatok beállítására.

A legalapvetőbb formában az ideghálózat mesterséges neuronok rétegeiből áll. Minden egyes mesterséges idegsejt funkcionálissága megegyezik a biológiai idegsejtek funkciójával - de a szinapszis és a dendrit helyett bemenetekkel, aktiválási funkcióval és végső kimenetekkel rendelkezik.

A neurális hálózat úgy működik, mint egy emberi agy, és a gépi tanulás szakemberei ezt a modellt gyakran használják gépi tanulási eredmények létrehozására.

Ez azonban nem az egyetlen módja a gépi tanulásnak. Néhány kezdetlegesebb gépi tanulási projekt egyszerűen magában foglalja a számítógép széles skálájának bemutatását (vagy más nyers adatokkal való ellátását), ötletek bevitelét a felügyelt gépi tanulás és címkézési adatok felhasználása során, és a számítógép végül képes megkülönböztetni a különböző formák vagy elemek a látótérben. (A gépi tanulás alapjait lásd: Machine Learning 101.)

Két élvonalbeli tudományág

Összefoglalva: a gépi tanulás az adattudomány értékes része. Az adattudomány azonban a vaster határt és azt a körülményt képviseli, amelyben a gépi tanulás zajlik.

Bizonyos értelemben elmondhatjuk, hogy a gépi tanulás soha nem fog megtörténni nagy adatok nélkül. A nagy adatok önmagukban nem hoztak létre gépi tanulást - ehelyett, miután annyi adatot összegyűjtöttünk, hogy szinte nem tudtuk, mit kell csinálni, a legfelsőbb gondolkodók felbukkantak ezekkel a bio-szimuláló folyamatokkal. betekintést nyújtani.

Egy másik jó dolog, amelyet itt kell szem előtt tartani, hogy az adattudományt két fő módon lehet alkalmazni - átgondolhatjuk a gépi tanulást és a mesterséges intelligenciát, hagyva, hogy a számítógépek ránk gondolkodjanak, vagy visszahozhatjuk az adattudományt egy emberközpontúbb megközelítésbe, ahol a számítógép egyszerűen bemutatja az eredményeket, és mi, mint emberek, meghozzuk a döntéseket.

Ez arra vezet néhány szakértőt, köztük a mai legfontosabb innovátorokat is, hogy élénkebb számvitelre szólítsanak fel ezen technológiák alkalmazásának módjairól.

"Az (AI) szinte mindenki számára képes, és a javulás mértéke exponenciális" - mondta Elon Musk, miközben figyelmeztette, hogy a gépi tanulás és az AI programok felügyeletet igényelnek.

Mindenesetre, mind az adattudomány, mind a gépi tanulás alapvető részét képezi annak a fejlődésnek, amelyet ma, társadalmaink, a technológia területén hajtunk végre.