12 Kulcsfontosságú tippek az adattudomány tanulásához

Szerző: Laura McKinney
A Teremtés Dátuma: 3 Április 2021
Frissítés Dátuma: 1 Július 2024
Anonim
12 Kulcsfontosságú tippek az adattudomány tanulásához - Technológia
12 Kulcsfontosságú tippek az adattudomány tanulásához - Technológia

Tartalom


Forrás: Artinspiring / Dreamstime.com

Elvitel:

Az adattudósoknak nyilvánvalóan erős matematikai és kódolási készségekre van szükségük, de a kommunikáció és más puha készségek szintén nélkülözhetetlenek a sikerhez.

Az adattudós a 2019-es legjobb munka közé sorolható Amerikában a Glassdoor-n. A 108 000 dolláros medián alapilletmény és az 5-ös 4,3 munkahelyi elégedettség rangsorolása mellett a megbecsült valós számú megnyitó is számít, ez nem meglepő. A kérdés a következő: mit kell tennie ahhoz, hogy a pályára lépjen, hogy jogosult legyen erre a munkára?

Ennek megismerése érdekében tanácsot keresünk azoknak, akik ezen a pályán akarnak lépni. Sokkal inkább a kódolás és a matematika nehéz készségeire vezethető vissza. De ez az erős számítás önmagában nem csökkenti. A sikeres adattudósoknak képesnek kell lenniük arra is, hogy saját feltételeikkel beszélhessenek az üzletemberekkel, ami a puha készségekhez és vezetéshez kapcsolódó képességek szükségességét igényli. (Ha többet szeretne megtudni az adattudós feladatairól, olvassa el a Munkakör: Data Scientist szakaszt.)


Az Oktatási Alapítvány felépítése: Három elsődleges tipp

Drace Zhan, a NYC Data Science Academy tudósa hangsúlyozza egy olyan oktatási alap szükségességét, amely magában foglalja a kódolás és a matematikai képesség alapvető elemeit:

  1. R / Python + SQL. Ha nem rendelkezik kódolási ismeretekkel, akkor sok hálózati erőre és más területekre van szüksége ennek a hiánynak a felszámolásához. Láttam olyan adattudósokat, akik gyenge matematikai és kevés domain tapasztalattal rendelkeznek, de mindig is erős kódolási képességük hordozta őket. A Python ideális, de az R nagyszerű visszaeső eszköz. A legjobb, ha mindkettő van az arénálában. Az SQL az adatanalitikus számára is rendkívül fontos.

  2. Erős matematikai készségek. A néhány általánosan alkalmazott módszer nagyon jó megértése: az általánosított lineáris modellek, a döntési fa, a K-átlag és a statisztikai tesztek jobb, mint ha széles képet alkotnának a különféle modellekről vagy a specializációról, például az RNN-ről.

Ezek központi készségek, amelyekre építni lehet, bár egyes szakértők kiegészítik ezeket. Például a KDnuggets listája tartalmazza a Zhan által említett kódoló összetevőket, és a műszaki oldalról további hasznos információkat is felvesz, például a Hadoop Apache Spark platformot, az adatok megjelenítését, a nem strukturált adatokat, a gépi tanulást és az AI-t.


De ha a Kaggle felmérés alapján a valós életben leggyakrabban használt eszközök felméréséből vesszük az utat, akkor kissé eltérő eredményeket kapunk. Amint az az alábbi 15 legnépszerűbb grafikonból látható, a Python, R és SQL könnyen elkészíti az első háromt, a negyedik pedig a Jupyter notebook, amelyet a TensorFlow, az Amazon Web Services, az Unix shell, a Tableau, a C / C ++, a NoSQL követi. , MATLAB / Octave és Java, mind a Hadoop és a Spark előtt. Még egy olyan kiegészítés, amely meglepheti az embereket, a Microsoft Excel Data Mining.

Kép jóvoltából Kaggle

A KDnuggets listája tippeket is tartalmaz a formális oktatásról. A legtöbb adattudós tudományos fokozattal rendelkezik: 46% -uk rendelkezik PhD-vel, 88% -uk pedig legalább mesterfokozattal rendelkezik. Az általuk megszerzett egyetemi diploma általában megoszlik a kapcsolódó területek között. Körülbelül egyharmada van a matematikában és a statisztikában, ami ezen a karrierpályán a legnépszerűbb. A következő legnépszerűbb a számítástechnika, amelynek 19 százaléka birtokában van, és a mérnöki diploma, amelyet 16 százalék választott. Természetesen az adattudományra jellemző műszaki eszközöket gyakran nem a képzési programokban tanulják, hanem speciális rendszerindító táborokban vagy online tanfolyamokon.

Több mint tanfolyamok: Két további tipp

Hank Yun, a Weill Cornell Medicine tüdő részlegének kutatási asszisztense és a NYC Data Science Academy hallgatója azt tanácsolja, hogy a feltáró adattudósok tervezzék meg, mire fognak dolgozni, és találjanak mentort. Ő mondta:

Nincsenek hibák, nincs stressz - Az Ön életét megváltoztató szoftverek készítésének lépésről lépésre történő leírása az élet megsemmisítése nélkül

Nem javíthatja a programozási készségét, ha senki sem törődik a szoftver minőségével.

Ne kövesse el azt a hibát, amelyet elkövettem, amikor azt mondtam magadnak, hogy ismeri az adattudományt, mert kurzust vett részt és igazolást kapott. Nagyszerű kezdete, de amikor elkezdi tanulni, vegye figyelembe a projektet. Ezután keressen egy mentort a terepen, és azonnal indítsa el a szenvedélyes projektet! Ha friss vagy, nem tudod, mit nem tudsz, így segít, ha valaki ott van, hogy vezesse el neked azt, ami fontos neked, és mi nem. Nem akarod, hogy sok időt töltsön tanulással, anélkül, hogy bármit megmutathatna érte!

Annak ismerete, melyik eszközt veheti ki az eszközkészletből: Tipp a görbe előtti előrehaladáshoz

Az adattudományi eszközök rangsorolásának eltérései miatt egyesek zavart lehet attól, hogy mire összpontosítsanak. Celeste Fralick, a McAfee biztonsági szoftvervállalat fő tudósa a CIO-cikkben foglalkozik ezzel a kérdéssel, amely az adattudós tudásának alapvető képességeit vizsgálja, és kijelenti: „Az adattudósnak a görbe előtt kell maradnia a kutatás során, valamint értsd meg, hogy milyen technológiát kell alkalmazni. ”Ez azt jelenti, hogy nem csábítják a„ szexi ”és az új, amikor a tényleges probléma” valami sokkal több előkészítést igényel. "Az ökoszisztéma számítási költségeinek, az értelmezhetőségnek, a késleltetésnek, a sávszélességnek és az egyéb rendszerhatároknak - valamint az ügyfél érettségének - ismerete önmagában segít az adattudósnak megérteni, hogy melyik technológiát alkalmazza."

Alapvető lágy készségek: További hat tipp

A Fralick által felvetett pont a nem technikai készségekhez kapcsolódik, amelyeket az adattudós munkája megkövetel. Ezért tartalmazza a KDnuggets listája ezt a négyet: szellemi kíváncsiság, csapatmunka, kommunikációs készségek és üzleti szemlélet. Zhan a kulcsfontosságú lágy készségeket is belefoglalta az adattudósokra vonatkozó tippeibe, meghatározva a „kommunikációs készségeket”, mint például a KDnuggets, de az „üzleti ismeretek” helyett a „domain szakértelem” használatát használja. Bármi legyen is az, az adattudomány gyakorlati alkalmazására utal. üzleti. (További információ a kommunikációs készségekről: A kommunikációs készségek fontossága a műszaki szakemberek számára.)

Olivia Parr-Rud felajánlotta ezt a saját pörgetését, és még két lágy képességet adott hozzá, hangsúlyozva a kreativitás szerepét, és kijelentette: „Az adattudományra mint művészetre gondolok, mint a tudományra”, és ehhez támaszkodni kell az agy mindkét oldalának erősségei. „Sokan az adattudományról olyan karrierről beszélnek, amely elsősorban a bal agyat használja. Megállapítottam, hogy a siker érdekében az adattudósoknak az egész agyukat fel kell használniuk. ”

Elmondta, hogy a területen történő haladás nemcsak a műszaki kompetenciát, hanem a kreativitást és a vezetéshez szükséges látást igényli:

A legtöbb bal agy / lineáris feladat automatizálható vagy forrásból származik. Ahhoz, hogy versenyelőnyt biztosítsunk adattudósként, képesnek kell lennünk a minták felismerésére és nagy mennyiségű információ szintetizálására az agyunk mindkét oldalán. És innovatív gondolkodóknak kell lennünk. A legtöbb legjobb eredmény a bal és a jobb agy integrációja.

Azt is hangsúlyozta, hogy miért nélkülözhetetlen a jövőkép közlése:

Mint adattudósok, célunk az adatok felhasználása, hogy segítsük ügyfeleink nyereségének növekedését. A legtöbb vezetõ nem érti meg, mit vagy mi csinálunk. Tehát úgy kell gondolnunk, mint a vezetők, és az eredményeinket és ajánlásainkat olyan nyelven kell közölnünk, amelyet érdekelt feleink megértenek és bíznak.

Az adattucat

A kulcsfontosságú tippek nagyobb számú műszaki eszközt, készséget és képességet tartalmaznak, valamint kevésbé számszerűsíthető tulajdonságokat, például a kreativitáshoz és vezetéshez való képességeket. Végül is nem csak egy szám játék. Mivel az adattudomány nem csupán a modellek vákuumban történő létrehozásáról szól, hanem a vállalkozások valós problémáinak megoldására irányuló gyakorlati alkalmazásokkal is, ezért azok számára, akik sikeresek lesznek a területen, nemcsak a technológiát kell elsajátítaniuk, hanem ismerniük kell üzleti területüket és meg kell érteniük a a munkacsoport különböző tagjai.