A főiskolai hallgatóknak szükségük van ezekre az adattudományi készségekre

Szerző: Laura McKinney
A Teremtés Dátuma: 4 Április 2021
Frissítés Dátuma: 22 Június 2024
Anonim
A főiskolai hallgatóknak szükségük van ezekre az adattudományi készségekre - Technológia
A főiskolai hallgatóknak szükségük van ezekre az adattudományi készségekre - Technológia

Tartalom


Forrás: Maxkabakov / Dreamstime.com

Elvitel:

A tech világ gyors ütemben halad, és még az is, hogy az új diplomások még nem tanultak meg minden olyan készséget, amelyre szükségük van a karrierhez. Áttekinti a legfontosabb képességeket és megvitatja, hogyan lehet ezeket megszerezni.

A főiskolától függően, ha egyetemet végzett, akkor további készségeket kell tanulnia, hogy piacképesebbé váljanak. És a LinkedIn szerint az első három olyan készség, amelyet az új diplomások tanulnak a diploma megszerzését követő hat hónapban: adatmegjelenítés, adatmodellezés és Python.

„A világ 2020-ban az adatmennyiség ötszörösét fogja generálni, mint amennyit 2011-ben tett” - mondta Derek Steer, a Mode vezérigazgatója, az adatelemzési platform. Az adatfeldolgozási teljesítmény olcsó és gyakorlatilag bármilyen vállalat számára hozzáférhető, és Steer szerint az igazi szűk keresztmetszet a megfelelő képességekkel rendelkező emberek megtalálása.


A vállalatok azonban kibővítik annak meghatározását, hogy kinek kell lennie az adatok megértésének és manipulálásának képességeinek.

"A közelmúltban a prediktív elemzés szerepe elsősorban a tapasztalt, elit adattudósokra esett át, míg a természetes nyelv feldolgozása vagy a kifinomult adatmodellek létrehozása az erős mérnöki háttérrel rendelkező szakemberek számára volt fenntartva" - mondta Harry Glaser, a Sisense-i adat üzleti elnök. amely eszközöket nyújt az adat szakembereknek az elemző alkalmazások felépítéséhez. "A piaci nyomás azonban előretekintő elemzést kényszerített az üzleti tevékenységek rendszeres részévé."

És Glaser szerint ehhez fejlettebb készségekre van szükség. "Ez nagy változásokat és új igényeket jelent, ami azt jelenti, hogy meg kell érteni több olyan adatkezelési nyelvet, amelyeket gyakran használnak a fejlett elemzéshez, mint például Python és R."


Vizsgáljuk meg ezeket a készségeket, miért fontosak, és hogy az új osztályok - vagy bárki mások - megtanulhatják azokat.

Adatok megjelenítése

Az adatmegjelenítés a LinkedIn által felsorolt ​​legfontosabb képesség, de mi az? „Az adatmegjelenítés az adatokat grafikus ábrázolásokká, például grafikonokká és más vizuálisan vonzó formátumokká alakítja, annak érdekében, hogy hatékony módon értelmezzék és megértsék az adatkészletet” - mondta Roberto Reif, a Metis adattudományi ügyvezető igazgatója. adattudományi képzési programok.

Például, ha a számokat táblázatkezelőből oszlopdiagramon vagy kördiagramokká konvertálja, megkönnyíti az emésztést. "Az adatmegjelenítés célja az információs készletek hatékony vizuális mesemondóvá tétele és betekintést nyújtva a közönség számára érthető módon" - mondja Reif.

Nincsenek hibák, nincs stressz - Az Ön életét megváltoztató szoftverek készítésének lépésről lépésre történő leírása az élet megsemmisítése nélkül

Nem javíthatja a programozási képességeit, ha senki sem törődik a szoftver minőségével.

És több okból is igényelt készség. „Az adatmegjelenítést nem széles körben tanítják az iskolában, így ezekkel a képességekkel rendelkező új osztályok egyértelműen kiemelkednek a tömegből” - mondta Yi Zou, aki a mérnöki osztály vezetője és az ASML Szilícium-völgy adattudományi termékmérnöki csoportja. "Ennél is fontosabb, hogy az adatok megfelelő megjelenítése jobb betekintést tesz lehetővé, jobb döntésekhez vezetve, különösen a feltárási szakaszban."

És van még egy oka annak, hogy ez a készség nagy igényt mutat. "Azok a munkavállalók, akik képesek lenyűgöző történeteket elmondani kiváló minőségű táblázatokkal és grafikonokkal, általában hatékonyabban közlik megállapításaikat" - mondja Zou. (További információkért lásd: Viz Vizsga Öröm: Az adatok, melyeket nem kerestek.)

Adatmodellezés

A LinkedIn szerint az adatmodellezés a második legnépszerűbb készség, amelyet a közelmúltbeli osztályok befektetnek a tanulásba. „Az adatmodellezés lényege az adatok megértése és felhasználása a különféle információkészletek közötti kapcsolatok megtalálására” - magyarázza Reif.

Például, ha azt tervezi, hogy otthona forgalomba kerül, és megpróbálja megjósolni az eladási árat, azt állítja, hogy különféle adatsort kell megvizsgálnia, például a négyzet felvételeket, a hálószobák és a fürdőszobák számát, az otthon irányítószámát. kód, a körzet bűnözési aránya és a helyi iskolák minősége.

„Alapvetően az adatmodellezés az adatok értékelésének művészete, hogy megalapozott betekintést és előrejelzéseket lehessen készíteni - minták és kapcsolatok felfedezésére” - mondja Reif.

Ez igényes készség, mert segíthet a vállalatoknak a különböző forgatókönyvek előrejelzésében és előrejelzésében, hogy megalapozottabb stratégiai döntéseket hozzanak. „Például az adatmodellezés segítségével előre jelezhető az ügyfelek cseréje - akár egy vállalat valószínűleg megtartja vagy elveszíti az ügyfelet” - magyarázza Reif.

Mivel az új ügyfelek megszerzése drágább, mint megtartásuk, az adatmodellezés segíthet a cégeknek azonosítani azokat az ügyfeleket, akiknek fennáll a kockázata annak, hogy veszítenek, és így cselekedhetnek.

És Reif szerint az adatmodellezés a tranzakciós csalások elleni küzdelemben is hasznos. "Például sok hitelkártya-társaság nyomon követi ügyfelei vásárlási szokásait és viselkedését úgy, hogy a hirtelen normától eltérő vásárlások riasztásokat váltsanak ki, lehetővé téve a társaságoknak, hogy haladéktalanul kapcsolatba lépjenek az ügyfelekkel a vásárlás megerősítése vagy a kártya megjelölése céljából."

Piton

Kíváncsi lehet, hogy a Python miért lenne a harmadik legnépszerűbb adattudományi készség a közelmúltban végzett diplomások között. „A Python egy erőteljes, általános célú programozási nyelv, amely az utóbbi időben az adattudomány választott nyelvévé vált” - magyarázza Dr. Manjeet Rege, a Minnesota-i Szent Pál Szent Thomas Egyetem adatanalitikai professzora.

Valójában azt állítja, hogy azt széles körben használják az adattudományban, mert sokkal barátságosabb, mint a Java vagy a C ++. Azért is népszerű, mert nyílt forráskódú program, azaz azt egy közösség támogatja, és ingyenesen elérhető.

„Bárki számára, aki olyan adatokkal akar dolgozni, amelyek túlmutatnak egy Excel lapon, gyakorlatilag szükséges a Python ismerete” - magyarázza Reif. "Noha vannak más programozási nyelvek, amelyek szintén fontosak és hasznosak, ez az egyik legszélesebb körben alkalmazott."

Ha aggódik a Python megtanulása iránt, Rege szerint nem kellene lennie, mivel sok programozási nyelv hasonló. "Olyan, mint egy autóvezetés megtanulása: Ha tudod, hogyan kell vezetni a Toyota Camry-t, akkor ezeknek a képességeknek a nagy része a Honda Civic vezetéséhez vezet - és ha megérti az egyik programozási nyelvet, akkor gyorsabban felveszi a másik nyelvet."

Zou elismeri, hogy valóban nem érdekli, hogy milyen szoftverplatformot használnak, mindaddig, amíg az adatelemzés helyesen történik. "A Python-ot azonban a legtöbb adattanulmányozó kedveli manapság, mivel a leggyorsabban növekvő és legnépszerűbb - és leghatékonyabb - statisztikai programozási nyelv, amely nagy adatkészletek fejlett adatelemzését, gépi tanulását és megjelenítését végzi" - mondja.

Rebecca Merrett, az Data Science Dojo vezetõ oktatója, amely adattudományi bootcamppeket kínál, egyetért. „Megállapítottam, hogy a Python az utóbbi években egyre népszerűbbé válik, és szkriptnyelvként azt mondaná, hogy lehetővé teszi a prototípus gyors felépítését, és kiterjedt könyvtárakkal rendelkezik, amelyek segítenek automatizálni a kezdetleges adattudományi feladatokat.” Mint R, mondja a Python. sok támogatást nyújt az adattudományi feladatokhoz.

Hogyan / hol lehet megtanulni ezeket a készségeket

Nem kell új osztályosnak lennie, hogy megtanulja ezeket a képességeket. Függetlenül attól, hogy hol tart a karrier spektrumán, rengeteg hely van az adatok megjelenítésének, az adatok modellezésének és a Python megtanulásához. Vannak, akik szeretnek egyedül tanulni, mások inkább az osztálytermi vagy a csoportos beállításokat részesítik előnyben. Adattudományi szakértőink széles választékot és változatos listát nyújtanak.

„Az interjúim során részt vevő új osztályos jelöltek számos erőforrást említenek, amelyeket képességeik kiemelésére használtak, ideértve az oktatási könyveket, a YouTube videókat, a Coursera és a Kaggle versenyeket” - mondja Zou. (További online tanulási források: 6, Adattudományi kulcsfontosságú koncepció, amelyet az online tanulás révén elsajátíthat.)

Reif hozzáteszi, hogy a MOOC tanfolyamokon kívül főiskolai kurzusokat is vehet, vagy akár könyvtári könyveket is megnézhet. "A Metis ezeket a képességeket megtanítja az adattudományi bootcamp és bootcamp prep kurzusokon is, amelyek előzetes munkát rendelnek a bootcamp indulása előtt" - mondja Reif.

Az egyik lehetőség a Python megtanulására? "Egyszerűen lépjen a python.org webhelyre, töltse le a Python tolmácsot a számítógépére, és kövesse az ott található útmutatásokat" - mondja Rege.

"Sokan megtanulják a technikai készségeket ingyenes online forrásokon keresztül, például azokat, amelyeket a nyílt forráskódú Data Science Masters webhely felsorol (amely tartalmazza a Mode saját ingyenes SQL iskoláját és Python oktatóanyagait)" - mondja Steer. "Vannak olyan bootcamps-ek is, mint az Insight vagy a Galvanize, valamint online tanfolyamok a Udacity, a Springboard, a Datacamp és mások részéről" - tette hozzá.

Stephen Bailey, az Immuta, az adatkezelési platform adattudós és elemző eszköz-szakértője két tanácsot kínál azoknak az embereknek, akik meg akarják tanulni ezeket a képességeket. „Az első darab, hogy megcsináljuk; készítsen vizualizációt a Tableau-ba; menj, írj egy egyszerű Python szkriptet; menj, és alakítsd át az életed egyes aspektusait táblázzá. ”Miközben videót nézhet meg egy eszközt vagy technikát, azt mondja, hogy a művészetet csak a gyakorlatból tanulhatja meg.

A második tanács az, hogy emberekkel találkozzon. „A szoftver- és az adatközösségek hihetetlenül barátságosak” - mondja Bailey. „Olyan embereket vonz, akik hajlandóak a helyes irányba mutatni; emellett megtalálhat valakit a LinkedIn közösségében, és meghívhatja őket kávéra.

Bailey szerint 30 perc alatt többet tud megtanulni és szórakoztatóbb is lehet, ha valakivel beszélget, mintha egy napot keresne az interneten.