Hétfői podcast – 7. szám, 2020. október 28., 4 perc2749https: //d2xzmw6cctk25h.cloudfront.net/post/2418/og_image/78abb7497ecc490d7af2cdb643a4bb4c.png
Megadhatja az adatelemzést 35 évesen? Nos, igen … ha 25 évesen elkezd kiválasztani egy adott irányt. Van Data Science, van Data Engineering, van Data Analytics. És valahol a mesterséges intelligencia területén csak a Big Data rajzolódik ki.
Annak érdekében, hogy a választott gyötrelem ne húzódjon tovább, a “Coming out Monday” című podcast ebben az epizódjában a Sberbank két tapasztalt adatelemzőjével megvitatjuk az adatpálya megkezdését. Veronika Golubeva a bank főmérnök fejlesztés területén Data Analytics, specializálódott Data Science, tanít Python a GeekBrains és a házigazdák szemináriumon. Nyikita Vasziljev inkább az adatmérnöki területen dolgozik, de a GeekBrains-nél oktatja a Pythont is. És Hadoop és Python könyvtárak is az adattudomány számára.
A podcast hetedik epizódja több platformon is streamelhető:
- alma
- Yandex
- Castbox
- Simplecast
Ebben a bejegyzésben érdekes idézeteket gyűjtöttünk össze a számból.
A különlegességekről
– Az Data Science inkább a modellt felépítő algoritmusokról szól. Az adatelemző az a személy, aki adatforrásokat keres, kiválasztja azokat, elemzi és bemutatja a pénzügyi modell eredményét az üzleti diagramokban. Adatmérnök az, aki adatcsatornákat fog létrehozni az adatkutatók számára, amelyeken képzésre kerül sor.
– Számomra úgy tűnik, hogy az adatelemző áll a legközelebb a bölcsészettudományhoz, mert maga sokkal közelebb áll az üzlethez. Vagyis nem pénzügyi elemzés, hanem adatelemzés.
– Nem látok problémát, hogy a humán tudományok az ezzel összefüggő három pozíció bármelyikében részt vegyenek az adattudományban. Itt fontos, hogy melyik áll közelebb. Ha meg akarja érteni az új programozási nyelveket, tanulmányozni a kereteket, elolvasni az angol nyelvű dokumentációt, megérteni azokat a problémákat, amelyeket nem talál a Stack Overflow szolgáltatásban, akkor jó úton jár az adatkezelés felé. Vegyük a második irányt, az adatelemzést: itt egyszerűbb, van választási szabadság. Készíthet diagramokat, prezentációkat készíthet, vagy gyönyörűen beszélhet egy termékről.
– A hagyományos adatelemzőre, adatmérnökre és tudósra történő felosztás sok vállalatnál nem működik. Valójában előfordul, hogy egy adatelemző és egy tudós, vagy egy adatelemző és egy mérnök egy személy.
– Amikor eljöttem a céghez, ahol dolgozom, a terméktulajdonos azt mondta, hogy egyáltalán nincs felosztásunk DA, DE, DS – és én DX leszek.
– Tapasztalatból elmondhatom, hogy leginkább az adatkutatók álláspontjában kérdezik a modellek jelentését, és mindnek matematikai vonzata van. A metrikának matematikai vonzatai is vannak, jól meg kell értenie, mit csinál ez vagy az a modell.
Az alapvető adatelemzési készségekről
– Számomra úgy tűnik, hogy Jun számára, mint adatelemzőnek fontos, hogy az SQL-t alap szinten ismerje – és ne rekurzív lekérdezéseket. Most, ha Jun ismeri a Pythont, rendelkezik alapvető készségekkel (és nem fejlesztő), tudja, hogyan kell használni a Pandas könyvtárat – ez plusz lesz, és nagyon is lehetséges a kiindulási helyzetbe kerülni.
– Ha a négy nagy cégről beszélünk, akkor is az Excel-ben építenek elemzéseket. Ha egymillió sorba illő adatokkal rendelkezik, az Excel elegendő az Ön számára. Ha több mint egymillió adatsora van, akkor nem nélkülözheti olyan adatbázist, amelyben sokkal gyorsabban megteheti.
– Jun számára fontos készség a google és a fejével való gondolkodás képessége. Lehet, hogy nem tud együtt dolgozni a Python összes könyvtárával, de képesnek kell lennie arra, hogy helyesen tegye fel a kérdést, jó anyagokat találjon, olvassa el a Stack Overflow hűvös haverjainak dokumentációját vagy ajánlásait – ez elég az összes feladat lefedésére.
– A lényeg a képesség, hogy beszéljünk és ne féljünk hülyének tűnni, nem érteni és kérdéseket feltenni. A találkozókon az üzleti élet nagyon gyakran érthetetlenül beszél, ezért tisztázást kell kérnie – idővel meg fogja érteni, hogyan működnek. Nincs ott semmi bonyolult.
– Az önéletrajz azt mondta, hogy két-három éve szabadúszó. És valójában a haver vízipipát vagy ilyesmit kalapált ebben az időben.
– Bármit elmondhat magáról, és amint a gyakorlat azt mutatja, 80% -uk többet tulajdonít magának, mint amennyit tud.
– Amikor először kezdtünk munkát keresni egy osztálytársamnál, azt gondoltam, hogy kétszer olyan okos, mint én, de kiderült, hogy meghívtak a cégbe, de ő nem. Ez csak azért volt, mert nekem könnyebb volt kikapcsolódnom és megtalálni a közös nyelvet, és ő, a technikai részben többet tudva, nem tudta megvédeni döntéseit és elmondani róluk, hogy a másik ember megértse.
– Maga az interjú játék. A cég olyan alkalmazottat keres, aki a lehető legtöbbet tudja, hogy minél kevesebbet fizessen neki. A felvett alkalmazott pedig a lehető legkevesebbet akarja csinálni és a lehető legtöbbet kapja. És mindenki felhúzza a takarót.
– Az adatelemzésből biztonságosan elmozdulhat egy szomszédos területre – mind az adatmérnöki, mind az adattudományi, és fordítva, más területekről pedig a következőre ugorhat.
– Valószínűleg senki nem fog kérdezni az Excelről, de hasznos lesz az Ön számára. Talán találkozni fog a munkahelyén, és nehéz lesz, ha korábban nem dolgozott benne. De ha gyorsan felfogod, minden rendben lesz.
Az adatszakemberek interjúkban elkövetett hibáiról
– Úgy tűnik számomra, hogy a tanfolyamokat nem hiába jelzik. Feltétlenül meg kell jelölni az összes tanfolyamot, amelyet elvégeztél, leírni a kapott képességeket. Jelezze, hogy ilyen vagy olyan módon találkozott, még akkor is, ha ugyanaz a Microsoft Access. Ha ez az első összefoglaló júniusban, mondja el mindazt, és a végén írja meg, hogy fantasztikusan tartja érdekesnek.
– Azt tanácsolom az első szakaszban, hogy interjúkat készítsen egy olyan társaságban, ahol nem igazán akar elhelyezkedni. Körbe kell járnia, fel kell ismernie, mi ez, levonni a következtetéseket, megérteni, hogy tud valamit, és meg kell próbálni, hol érdekli jobban.
– Ne próbáljon mindent a tetején tanulmányozni, inkább az alapra koncentráljon. Tapasztalat szerint az emberek 80% -a nem tudott megoldani egy triviális problémát, amikor két táblázatot rajzolok egy darab papírra, és megkérem őket, hogy mondják meg, hogy a bal, a jobb és a belső csatlakozás milyen eredményt hoz vissza. Ez az adatbázis-kapcsolatok kiindulópontja, és nem tudnak ilyen egyszerű kérdésre válaszolni.
Érdekes? Kövesse a cikk elején található linkeket, hogy meghallgassa a teljes verziót és feliratkozhasson a podcast-frissítésekre;) Maradjon velünk, sok jó epizód vár még ránk!