A szakma és a számítógépes látásképzési program megértése 2020. november 27. 6 perc 4356 https://d2xzmw6cctk25h.cloudfront.net/post/2460/og_image/6c3087c7b9a425fab7fca64d855591df.png
A „ Computer Vision Student” egy tudományos fantasztikus idézetként hangzik, nem? Valójában a számítógépes látásmérnök egy olyan szakma, amely bár még nem vált a legelterjedtebbé, de már gyorsan népszerűvé válik, és még a karrier kezdetén is magas fizetést kínál. Ebben a cikkben erről a specialitásról és az új GeekBrains számítógép-látás karról fogunk beszélni.
Mi az a számítógépes látás és mit csinál a fejlesztője?
A számítógépes látásmérnök olyan szakember, aki megtanítja a számítógépeket, hogy információkat nyerjenek ki a képekből. Különösen automatikusan felismeri a képeken és videókon található tárgyakat vagy gesztusokat. Ha egy személy képes vizuálisan azonosítani valamit (például hibát találni a termékben), akkor a számítógép is megtanítható erre – és ezzel időt és erőforrásokat takaríthat meg számos folyamat egyszerűsítésével.
A számítógépes látás fejlesztéseket sokféle vállalat használja, amelyek termékei képekhez vagy videókhoz kapcsolódnak. Ez magában foglalja az önvezető autók gyártását, és segít az orvosoknak az MRI-vizsgálatok értelmezésében, amikor daganatokat keresnek, és akár az arcfelismerés a metróban az önszigetelő rendszer megsértőinek azonosítására. A számítógépes látás szakértői sok e-kereskedelmi vállalkozásnak segítenek csökkenteni a mértékletesség terheit, például amikor az Avito-hoz hasonló hirdetési szolgáltatás olyan trollokkal küzd, akik nem megfelelő tartalmú képeket töltenek fel.
Egy másik érdekes példa a VisionLabs LUNA platform, amely 2017 óta segít a Tinkoff Banknak az ügyfélkör elemzésében és a csalás jeleinek azonosításában, valamint fotók segítségével ellenőrzi azokat az ügyfeleket, akik hitelt igényeltek. A technológia bevezetése végül maga a bank segítette a hitelkockázatok és az ügyfelek csökkentését – az alkalmazások gyorsabb megoldáshoz jutását.
A számítógépes látás specialistáit különféle neveken emlegetik: fejlesztők, mérnökök és számítógépes látástudósok. Lényegében a számítógépes látás specialistája inkább mérnök, aki matematikai számításokat és programozást használ munkaeszközként. Tehát globálisan egy számítógépes látásmérnök, egy számítógépes látástudós, egy számítógépes látásfejlesztő és egy műszaki látásfejlesztő egy és ugyanaz.
Mit csinál a számítógépes látásfejlesztő?
Általános szabály, hogy egy ilyen szakember napja egy csapattal való felállással kezdődik. Ezután kódot ír az ideghálózatok kiképzéséhez, az adatok feldolgozásához és a kísérletek elemzéséhez. A számítógépes látásfejlesztő dolgozhat akár egyedül, akár egy csapatban, ahol mindenki elvégzi egy nagy feladat egy részét.
Ami a munkaeszközöket illeti, a kísérletek kódjának írásakor általában a Python nyelvet, az ideghálózatok – a Tensorflow vagy a Pytorch keretrendszer – képzésére használják. A munkához a képfeldolgozáshoz speciális könyvtárak is tartoztak, mint például az OpenCV. Nagy terhelésű projektekhez a C ++ nyelv is használható, mivel a benne leírtak sokszor gyorsabban végrehajtódnak.
A számítógépes látás egy fiatal, dinamikusan fejlődő terület a tudomány és a technika találkozásánál, amelyben még mindig több a kísérlet, mint a kész megoldások. A növekedéshez a szakembernek folyamatosan tanulnia kell itt. De a feladatok újdonsága és nem szabványos jellege, valamint az a lehetőség, hogy valami igazán innovatívat alkossanak, sok embert vonz ebbe a szakmába.
Hogyan fejlődik a számítógépes látásszakértő és mennyit kap a számítógépes látásszakértő?
Ezen a területen a munkaadók iránti kereslet lényegesen magasabb, mint a piacon lévő méltó jelöltek száma. Az ilyen szakemberekre az üzleti élet különböző területein van kereslet, az orvostudománytól az olajfejlesztésig, hogy a fejlesztők kedvükre válasszanak egy területet. A szakemberek a Mail.ru Groupot, a Yandexet, a VKontakte-ot, az Avitót, a Sberbankot, a Tinkoffot keresik … Általában gyakorlatilag az összes vezető technológiai vállalat Oroszországban – és sok külföldi. A legtöbb megüresedett hely természetesen Moszkvában és Szentpéterváron koncentrálódik. De szinte az összes nagy informatikai vállalat tavasz óta teljesen vagy részben távolról dolgozik, és nagyon kevés szakember van a számítógépes látás területén, így a régiók fejlesztői jó eséllyel helyezkednek el a tőke társaságokban.
Ami a karrierlehetőségeket illeti, a júniustól a közepéig tartó út átlagosan egy-három évig tart, attól függően, hogy milyen nehézségekkel küzdenek a készségek. Ha idősebb szakemberré akarsz nőni, nem kell félned a felelősségtől, nagy irányokat kell vállalnod, és meg kell értened, hogyan lehet ezeket fejleszteni nemcsak a technológia, hanem az üzlet szempontjából is.
Ami a fizetéseket illeti: a kezdők körülbelül 100 ezer rubelt kapnak, a középső – 150-200 ezer, az idősek keresete körülbelül 250 ezer, a csapat vezetői pedig – 300-400 ezer.
Amit a GeekUniversity Számítógépes Látás Karán tanítanak
A GeekUniversity számítógépes látástudományi karán való tanulás 11 hónapot vesz igénybe, és 70% -a webes szemináriumokból áll, vagyis online kommunikál egy tanárral. A tanfolyam három modulból áll: infrastruktúra kiépítése, a gépi tanulás alapjai és a számítógépes látás tanulmányozása.
Az első blokkot bevezetőnek nevezhetjük. Mivel a számítógépes látás területének szakemberei a matematika és a programozás ismereteire támaszkodnak a problémák megoldásában, az elején meg kell tanulnia a semmiből, vagy fel kell használnia a felsőbb matematika, a matematikai elemzés és a lineáris algebra témáit, valamint a Python nyelvével kell dolgoznia. Ne aggódjon, ha ismeretei az iskolai matematikára korlátozódnak, ami “régen volt és nem igaz”: segítünk az első modulban a szükséges témák szigorításában, hogy a jövőben minden hallgató ugyanazon ritmusban mozoghasson a programon.
A második modul teljesen a gépi tanulásnak szól. Segít gyorsabban és könnyebben megoldani a számítógépes látási problémákat. Például az arcfelismeréshez szakértő módon festheti az arcvonásokat az összetett összeállításakor feltett kérdések alapján. Vagy sok fényképportrét adhat az algoritmusnak, megjelölve, hogy melyik arc kinek a tulajdonosa, majd maga az algoritmus megtanul kinyerni olyan jellemzőket, amelyek alapján az arcok azonosíthatók. A jövőben, ha meg kell határoznia, ki szerepel a fotón, akkor az algoritmusnak csak portréra lesz szüksége. Ha van pillanatkép a szükséges személyről, a rendszer könnyen megtalálja.
A második modulban a valószínűség elméletét és a matematikai statisztikákat elemezzük. A hallgatók gyakorolni fogják a problémák megoldását a Python alapvető algoritmusainak és adatstruktúráinak felhasználásával, megismerkednek az adattudományi Python könyvtárakkal (NumPy, Matplotlib), valamint gépi tanulási algoritmusokkal.
Végül a harmadik modul keretein belül elemezzük a számítógépes látás fő feladatait, a matematikai morfológiával való munkát, valamint az OpenCV és PIL könyvtárakat. Az OpenCV alapvető képfeldolgozó algoritmusokat valósít meg. Figyelemre méltó, hogy néhány megközelítést a múlt században találtak ki, és még mindig alkalmaznak bizonyos problémákban. Interjúk során is fel lehet őket kérdezni, ezért mindenképpen megvitatjuk ezt a témát.
Vessünk egy külön pillantást a mély tanulásra – a gépi tanulás olyan területére, amely az ideghálózatokat, architektúráikat és alkalmazásuk megközelítését tanulmányozza. A 2010-es évek óta az ilyen modelleket hatékonyan használják a számítógépes látás problémáiban.
Hogyan lehet belépni a karra és mi lesz a portfólióban
A hallgatóknak három projektet kell létrehozniuk portfóliójukhoz, amelyek összetettségükben és feladattípusaikban különböznek egymástól.
A képzés végén – az öt téma egyikének diplomadolgozása:
- tárgyak észlelése – maszkok az arcokon, kalapok stb.
- hasonló tárgyak keresése;
- képosztályozás;
- stílusátadás – képstílus átvitele, például a nappali órák sötétbe alakítása egy fotón;
- képek szegmentálása.
A hallgató saját maga választja meg az adott feladatot, az adatokat nyílt adatkészletekből veszik.
Minden projekt az életben előforduló valós esetekhez fog kapcsolódni. Az oklevél kidolgozása lehetővé teszi a hallgatók számára, hogy a probléma megoldásának teljes ciklusát végigjárják: az adatfeldolgozástól a gyártás előkészítéséig. A hallgatóknak önállóan kell összegyűjteniük és megjelölniük az adatokat, meg kell határoznia a minőségi mutatókat és célokat, ki kell képeznie egy modellt, és elő kell készítenie egy MVP-t szolgáltatásként a Dockerben.
A számítógépes látás olyan terület, ahol valóban innovatív termékeket hozhat létre, kutatási tevékenységeket folytathat, és ugyanakkor nem aggódhat a kereslet iránt, és már az első szakaszban magas fizetést keres. Érdekes? Ezután jöjjön el hozzánk tanulni – nyújtson be pályázatot a kar oldalán.