Data science bez tajemnic!

Każdy człowiek co sekundę tworzy średnio 1,7 MB danych. To o 50 razy więcej niż w roku 2012. Tempo, w jakim dane powstają oraz możliwości ich wykorzystania w biznesie, medycynie, technologii oznaczają, że popyt na osoby, które potrafią te informacje przetworzyć i wykorzystać, szybko się nie skończy. Kim jest data scientist, czym się zajmuje i dlaczego rynek pracy czeka na specjalistów w tym zakresie? O tym wszystkim w ramach dwóch bezpłatnych webinarów Future Collars rozmawialiśmy z Karoliną Marzantowicz – wykładowcą Wyższej Szkoły Informatyki Stosowanej i Zarządzania, Aleksandrą Radziwill – Senior Data Scientist i Anną Wiatr – kursantką Future Collars.

Czym jest data science?

Terminy związane z danymi zaczynają pojawiać się około 2006 roku, kiedy zaczęliśmy mieć do czynienia z tak ogromną ilością danych, że narastały problemy z ich przetwarzaniem. Dotychczasowe rozwiązania były niewystarczające. Wcześniej mieliśmy do czynienia z analityką danych, Bussiness Intelligence, z czasem pojawiały się hurtownie danych, w końcu – data science.

Dane też ewoluują

Co istotne, zmieniły się typy danych. Wcześniej analitycy pracowali na danych strukturalnych, teraz zajmują się różnymi typami danych, a większość z nich to dane niestrukturalne – typu video, audio, języki naturalne – wzrastają wyzwania przed osobami zajmującymi się ich analizą

Dane: nowa ropa

Prędkość, z jaką rośnie ilość danych, jest zastraszająca. Mówi się, że “data is the new oil”, nowy, superdochodowy towar, który pojawił się na rynku. Porównanie do ropy naftowej jest nieprzypadkowe, bowiem zanim surowiec będzie gotowy do dochodowej sprzedaży, musi przejść wiele procesów. Podobnie jest z danymi – trzeba je traktować jako surowiec pierwotny i przetworzyć, by można go było zmonetyzować w organizacji. Data science udowadnia też, że jeżeli w Internecie coś jest za darmo, to walutą są nasze dane, każda nasza aktywność w sieci zostawia cyfrowy ślad.

Biznes i programowanie w jednym

Data science można nazwać połączeniem programowania z biznesem, a jego celem jest budowanie modeli predykcyjnych, na podstawie których podejmuje się istotne decyzje. W branży finansowej można przewidzieć, które transakcje nie zostaną sfinalizowane, w ubezpieczeniach – które zachowania klientów sugerują rezygnację z usług.

Wiele branż już teraz z powodzeniem wykorzystuje data science – w obszarze finansów przodują banki, ubezpieczenia, retail, a nawet kolej. Można zoptymalizować jazdę pociągów tak, by zużywać mniej energii. O sile danych przekonała się wielka polityka podczas wyborów w USA czy referendum ws. Brexit.  

Dlaczego dobry data scientist jest na wagę złota?

Obecnie organizacje są w stanie analizować tylko 2% danych, które gromadzą. Analityka danych przestała zajmować się atrakcyjną wizualizacją, zaczęła być realnym wsparciem w podejmowaniu decyzji, które mają ogromny wpływ na przedsiębiorstwo. Data science pomaga w optymalizacji funkcjonowania przedsiębiorstwa, w tworzeniu lepszych i spersonalizowanych produktów, wprowadzaniu innowacji. Nie ma produktu czy procesu, którego nie można poprawić. Specjaliści data science wiedzą, jakie zadać pytania, jakie modele i algorytmy wykorzystać, żeby przedsiębiorstwo zyskało.

Największe zapotrzebowanie na ekspertów data science zgłaszają sektory technologiczny i produkcyjno-przemysłowy. Pod wpływem pandemii Covid-19 dane zaczęły mieć jeszcze większe znaczenie w przypadku medycyny, w której niezbędne są zaawansowane analizy danych. Obszar służby zdrowia wymaga optymalizacji – według szacunków w USA i Kanadzie gdyby lepiej analizować dane, można byłoby obniżyć koszty opieki zdrowotnej o 25%.

Przedsiębiorstwa już wiedzą, że data scientist to skarb, a jego kompetencje są na wagę złota. Jakość danych gromadzonych w firmach jest słaba i wiele czasu traci się na wyczyszczenie ich. Aby funkcjonować w nowej cyfrowej rzeczywistości, automatyzować procesy i optymalizować działania, w tym działania w ramach pracy zdalnej wymuszonej przez pandemię, firmy muszą działać, opierając się o dane. Jeśli tego nie robią, notują straty – 3 mld dolarów to koszt strat na decyzjach opartych o złe dane w USA (Gartner, 2019). Przedsiębiorców nie stać na to, by nie inwestować w data science. Trudno przewidzieć, jak branża będzie wyglądać za 5 lat, ale jedno jest pewne – danych nie będzie mniej.

Co musi umieć data scientist?

Praca z danymi w Excelu jest dobrym punktem wyjścia do nauki, ale to za mało. Umiejętności matematyczne, statystyka to fundamenty, ponadto niezbędna jest znajomość języków programowania: Python, SQL i R. Data scientist rozwiązuje skomplikowane problemy, analizuje dane w kontekście, dlatego kluczowa jest także kreatywność. To data scientist sugeruje, jakie dane wewnętrzne i zewnętrzne będą konieczne, by móc podejmować lepsze decyzje.

Obszar technologiczny charakteryzuje nieustanna zmiana i rozwój – ważna jest umiejętność szybkiego uczenia się i otwartość na doskonalenie. W przyswajaniu języków programowania pomaga znajomość języków obcych (język angielski to absolutne minimum).

Im bardziej praca z danymi przesuwa się w stronę sztucznej inteligencji, tym więcej umiejętności humanistycznych jest pożądanych – w tym doskonałe rozumienie języka naturalnego. Ilość potrzebnych kompetencji z pewnością będzie rosła.

Jak zacząć?

W branży IT wciąż rynek nie jest nasycony pracownikami. W tym obszarze liczy się to, co potrafimy bardziej niż dyplom uczelni wyższej. Nie potrzeba wykształcenia akademickiego, by zacząć pracować w data science.

Data scientist zazwyczaj pracuje w zespole, chociaż nie jest to regułą w mniejszych organizacjach. Typowe jest bycie blisko środowiska biznesowego, dla którego dostarcza się rozwiązań. Coraz częściej można znaleźć zatrudnienie zdalne, co oznacza, że bez przeszkód szukać pracy można w firmach zagranicznych.

Od początku zatrudniony na poziomie juniora data science specialist pracuje nad prawdziwym projektem, jednocześnie uczy się od lepszych od siebie. Przed budowaniem modelu machine learningowego 80% działań to analiza, filtrowanie najważniejszych danych do modelu, reszta to programowanie.

Średnie zarobki specjalisty od danych w Polsce to 15-22 tys. zł w zależności od specjalizacji, znajomości narzędzi i stopnia ich opanowania. Po roku doświadczenia zauważa się wzrost wynagrodzenia o 20-23%.

Karolina Marzantowicz z perspektywy pracodawcy radzi, by szukać możliwości pracy pod okiem doświadczonych specjalistów, mentorów początkowo nawet za niewielkie pieniądze i uczyć się. W tej branży nadal trwa rynek pracownika, data scientist nie będzie narzekał na brak zajęcia. Ważne, by się sprawdzić, przekonać się, że to praca dla mnie.

Bootcamp Data Science Future Collars

Future Collars to szkoła nowych zawodów. Od 4 lat uczymy zdalnie i potrafimy to robić, o czym świadczą specjaliści na rynku mogący pochwalić się naszym certyfikatem. Bootcamp Data science nastawiony jest na praktyczną naukę, trwa 12 tygodni i choć mówi się, że ten kurs jest jednym z najtrudniejszych w naszej ofercie, warto go rozważyć. Absolwenci bieżącej edycji kursu mają gwarancję pracy.

Nasza kursantka, Anna Wiatr, która opowiedziała o swoim doświadczeniu z kursem, potwierdza, że bootcamp jest bardzo wymagający i  potrzeba wiele godzin żmudnej nauki, by przyswoić sobie konieczne umiejętności. Z drugiej strony praca z mentorem, lekcje na żywo i elastyczny grafik wspierają proces nauki i dają sporo satysfakcji.

Data science to zdecydowanie zawód przyszłości – daje pewne zatrudnienie w szybko rozwijającym się obszarze gospodarki, wysokie zarobki i prestiż.