Jest już prawie 2020, od ponad 20 lat jako ludzie gromadzimy dane związane z naszymi zainteresowaniami, z tym, co nam się podoba, z tym, co kupujemy bądź sprzedajemy lub kogo lubimy w social mediach itp. Jest to ogromna ilość wiedzy o nas i o naszych zwyczajach. Czas zacząć robić z nich użytek
Coraz więcej słyszy się o analizie tych danych oraz ich wykorzystaniu. Języki programowania Python i R używane w analizie stale rosną na popularności. Data Science to jeden z najgorętszych tematów w ostatnim czasie, a rynek IT pęka w szwach od atrakcyjnych ofert pracy dla Data Scientist.
Data Science – co to jest?
Data Science, co to jest? W skrócie to po prostu nauka o umiejętnym wykorzystywaniu danych w różnych celach. Ludzie jeszcze nigdy w historii nie produkowali ani nie mieli dostępu do takiej ilości danych. Pojazdy, komórki, sprzęt w domu, sklepy internetowe, social media – wszystko produkuje informacje. Taka ilość danych pozwala skorzystać z ich zasobów w nowy sposób.
Dzięki ogromnej ilości informacji odpowiednio wyszkoleni analitycy są w stanie zrobić naprawdę dużo, a wiedzę można wykorzystać je do praktycznie wszystkiego: od prowadzenia badań społecznych na globalną skalę do zmiany kierunku rozwoju wielkiej korporacji.
Czym jest Data Science?
Jeden z Data Scientist pracujących w Netflixie podczas swojego wykładu opowiadając o tym, o co chodzi w Data Science powiedział:
“Data science IS ABOUT using data to create as much impact as possible for company”
(tłum. Data Science jest o wykorzystaniu danych to wywierania tak dużego wpływu na firmę, jak to tylko możliwe)
Aby uściślić, dzięki danym oraz odpowiednim analizom:
- Marketer dowie się, czy osoba po drugiej stronie jest już zainteresowana produktem
- Logistyk ułoży lepsze i szybsze trasy dla floty tirów
- Bankier dokładniej oceni ryzyko inwestycji
- Lekarz upewni się w diagnozach oraz działaniach
- Właściciel restauracji będzie mieć mniejsze straty żywności
- Inżynier zaprojektuje bardziej aerodynamiczną konstrukcję drona
Wszystko to może być zrobione dzięki specjalistom od Data Science – czyli Data Scientist, którzy przekuwają zawartą w danych wiedzę w specjalistyczne wspierające narzędzia dla dosłownie każdej branży
Kim jest Data Scientist?
Gdyby chcieć doprecyzować kim dokładnie jest Data Scientist, to jego kompetencje można byłoby określić poniższymi punktami.
Problem Solver – “rozwiązywacz problemów”
Rekomendacje, wnioski, analizy, które tworzy DS na podstawie danych, powinny być dopasowane do aktualnego stanu biznesu oraz powinny diagnozować problem, opisywać go oraz sugerować jego rozwiązanie.
Strategist – “doradca-strateg”
Firma, dla której pracujesz, będzie dawać Ci różne, trudne problemy i będzie oczekiwać, że Twoje analizy, wnioski pokierują całą firmą w dobrą stronę.
Jak wygląda praca Data Scientist?
Wyobraź sobie, że stoisz przy stole w warsztacie, a na blacie leżą piły, obcęgi, młotki, miarki, kleje, a na samym środku stołu leży kilka bezkształtnych kawałków drzewa.
To wyobrażenie nawiązuje do Twojej codziennej pracy. W tej pracy posiadasz pewien “warsztat” i “materiały” i są nimi:
Narzędzia
- Biblioteki do analiz, które tną, grupują, mierzą lub prezentują dane
- Języki programowania np Python albo R, czasem jest to np Excel
- Logiczne myślenie oraz statystyki
Materiały
- Różnego typu dane z różnych źródeł i baz danych
Twoim zadaniem jest wyrzeźbić z kilku kawałków drewna 1 lub 2 małe, unikatowe wykałaczki. Są to sprecyzowane wnioski wynikające z analizy danych. Ostatnim etapem Twojej pracy jest przygotowanie “opakowania” dla tych 2 wykałaczek – czyli zaprezentowanie w prosty sposób Twoich wniosków.
A teraz opowiem, jak to wygląda na realnym przykładzie:
- Pracujesz dla sieci pizzerii, która ma kilkanaście lokali
- Problem, nad którym pracujesz – wg właściciela lokal, który analizujesz zarabia za mało
- Bierzesz na warsztat ofertę tej pizzerii – ma 63 pozycje różnych pizz w 3 różnych rozmiarach – mała, średnia i duża
- Bierzesz na warsztat bazę danych z jednego z lokali
- Po analizie stwierdzasz, że 74% zysku tego lokalu generuje tylko 7 najpopularniejszych pizz i sprzedają się one tylko w rozmiarze średnia i duża
- Tworzysz raport dla właściciela sieci pizzerii, którym jest napisane:
- 11% oferty na pizze generuje 74% zysku w lokalu
- Ograniczenie oferty na pizze tylko do tych 7 najpopularniejszych spowoduje znaczny spadek strat magazynowych o co najmniej 40% oraz będzie skutkować wzrostem zysku w tego lokalu
- Lokal nie sprzedaje małych rozmiarów pizz, więc można usunąć je z oferty
- W tym przypadku z wielkich kawałków drewna wyciągnąłeś 3 małe wykałaczki, a właściciel sieci restauracji już będzie wiedział co z nimi zrobić.
Proste? Tak, a Ty dodatkowo zasłużyłeś na dużą, darmową pizzę :)
Data Science – jak zacząć?
Pewnie jest grupa ludzi, która uzna, że to za trudne, że rozwój w tym kierunku stawia przed nimi za duże wymagania i odpowiedzialność.
Ale jest inna grupa, której będzie pasować ten nowy zawód w branży IT. To ludzie, którzy:
- Lubią liczby i matematykę, nie mają problemu z logicznym myśleniem
- Chcą mieć możliwość do ciągłego rozwoju
- Chcą mieć wpływ na firmę, w której pracują
Data science IT to dynamicznie rozwijająca się dziedzina programowania. Jeśli interesuje Cię taka praca, to warto się tym zainteresować i zainwestować swój czas w naukę w tym kierunku. Zapotrzebowanie na DS-ów stale rośnie, a wynagrodzenia są naprawdę wysokie. Możesz być częścią tej rewolucji w patrzeniu na dane.
Swój rozwój najlepiej rozpocząć pod okiem doświadczonego mentora, który już kilka lat robi analizy i który pokaże w efektywny sposób:
- jak korzystać z narzędzi przy codziennej pracy
- jak podchodzić do danych
- jak szukać wartości w danych i jakie informacje są wartościowe
- jak prezentować wnioski wynikające z analiz