Zawód Data Scientist stał się jednym z najbardziej pożądanych i najszybciej rozwijających się zawodów na rynku pracy na całym świecie, w tym również w Polsce. Według danych z LinkedIn, w 2020 roku ten zawód znalazł się wśród 5 najbardziej perspektywicznych i najlepiej opłacanych na świecie, jak i w Europie.
Jakie są przyczyny takiej popularności tego tej dziedziny? Przede wszystkim wiąże się to z gwałtownym rozwojem technologii cyfrowych, generujących ogromne ilości danych, które wymagają analizy i wyciągnięcia z nich przydatnych informacji biznesowych. Aby radzić sobie z takimi zadaniami, potrzebni są wysoko wykwalifikowani mistrzowie danych.
Wdrażanie metod sztucznej inteligencji oraz uczenia maszynowego w różnych dziedzinach biznesu i przemysłu wymaga zaangażowania tych specjalistów. W związku z powyższym, popyt na Data Scientistów w najbliższych latach będzie tylko rósł.
Jakimi umiejętnościami i kompetencjami powinien dysponować specjalista, aby odnieść sukces w tej obiecującej dziedzinie? Sprawdźmy to, analizując oferty pracy Data Science w Polsce z ostatnich lat.
Podstawowe przygotowanie
Każdy początkujący Data Scientist przede wszystkim powinien posiadać solidne podstawy w kluczowych dziedzinach, takich jak:
-
matematyka i statystyka;
-
programowanie;
-
maszynowe i głębokie uczenie się;
-
teoria algorytmów.
Bez głębokiego zrozumienia tych fundamentów niemożliwe jest stanie się dobrym specjalistą od analizy i przetwarzania danych. Dlatego analizując oferty pracy dla Data Scientist w Polsce z ostatnich lat, widzimy, że zdecydowana większość pracodawców wymaga posiadania przez kandydata stopnia doktora nauk (PhD) lub magistra w dziedzinie informatyki, matematyki stosowanej, fizyki lub statystyki.
Mając tylko taką poważną bazę akademicką, możliwe jest rozwijanie się w tej dziedzinie i spełnianie rosnących wymagań pracodawców.
Jednak same te umiejętności to nie wszystko – konieczne jest ciągłe rozwijanie się w tej dziedzinie: nauka nowych metod uczenia maszynowego, śledzenie najnowszych trendów w tej dziedzinie, analizowanie rzeczywistych przypadków i projektów. Obszar analizy i sztucznej inteligencji rozwija się bardzo dynamicznie, więc ważne jest, aby nie pozostawać w tyle za postępem.
Analiza wymagań w ofertach pracy dla Data Scientist
Po przeprowadzeniu szczegółowej analizy rzeczywistych ofert pracy, możemy zauważyć następujące kluczowe wymagania stawiane przez pracodawców:
Umiejętności techniczne (hard skills):
1. Dogłębna wiedza (zarówno teoretyczna, jak i praktyczna) w obszarze uczenia maszynowego i głębokiego uczenia się. Doświadczenie w stosowaniu różnych algorytmów i metod, takich jak regresja logistyczna, drzewa decyzyjne, metoda wektorów nośnych, sieci neuronowe i wiele innych.
2. Praktyczne doświadczenie we wdrażaniu i eksploatacji/obsłudze modeli uczenia maszynowego w rzeczywistych projektach, umiejętność wprowadzenia modelu do produkcji, zintegrowania go z innymi systemami. Praca nad pełnym cyklem rozwoju produktu ML.
3. Znajomość różnorodnych metod statystycznej analizy danych, ich wizualizacji i przygotowania do budowy modeli uczenia maszynowego. Zrozumienie specyfiki pracy z różnymi typami danych.
4. Znajomość technologii i narzędzi do pracy z dużymi zbiorami danych: Apache Spark, Hadoop, NoSQL. Doświadczenie w pracy z danymi Big Data o objętości kilkudziesięciu terabajtów.
5. Doświadczenie w wykorzystywaniu platform chmurowych do analizy danych, uczenia i wdrażania modeli uczenia maszynowego: Google Cloud Platform, Amazon Web Services, Microsoft Azure.
6. Biegła znajomość języków programowania Python, R, SQL. Umiejętność pisania zoptymalizowanego, skalowalnego kodu przydatnego do użycia w produkcji.
7. Opcjonalna znajomość języków Scala, Java, C/C++ w celu optymalizacji szybkości działania algorytmów.
8. Biegła znajomość języka angielskiego – obowiązkowe wymaganie większości pracodawców.
Dodatkowe wymagania:
• Doświadczenie w skutecznej realizacji projektów w dziedzinie analizy danych, uczenia maszynowego w realnej gospodarce;
• Portfolio projektów, badań, publikacji w wiodących czasopismach naukowych;
• Doświadczenie w mentoringu i szkoleniu młodszych kolegów, studentów;
• Znajomość trendów w obszarach: Computer Vision, NLP, rozszerzona rzeczywistość, sieci generatywne.
Opinia ekspertów technicznych
Profesjonalne kompetencje w zakresie analityki, uczenia maszynowego i programowania często nie wystarczają jednak do zbudowania udanej kariery jako Data Scientist. Jak zauważają w swoich wywiadach wiodący światowi eksperci w tej dziedzinie, a także menedżerowie najwyższego szczebla w firmach, oprócz twardych umiejętności (hard skills) bardzo ważne jest posiadanie rozwiniętych umiejętności interdyscyplinarnych, które pozwalają na skuteczne ich zastosowanie do rozwiązywania problemów biznesowych klientów.
W szczególności chodzi o takie cechy jak:
1. Krytyczne myślenie. Umiejętność nie przyjmowania wszystkiego za pewnik, krytycznej oceny danych, kwestionowania istniejących opinii i poszukiwania nowych sposobów na rozwiązanie problemu. Myślenie nieszablonowe, znajdowanie nieoczywistych spostrzeżeń w pozornie dobrze zbadanych danych.
2. Umiejętności komunikacyjne. Bardzo ważne jest umiejętne przekazywanie swoich pomysłów, wyników analizy i wniosków z modeli uczenia maszynowego osobom bez technicznej wiedzy – kierownictwu, które podejmuje na ich podstawie decyzje biznesowe. Proste i przystępne wyjaśnienie czasami bardzo złożonych kwestii współpracownikom z innych dziedzin. Jest to kluczowa umiejętność, od której zależy wdrożenie rozwiązań Data Scientist w rzeczywistej produkcji.
3. Zrozumienie procesów biznesowych. Data Scientist nie pracuje w próżni, ale rozwiązuje konkretne problemy rzeczywistego biznesu. Im lepiej rozumie specyfikę i potrzeby biznesu swoich klientów, tym skuteczniej może zastosować swoją wiedzę na temat danych i algorytmów do rozwiązywania ich problemów. Zasadniczo, Data Scientist jest dziś także analitykiem biznesowym i konsultantem, łączącym głęboką wiedzę techniczną ze zrozumieniem potrzeb klientów.
4. Umiejętności przywódcze. Skuteczny Data Scientist z doświadczeniem może ostatecznie stać się liderem zespołu, a następnie menedżerem ds. nauki o danych, zarządzającym małymi grupami innych naukowców zajmujących się danymi. Dlatego umiejętności przywódcze i zarządcze są również ważne dla budowania udanej kariery.
5. Zdolność do samokształcenia się. Ten obszar rozwija się bardzo dynamicznie. Aby nadążać za postępem, trzeba nieustannie się uczyć: poznawać nowe narzędzia, metodyki, czytać specjalistyczną literaturę i periodyki. Bycie zawsze na czasie jest kluczem do konkurencyjności Data Scientists na rynku pracy.
Wnioski i kierunki rozwoju zawodu Data Scientist
Jak widać, aby dziś odnieść sukces jako Data Scientist, niezbędny jest prawdziwie multidyscyplinarny zestaw twardych i miękkich umiejętności (hard and soft skills). Zawód Data Scientist aktywnie ewoluuje, a w najbliższej przyszłości wymagania wobec tych specjalistów będą tylko rosły. Obecnie zauważalne są następujące trendy w rozwoju tej dziedziny:
1. Rosnące zapotrzebowanie na specjalistów w niszowych dziedzinach, takich jak Computer Vision, NLP, analiza tekstów i obrazów oparta na sieciach neuronowych. Są to obiecujące i szybko rozwijające się segmenty Data Science.
2. Rosnące zapotrzebowanie biznesu na rozwiązania z obszaru danych i analityki biznesowej. Data Scientist przyszłości to również konsultant biznesowy, maksymalnie zaangażowany w działania klientów.
3. Wzmacnianie interdyscyplinarności. Oprócz twardych umiejętności w zakresie matematyki i programowania, wymagane są rozwinięte umiejętności miękkie: przywództwo, zarządzanie zespołem, wysokie umiejętności komunikacyjne.
4. Automatyzacja podstawowych zadań związanych z gromadzeniem i przygotowywaniem danych przy użyciu ML i AI. Data Scientist będzie mógł skupić się na bardziej interesujących problemach.
5. Zacieranie się granic między Data Scientist, Machine Learning Engineer i Programistą BI. Specjaliści w tej dziedzinie będą bardziej wszechstronni.
Dla specjalistów IT, którzy wybierają karierę Data Scientist w Polsce otwierają się szerokie możliwości rozwoju zawodowego i budowy udanej kariery w jednym z najbardziej dynamicznych obszarów cyfrowej ekonomii, które szybko się rozwijają. Najważniejsze to nie bać się trudności, ciągle uczyć się czegoś nowego, a sukces będzie gwarantowany!
Materiał zewnętrzny