Białystok, Bialystok, Podlaskie Voivodeship, Polska
DETABLE sp. z o.o.
15. 3. 2025
Informacje o stanowisku
technologies-expected :
Python
SQL
Apache Airflow
Hadoop
about-project :
Jeśli chcesz pracować nad aplikacjami, z których będziesz potem korzystać w codziennym życiu, dołącz do naszego zespołu jako Programista Big Data.
responsibilities :
Przetwarzanie i analiza dużych zbiorów danych:
projektowanie, implementacja i optymalizacja procesów przetwarzania miliardowych zbiorów danych,
wykorzystywanie technologii Apache Spark do równoległego przetwarzania danych,
tworzenie i zarządzanie przepływami danych w Apache Airflow.
Tworzenie i rozwój procesów ETL/ELT:
projektowanie i implementacja procesów integracji danych,
automatyzacja oraz optymalizacja przepływów danych w oparciu o Apache Airflow,
monitorowanie, diagnostyka oraz utrzymanie procesów przetwarzania danych.
Programowanie w Python i SQL:
implementacja skryptów w języku Python do analizy i transformacji danych,
tworzenie i optymalizacja zapytań SQL dla hurtowni danych,
integracja kodu z innymi systemami oraz dostosowywanie go do wymagań biznesowych.
Zarządzanie i utrzymanie środowiska obliczeniowego on-premise:
konfiguracja i optymalizacja środowiska Hadoop oraz powiązanych technologii,
praca w środowisku lokalnym, zapewniająca stabilność i wydajność systemu.
Udział w projektach analizy i przetwarzania danych:
współpraca z zespołami analitycznymi i biznesowymi w celu określenia wymagań,
implementacja rozwiązań wspierających raportowanie i analizę danych,
tworzenie dokumentacji technicznej dotyczącej przetwarzanych danych i procesów.
Implementacja i zarządzanie procesami CI/CD:
wdrażanie oraz utrzymanie procesów ciągłej integracji i wdrażania kodu,
użycie systemu kontroli wersji Git do zarządzania kodem źródłowym.
Współpraca i rozwój osobisty:
aktywna współpraca w zespołach projektowych i scrumowych,
uczestnictwo w procesach planowania, estymacji i doskonalenia procesów,
stałe podnoszenie kwalifikacji i poszerzanie wiedzy w obszarze Big Data.
requirements-expected :
posiadasz minimum 5 lat doświadczenia w pracy na stanowisku Programista Big Data;
możesz pochwalić się realizacją minimum 3 projektów przetwarzających bardzo duże zbiory danych;
umiesz programować w języku Python;
nie jest Ci obca praca w środowisku obliczeniowym on-premise;
na co dzień pracujesz w środowisku Apache Spark;
SQL nie ma przed Tobą tajemnic;
znasz Apache Airflow i zagadnienia Hadoop;
miałeś okazję pracować w obszarze Hurtowni Danych;
posiadasz doświadczenie w obszarze ochrony zdrowia;
biegle posługujesz się językiem polskim;
możesz przedstawić następujące certyfikaty: Agile PM lub równoważny, Airflow Fundamentals lub równoważny, Dag Authoring lub równoważny, Spark Developer Associate lub równoważny, W3Schools SQL Certificate lub równoważny.
offered :
konkurencyjne wynagrodzenie w oparciu o kontrakt B2B (140 – 155 pln netto/h);
długofalową współpracę opartą o wzajemny szacunek i partnerstwo;
dedykowanego opiekuna kontraktu po stronie Detable;
możliwość 100% pracy zdalnej lub z naszego biura w Białymstoku;
możliwość podnoszenia swoich kwalifikacji poprzez skorzystanie z budżetu szkoleniowego;