Dołączysz do zespołu, który pracuje nad najbardziej zaawansowanymi inicjatywami Big Data w bankowości. Jesteśmy 12-osobowym zespołem Scrumowym, realizującym zarówno projekty biznesowe, jak i R&D. Odpowiadamy m.in. za:
budowę i rozwój rozwiązań streamingowych, które znacząco skróciły czas przetwarzania danych pod raportowanie,
ścisłą współpracę z zespołem Data Science – wdrażanie i rozwijanie modeli ML/AI w środowiskach produkcyjnych,
wsparcie architektoniczne i wdrożeniowe dla innych zespołów projektowych,
rozwój platformy Big Data na Cloudera CDP / Hadoop,
przygotowania do migracji do chmury (GCP, Azure).
Pracujemy z dużą skalą danych, nowoczesnym ekosystemem narzędzi i wieloma projektami równolegle. Jeśli Big Data, ML, streaming i architektura danych to obszary, które Cię napędzają — będzie to dla Ciebie świetne miejsce.
Spotykamy się z zespołem 2x w miesiącu w Warszawie.
responsibilities :
Rozwój i utrzymanie procesów danych w Spark (Python lub Scala)
Tworzenie i optymalizacja pipeline’ów Big Data (batch + streaming)
Praca na platformie Hadoop/Cloudera (CDP)
Integracja danych z wielu źródeł (wewnętrznych i zewnętrznych)