Obecnie poszukujemy Data Engineera. Projekt realizowany jest dla Munich Re i dotyczy dużej transformacji środowiska danych – migracji z systemów opartych o SQL Server do platformy Databricks / Delta Lake.
Zakres obejmuje migrację 3500–4000 baz danych (ok. 2 TB) oraz replikację danych do Databricks w różnych strukturach i schematach, przy docelowych wolumenach sięgających petabajtów danych.
Projekt koncentruje się na inżynierii danych klasy enterprise oraz developmentcie, a nie na analityce czy raportowaniu.
responsibilities :
Analiza i zrozumienie złożonej logiki biznesowej zapisanej w procedurach SQL (stored procedures)
Przepisanie i przeprojektowanie tej logiki do Python / PySpark w środowisku Databricks
Tworzenie produkcyjnego kodu transformacji danych (moduły, pakiety, komponenty wielokrotnego użytku)