Projektowanie i budowa skalowalnych potoków danych w celu ingestii, transformacji i udostępniania danych strukturalnych i niestrukturalnych z wewnętrznych i zewnętrznych źródeł.
Profilowanie danych, identyfikacja problemów z jakością oraz standardyzowanie danych i tworzenie modeli danych wspierających rozwiązania AI/ML.
Budowanie, zarządzanie i dokumentowanie bezpiecznych i powtarzalnych zasobów danych oraz interfejsów API wspierających zaawansowaną analizę i rozwiązania machine learning.
Współpraca z zespołami ds. data science i AI/ML w celu zapewnienia optymalizacji rozwiązań danych do aplikacji AI, w tym wsparcie dla workflow LLM i agentów AI.
Projektowanie i implementacja systemów monitorowania w czasie rzeczywistym, umożliwiających śledzenie zmian w kluczowych zbiorach danych (np. dane z badań klinicznych).
requirements-expected :
Wykształcenie wyższe w dziedzinie informatyki, inżynierii, nauk o danych lub pokrewnych obszarów technicznych.
Minimum 5-letnie doświadczenie w inżynierii danych lub podobnej roli, preferowane w złożonych środowiskach korporacyjnych.
Doświadczenie w budowie i utrzymaniu skalowalnych potoków danych i architektury w chmurze (preferowany AWS).
Znajomość SQL, Pythona oraz najlepszych praktyk w zakresie modelowania danych, integracji, transformacji i kuracji danych.
Solidna znajomość zasad zarządzania danymi, bezpieczeństwa danych oraz ochrony prywatności danych.