Projekt dotyczy zaprojektowania i wdrożenia skalowalnej platformy przetwarzania danych oraz rozwiązań opartych o sztuczną inteligencję. Głównym celem jest umożliwienie automatyzacji procesów analitycznych oraz integracji modeli Machine Learning i rozwiązań GenAI w środowisku produkcyjnym.
Zakres prac obejmuje budowę i optymalizację pipeline’ów danych, implementację modeli ML/LLM, a także rozwój praktyk MLOps/LLMOps zapewniających stabilność, monitoring i ciągłe doskonalenie rozwiązań. System jest rozwijany w środowisku chmurowym, z naciskiem na wydajność, skalowalność i łatwość utrzymania.
responsibilities :
Współpraca z zespołami Data Science przy wdrażaniu modeli ML do środowiska produkcyjnego
Projektowanie i implementacja rozwiązań GenAI (m.in. integracje LLM, RAG, prompt engineering)
Budowa i rozwój pipeline’ów przetwarzania danych (batch oraz near real-time)
Implementacja i rozwój praktyk MLOps/LLMOps (monitoring, CI/CD, versioning modeli)
Tworzenie mikroserwisów i API w Pythonie wspierających systemy ML
Optymalizacja wydajności przetwarzania danych i modeli
Zbieranie wymagań technicznych oraz estymacja prac
Przygotowywanie dokumentacji technicznej
Prezentowanie rozwiązań i wyników interesariuszom
requirements-expected :
Doświadczenie w inżynierii danych i budowie pipeline’ów danych
Bardzo dobra znajomość Pythona w zastosowaniach produkcyjnych (API, mikroserwisy)
Doświadczenie w pracy z modelami ML oraz ich wdrażaniem
Znajomość narzędzi MLOps/LLMOps (np. Azure ML, Azure AI)
Doświadczenie z platformami Big Data (np. Databricks, Spark/PySpark)
Znajomość architektury chmurowej (Azure lub GCP)
Doświadczenie z integracją i przetwarzaniem danych (Data Lake, ETL/ELT)