System wykrywania zmanipulowanych danych multimedialnych dotyczących osób publicznych oraz weryfikacji źródeł pochodzenia tych danych.
responsibilities :
udział w badaniach, budowie i wdrażaniu rozwiązań AI obejmujących NLP (np. NER, fuzzy-matching, wyszukiwanie semantyczne), CV (rozpoznawanie obiektów, OCR, analiza dokumentów) oraz modele generatywne (LLM),
prowadzenie prac end-to-end: od analizy wymagań i danych, przez eksperymenty/benchmarki, po prototyp (PoC/MVP) i demonstrację w warunkach zbliżonych do rzeczywistych,
budowa i utrzymanie repozytorium danych oraz pipeline’ów (pozyskiwanie, etykietowanie, wersjonowanie, kontrola jakości) oraz monitoring jakości modeli w czasie (MLOps),
współtworzenie i utrzymanie usług ML (API/inference) oraz integracja z elementami platformy,
praca z technologiami: Python, SQL, PyTorch/TensorFlow, transformers, scikit-learn, OpenCV, OCR/ffmpeg, Docker, Git, Linux (mile widziane: Kubernetes, Azure/AWS).
requirements-expected :
minimum 5 lat doświadczenia w projektach ML (R&D lub wdrożeniowych), obejmujących budowę, trenowanie, walidację i wdrażanie modeli,
bardzo dobra znajomość Python oraz praktyczna praca z bibliotekami: scikit-learn, transformers, PyTorch i/lub TensorFlow,
ugruntowana wiedza z zakresu uczenia maszynowego, w szczególności modeli predykcyjnych, NLP i Computer Vision (w tym metody oceny jakości, kalibracja, odporność, generalizacja),
znajomość SQL,
doświadczenie w budowie pipeline’ów danych i eksperymentów (pozyskiwanie, czyszczenie, etykietowanie, wersjonowanie, kontrola jakości),
swobodna praca z dokumentacją i publikacjami w języku angielskim.
offered :
udział w wyjątkowo ciekawych i ambitnych projektach z obszaru Machine Learning rozwijających nasze produkty oraz realizowanych dla firm stawiających na najnowsze technologie,