Projekt dotyczy rozwoju danych symulacyjnych dla pojazdów autonomicznych (AV), obejmujących scenariusze takie jak wykrywanie przeszkód, planowanie trasy czy złożone sytuacje drogowe.
Osoba na tym stanowisku będzie pracować z danymi z czujników (8–12 kamer, LiDAR, radar) pochodzącymi z floty testowej AV, generującej do 1 TB danych na godzinę.
Regular Data Engineer (pySpark, Databricks, ML)
Twój zakres obowiązków
- Analiza duzych zbiorów rzeczywistych danych z czujników w celu identyfikacji przypadków brzegowych (np. gwaltowne hamowanie, pojazdy w poblizu).
- Pisanie zlozonych zapytan SQL/Python/Spark (PySpark) w celu filtrowania, agregacji i transformacji danych szeregów czasowych.
- Wspólpraca z wewnetrznymi narzedziami (interfejsy przegladarkowe i uslugi backendowe) do wyszukiwania danych i automatycznego etykietowania.
- Przetwarzanie danych ustrukturyzowanych i czesciowo ustrukturyzowanych (np. tablice struktur z modeli wykrywania obiektów).
- Wsparcie w identyfikacji danych wykorzystywanych w symulacjach AV i pipeline’ach treningowych ML.
- Proaktywne proponowanie i weryfikowanie podejsc analitycznych usprawniajacych procesy eksploracji danych.
- Projektowanie, implementacja i utrzymanie skryptów dla zaawansowanych technik eksploracji danych.
- Budowa procesów ETL do zarzadzania i przetwarzania duzych zbiorów danych.
- Rozwój i doskonalenie narzedzi do eksploracji danych i analityki w celu usprawnienia przeplywów pracy.
Nasze wymagania
- Minimum 3 lata doświadczenia w roli Data Engineer
- Angielski: min. B2
- SQL (zaawansowany)
- Python (zaawansowany)
- Spark / PySpark (zaawansowany)
- Praktyczne doswiadczenie z Databricks
- Zrozumienie przeplywów pracy ML (wykorzystanie danych do treningu)
- Wyższe wyksaztałcenie informatyczne lub pokrewne