.
Data Engineer - databricks (k/m/x)
  • Warsaw
Data Engineer - databricks (k/m/x)
Warszawa, Warsaw, Masovian Voivodeship, Polska
SQUARE ONE RESOURCES sp. z o.o.
10. 3. 2026
Informacje o stanowisku

technologies-expected :


  • SQL
  • Python
  • Apache Spark
  • PySpark
  • Databricks
  • Time-series analysis
  • ETL
  • Data Mining

technologies-optional :


  • Autonomous Vehicles (AV)
  • LiDAR data
  • Radar data
  • Computer Vision data
  • Simulation datasets
  • Semi-structured data processing
  • Large-scale data processing

about-project :


  • Poszukujemy Data Engineer do pracy przy projekcie związanym z rozwojem pojazdów autonomicznych (Autonomous Vehicles – AV). Osoba na tym stanowisku będzie analizować duże wolumeny danych sensorowych pochodzących z floty pojazdów testowych (kamery, LiDAR, radar), identyfikować rzadkie i krytyczne scenariusze drogowe (edge cases) oraz przygotowywać dane do symulacji i trenowania modeli ML.
  • Rola obejmuje pracę z zaawansowaną analityką danych oraz przetwarzaniem szeregów czasowych przy użyciu SQL, Python i Spark/PySpark, a także budowę procesów ETL i narzędzi wspierających eksplorację danych. Zespół odpowiada za przygotowanie i walidację danych wykorzystywanych w pipeline’ach ML oraz systemach symulacyjnych dla autonomicznej jazdy.

responsibilities :


  • Analiza dużych wolumenów danych z sensorów w celu identyfikacji edge cases (np. nagłe hamowanie, bliskie pojazdy)
  • Pisanie złożonych zapytań w SQL / Python / Spark (PySpark) do filtrowania, agregowania i transformowania danych
  • Analiza i przetwarzanie danych szeregów czasowych
  • Praca z wewnętrznymi narzędziami do wyszukiwania danych oraz workflowów auto-labeling
  • Przetwarzanie danych strukturalnych i półstrukturalnych generowanych przez modele detekcji obiektów
  • Identyfikowanie danych odpowiednich do symulacji pojazdów autonomicznych oraz pipeline’ów treningowych ML
  • Projektowanie i rozwój skryptów do zaawansowanego data mining
  • Budowa i utrzymanie procesów ETL dla dużych zbiorów danych
  • Rozwój i usprawnianie wewnętrznych narzędzi analitycznych wspierających eksplorację danych
  • Proponowanie i walidacja nowych podejść analitycznych usprawniających odkrywanie danych

requirements-expected :


  • Silne podstawy w inżynierii oprogramowania
  • Zaawansowana znajomość SQL i umiejętność pisania złożonych zapytań
  • Zaawansowana znajomość Python
  • Bardzo dobra znajomość Spark / PySpark
  • Praktyczne doświadczenie z Databricks
  • Doświadczenie w zaawansowanej analizie danych
  • Doświadczenie w analizie szeregów czasowych (time-series)
  • Zrozumienie workflowów Machine Learning (przygotowanie danych do trenowania modeli)
  • Umiejętność pracy z dużymi wolumenami danych
  • Dodatkowe atuty:
  • Doświadczenie z danymi sensorowymi (np. kamery, LiDAR, radar)
  • Znajomość domeny autonomous driving / AV
  • Doświadczenie z danymi półstrukturalnymi (np. tablice struktur z modeli detekcji obiektów)

  • Praca Warszawa
  • Warszawa - Oferty pracy w okolicznych lokalizacjach


    115 379
    19 615