Rola znajduje się w zespole Global Defence w obszarze Cybersecurity, który koncentruje się na zapewnieniu bezpieczeństwa działalności firmy poprzez czujność, innowacyjność, niezawodność, inteligencję i działanie zgodne z misją.
Rola jest częścią zespołu Data & Automation, składającego się z inżynierów danych, analityków danych, inżynierów uczenia maszynowego i programistów aplikacji, którzy wspólnie dostarczają rozwiązania techniczne. Główną platformą do pracy z danymi jest Azure Databricks.
responsibilities :
Analiza dużych, złożonych i dynamicznych zbiorów danych w celu uzyskania wartościowych wniosków, identyfikacja problemów z jakością danych oraz projektowanie logiki zoptymalizowanej pod kątem tych danych.
Tworzenie wydajnych, wielokrotnego użytku i łatwych w utrzymaniu skryptów do zbierania, czyszczenia i walidacji danych z wielu źródeł, zasilających procesy automatyzacji, analizy i raportowania.
Wizualizacja wyników analizy danych za pomocą wykresów, dashboardów i innych formatów dostosowanych do potrzeb odbiorców technicznych i nietechnicznych.
Współpraca z interesariuszami w celu zrozumienia danych i ich kontekstu biznesowego oraz dopasowania dostarczanych rozwiązań do wymagań biznesowych.
Dokumentacja procesów związanych z danymi, metodologii i uzyskanych wyników.
Stosowanie dobrych praktyk w zakresie tworzenia oprogramowania, w tym podejścia DevOps.
Praca zgodna z metodologiami Agile, w tym test-driven development (TDD).
requirements-expected :
Biegłość w pracy z narzędziami analizy danych, takimi jak Python i SQL.
Doświadczenie w pracy z dużymi zbiorami danych oraz frameworkami data science, w tym znajomość PySpark i Spark SQL będzie dużym atutem.
Doświadczenie w tworzeniu pipelineów danych i analizie danych, najlepiej na platformie Azure Databricks.
Umiejętności wizualizacji i prezentacji danych, z wykorzystaniem odpowiednich narzędzi w zależności od przypadku użycia.