Zapewnienie dostępności, odporności i wydajności wszystkich platform CDN (usługi chmurowe, serwery bare-metal, międzynarodowe sieci, punkty wymiany ruchu, cache hostowane przez ISP).
Regularne przeglądanie pojemności CDN, trendów wydajności oraz prognoz użycia w celu wspierania globalnego wzrostu ruchu.
Udział w wdrożeniach, rolloutach produkcyjnych oraz analizie wzorców konsumpcji OTT we wszystkich regionach.
Monitorowanie i analizowanie kluczowych wskaźników wydajności (opóźnienia, przepustowość, efektywność cache, współczynniki błędów…) oraz ciągłe proponowanie optymalizacji poprawiających jakość usług i efektywność kosztową platform.
Uczestnictwo w reakcjach na incydenty, analizie przyczyn źródłowych oraz planach poprawy niezawodności.
Okazjonalne wsparcie zespołów DevOps w sytuacjach przeciążenia zadaniami operacyjnymi.
Budowanie i utrzymywanie stosu narzędzi obserwowalności dla wszystkich platform CDN (logi, metryki, tracey, alerty), obecnie opartego na Datadogu, z silnym naciskiem na skalowalność i standaryzację pomiędzy regionami i spółkami zależnymi.
Projektowanie i utrzymywanie wielokrotnego użytku szablonów (dashboardy, reguły alertów, widoki SLO/SLA, potoki przetwarzania logów), aby zindustrializować proces obserwowalności i zapewnić spójne praktyki monitoringu dla wszystkich środowisk CDN (chmurowych i bare‑metal).
Rozwijanie skalowalnych rozwiązań monitorujących, zdolnych obsługiwać duże wolumeny ruchu i danych, tak aby obserwowalność pozostawała niezawodna i opłacalna wraz ze wzrostem platformy.
Implementacja zautomatyzowanych kontroli zdrowia systemu, wykrywania anomalii i workflowów alertowania wspierających operacje 24/7, ograniczających pracę manualną i powtarzalne zadania.
Ciągłe ulepszanie procesów gromadzenia, korelacji i wizualizacji danych, aby zespoły inżynieryjne, operacyjne i biznesowe mogły szybko zrozumieć zachowanie platformy i doświadczenie użytkownika.
Opracowywanie i dostosowywanie systemów operacyjnych, skryptów oraz workflowów automatyzacji (Python/Bash/wywołania API…) do zbierania metryk operacyjnych, wskaźników kosztowych i danych o wydajności na dużą skalę.
Budowanie wewnętrznych narzędzi wykorzystywanych we wszystkich spółkach zależnych, takich jak: narzędzia do analizy logów, wizualizacja widowni i ruchu
walidatory konfiguracji CDN, narzędzia diagnostyczne i do troubleshootingu, testowanie cache
Wspieranie industrializacji operacji poprzez Infrastructure as Code (Terraform), pipeliney CI/CD oraz automatyczne rollouty konfiguracji.
Ścisła współpraca z zespołami OTT engineering, DevOps, Network, Security, Data oraz jednostkami biznesowymi na całym świecie.
Współtworzenie zasad zarządzania CDN, w tym definiowanie globalnych standardów dotyczących opóźnień (Latency), TTL, zasad cacheowania, obserwowalności, praktyk bezpieczeństwa i optymalizacji kosztów.
Dzielenie się najlepszymi praktykami technicznymi z lokalnymi zespołami w wielu regionach (Afryka, Polska, Europa, Azja…).
Tworzenie dokumentacji technicznej, wytycznych i materiałów onboardingowych.
Współpraca z operatorami ISP, dostawcami chmury oraz zespołami wewnętrznymi w celu diagnozowania problemów dystrybucyjnych i zapewniania optymalnych ścieżek dostarczania treści.
Wsparcie dużych wydarzeń generujących wysokie obciążenie (sport, treści na żywo, piki ruchu) poprzez przygotowanie, monitoring, reakcję i analizę po wydarzeniu.
Wymagania pracodawcy
Masz 4+ lat doświadczenia operacyjnego na stanowiskach SysOps / DevOps / SRE.
Silne podstawy sieciowe: DNS, TCP, HTTP, routing (BGP), cache, proxy.
Pasjonujesz się tematami automatyzacji, obserwowalności i optymalizacji wydajności.
Dobra znajomość środowisk monitoringu (Datadog, Grafana…).
Bardzo dobra znajomość narzędzi DevOps (Terraform, Ansible, AWS Lambdas, pipeliney GitLab CI/CD…).
Unix/Linux nie mają przed Tobą tajemnic.
Doświadczenie z technologiami CDN lub tematami QoS w streamingach OTT będzie dużym plusem.
Biegła znajomość języka angielskiego (znajomość francuskiego będzie dodatkowym atutem).
Mile widziane jest doświadczenie w branży mediowej