Szukamy doświadczonego Kierownika Wydziału Niezawodności Systemów i Usług (Site Reliability Engineering), który pokieruje zespołem inżynierów odpowiedzialnych za niezawodność, skalowalność i wydajność naszych systemów. Jeśli zarządzanie zespołami technicznymi, automatyzacja procesów i tworzenie strategii rozwoju infrastruktury IT to Twoje mocne strony – czekamy właśnie na Ciebie!
responsibilities :
1. Zarządzanie niezawodnością i dostępnością systemów
- Zapewnienie wysokiej dostępności i wydajności systemów krytycznych dla biznesu.
- Projektowanie i wdrażanie mechanizmów redundancji oraz automatycznego skalowania.
- Ustalanie oraz monitorowanie wskaźników SLO/SLI i SLA.
2. Budowanie i rozwijanie zespołu SRE
- Rekrutacja, szkolenie i mentoring członków zespołu.
- Tworzenie kultury automatyzacji, odpowiedzialności i ciągłego doskonalenia.
- Delegowanie zadań i monitorowanie wyników pracy zespołu.
3. Automatyzacja i optymalizacja
- Tworzenie systemów samo-naprawczych (self-healing systems).
- Optymalizacja kosztów operacyjnych i efektywne zarządzanie zasobami.
4. Zarządzanie incydentami i rozwiązywanie problemów
- Nadzór nad procesami zarządzania incydentami i ich szybkie rozwiązywanie.
- Prowadzenie analiz post-mortem i wdrażanie działań naprawczych.
- Współpraca z zespołami developerskimi w celu eliminowania powtarzających się problemów.
5. Monitorowanie i analiza wydajności systemów
- Wdrażanie oraz nadzorowanie narzędzi monitorujących.
- Analiza danych w celu wykrywania zagrożeń przed ich wystąpieniem.
- Raportowanie kluczowych wskaźników wydajności i podejmowanie działań korygujących.
6. Współpraca między zespołami
- Ścisła współpraca z zespołami biznesowymi, IT, infrastruktury i bezpieczeństwa IT.
- Wsparcie dla zespołów deweloperskich w implementacji zasad SRE.
- Aktywne uczestnictwo w planowaniu nowych projektów.
7. Strategia i innowacje technologiczne
- Tworzenie strategii rozwoju infrastruktury i procesów SRE.
- Śledzenie trendów technologicznych i ich wdrażanie w organizacji.
- Inicjowanie projektów zwiększających efektywność i innowacyjność.
8. Zarządzanie ryzykiem i zgodnością
- Identyfikacja i minimalizacja ryzyk technologicznych.
- Zapewnienie zgodności systemów i procesów z regulacjami i najlepszymi praktykami.
- Regularne testy i symulacje awarii na potrzeby przygotowania na sytuacje kryzysowe.
requirements-expected :
Doświadczenie w zarządzaniu zespołem SRE, DevOps lub IT Operations.
Praktyczna znajomość narzędzi monitorujących.
Doświadczenie w automatyzacji i optymalizacji systemów.
Umiejętność analizy incydentów i rozwiązywania problemów.
Doskonałe umiejętności zarządzania zespołem oraz komunikacji.
Znajomość języka angielskiego na poziomie umożliwiającym swobodną komunikację.
offered :
Stabilne zatrudnienie w renomowanej firmie.
Atrakcyjne wynagrodzenie.
Dostęp do najnowszych technologii i innowacyjnych projektów.
Pakiet benefitów (prywatna służba zdrowia, ubezpieczenie na życie, karta sportowa, szkolenia, itp).
Możliwość pracy w dynamicznym, profesjonalnym środowisku.