Poszukujemy doświadczonego Reliability Engineer z mocnym zapleczem w aplikacjach Java i systemach produkcyjnych. Projekt dotyczy podnoszenia niezawodności oraz odporności istniejących aplikacji Java w środowisku brownfield. Rola wymaga ścisłej współpracy z zespołami deweloperskimi i wdrażania najlepszych praktyk reliability engineering.
Senior Reliability Engineer (Java)
Twój zakres obowiązków
- Poprawa niezawodności i stabilności istniejących aplikacji Java
- Definiowanie i wdrażanie SLO/SLI oraz error budgets
- Usprawnianie obserwowalności (metryki RED/USE, tracing, logi, alerting)
- Analiza awarii i wdrażanie wzorców odporności (timeouts, retries, circuit breakers, rate limiting)
- Ocena i poprawa CI/CD, jakości testów i pipeline’ów
- Wsparcie zespołów w zakresie skalowalności, wydajności i incident management
Nasze wymagania
- Min. 5 lat doświadczenia z aplikacjami Java w produkcji
- SLO/SLI, error budgets, reliability engineering
- Traffic management: rate limiting, backpressure, circuit breakers
- Progressive delivery: canary, blue/green, feature flags
- Obserwowalność: metrics/logs/tracing
- Doświadczenie z Kubernetes/ECS (z perspektywy niezawodności)
- Doświadczenie on-call i post-mortem