Poznań, Poznań, Greater Poland Voivodeship, Polska
tpay
10. 1. 2026
Informacje o stanowisku
technologies-expected :
Kubernetes
Grafana
Prometheus
ELK
Kibana
Sentry
Bash
YAML
Python
SQL
Git
GitLab
technologies-optional :
Ansible
Terraform
about-project :
Już teraz możesz dołączyć do nas jako Site Reliability Engineer (SRE). Szukamy osoby o silnych kompetencjach w obszarze niezawodności systemów oraz observability, która będzie realnie wpływać na stabilność, wydajność i odporność naszych usług. Rola wymaga solidnych podstaw DevOps (automatyzacja, CI/CD, IaC), jednak głównym obszarem odpowiedzialności jest niezawodność i observability naszych systemów.
responsibilities :
projektowanie, wdrażanie i rozwój zaawansowanego observability (metrics, logs, traces),
ujednolicenie oraz dalszy rozwój obecnych rozwiązań monitoringu,
rozwój proactive monitoring oraz real user monitoring,
definiowanie i utrzymanie SLI / SLO / SLA dla systemów produkcyjnych,
analiza incydentów, RCA oraz realny wpływ na eliminację przyczyn źródłowych,
utrzymanie i podnoszenie niezawodności, wydajności i odporności systemów produkcyjnych,
współpraca z zespołami developerskimi i OPS przy projektowaniu rozwiązań „production-ready”,
udział w projektowaniu i rozwoju platformy kontenerowej (Kubernetes),
automatyzacja i standaryzacja infrastruktury z wykorzystaniem podejścia IaC (np. Terraform, Ansible),
wsparcie obszaru CI/CD (GitLab CI) tam, gdzie ma to realny wpływ na stabilność i jakość wdrożeń,
dzielenie się wiedzą i rozwijanie kultury SRE w organizacji.
requirements-expected :
masz doświadczenie w utrzymaniu i poprawie niezawodności systemów produkcyjnych, w tym analizie incydentów, degradacji wydajności i problemów dostępności,
dobrze znasz Kubernetes – pracowałeś/aś z klastrami produkcyjnymi, troubleshootingiem, zarządzaniem zasobami (requests/limits), scalingiem i stabilnością workloadów.
masz silne kompetencje w obszarze observability: monitoring (metryki, alerting), logowanie i analiza zdarzeń, podstawy tracingu,
pracujesz z narzędziami takimi jak Grafana, Prometheus, ELK/Kibana, Sentry (lub równoważnymi),
masz doświadczenie w proactive monitoring oraz real user monitoring i rozumiesz ich wpływ na jakość usług,
rozumiesz działanie systemów rozproszonych – sieć (TCP/IP, DNS, HTTP/S), zależności między usługami, wąskie gardła,
sprawnie administrujesz systemami Linux (preferowane Debian/Ubuntu) w kontekście środowisk produkcyjnych,
potrafisz analizować problemy wydajnościowe i stabilnościowe również po stronie baz danych (podstawy SQL, diagnostyka),
automatyzujesz wszystko, co powtarzalne – skrypty, deklaracje, konfiguracje (Bash, YAML, Python lub podobne),
pracujesz z repozytoriami Git (GitLab) i rozumiesz wpływ zmian aplikacyjnych na stabilność środowisk.
offered :
zatrudnienie w oparciu o umowę o pracę lub współpracę B2B - Ty wybierasz,
25 płatnych dni wolnych od świadczenia usług (w modelu współpracy B2B),