Razem z naszym Partnerem poszukujemy osoby na stanowisko Platform Architekt.
Projekt polega na budowie i skalowaniu centralnej platformy observability, agregującej metryki, logi i trace’y z infrastruktury, Kubernetes oraz środowisk chmurowych w skali całej organizacji (terabajty danych na godzinę). Celem jest zapewnienie pełnej widoczności stanu usług, detekcji anomalii, szybkiego root cause analysis oraz automatyzacji reakcji, zwiększając niezawodność systemów przy optymalizacji kosztów.
responsibilities :
Budowanie i rozwijanie architektonicznego drzewa decyzyjnego: kryteria użycia platformy, direct vs collector ingest, sampling, retencja, cardinality/cost guardrails, obsługa wyjątków.
Tworzenie i utrzymywanie wzorców integracyjnych dla Kubernetes, API, przepływów async/event-driven, Kafka/kolejek, baz danych, z zapewnieniem end-to-end traceability.
Definiowanie i nadzór nad standardami OpenTelemetry: schematy, etykiety, context propagation, correlation rules, zapewnienie spójności logów, metryk i trace’ów.
Zapewnienie niezawodności i skalowalności platformy na Azure/GCP, uwzględniając bezpieczeństwo i compliance w pipeline telemetrycznym.
Dostarczanie golden paths: referencyjne implementacje, template’y, dokumentacja onboardingowa, wsparcie i mentoring zespołów.