Especialista de Observabilidade (SRE)
Descrição da vaga
A Redion considera a diversidade e a inclusão como valores a serem cultivados, fortalecendo a dignidade das pessoas e o respeito aos direitos humanos.
Valorizamos as pessoas, encorajamos a diversidade, investimos no aprendizado contínuo e no crescimento por meio da criação de um ambiente de trabalho transparente, coerente e acessível.
Nossos valores envolvem estarmos abertos e olharmos o mundo de diferentes perspectivas, trazendo a equidade como um pilar, para entendermos as realidades distintas.
Promovemos uma organização com uma cultura de respeito a singularidade de cada pessoa juntamente com a construção de um ambiente igualitário e aberto a novas ideias e sugestões vindas de todas as áreas.
Responsabilidades e atribuições
- Estratégia de Telemetria: Definir padrões para coleta de métricas, logs e traces (distributed tracing) em toda a stack tecnológica.
- Cultura de SLIs/SLOs: Colaborar com times de operação e aplicação para definir Service Level Indicators e Objectives que reflitam a experiência real do usuário.
- Gestão da Ferramenta: Administrar e otimizar a plataforma de observabilidade, garantindo eficiência de custos e qualidade dos dados.
- Incident Response: Atuar como facilitador em incidentes críticos, provendo visibilidade técnica para acelerar o MTTR (Mean Time To Recovery).
- Automação: Desenvolver automações para provisionamento de monitores, dashboards e alertas.
- Estruturar e liderar a célula de monitoramento e suporte 24x7
Requisitos e qualificações
- Superior Completo em áreas afins
- Especialista em Datadog: Experiência avançada na configuração de APM, Log Management, Synthetics, RUM (Real User Monitoring) e Watchdog dentro da plataforma Datadog.
- Experiência sólida em ambientes de nuvem AWS
- Domínio de conceitos de SRE (Site Reliability Engineering).
- Familiaridade com arquitetura de microsserviços e Kubernetes (K8s).
- Experiência com OpenTelemetry e padronização de logs.
Diferenciais
- Experiência em otimização de custos (FinOps) dentro do Datadog.
- Experiência em ambiente 24x7
- Conhecimento de conceitos de DevOps
- Conhecimento em outras ferramentas de observabilidade
- Conhecimento em linguagens de programação (Go, Python ou Java) para suporte à instrumentação de código
Soft Skills
- Mentalidade analítica e orientada a dados
- Excelente comunicação para traduzir métricas técnicas em valor de negócio
- Resiliência e foco na resolução de problemas complexos
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Entrevista Atração e Seleção
- Etapa 3: Entrevista Gestor
- Etapa 4: Contratação
Nossos Valores
Cuidamos de pessoas com empatia, cordialidade e dedicação em cada interação, ouvindo, entendendo e indo além.
- Collaborative (Colaborativos)
Trabalhamos de forma aberta e generosa, com colegas, parceiros
e clientes, quebrando barreiras, apoiando uns aos outros e
alcançando resultados juntos.
- Agile (Ágeis)
Agimos com rapidez, nos adaptamos facilmente e estamos
sempre prontos para o que vier pela frente.
- Reliable (Confiáveis)
Assumimos responsabilidades, seguimos firmes até o fim e
entregamos resultados de forma consistente, mesmo sob
pressão, com calma, integridade e sem desistir.
- Experts (Especialistas)
Mantemos os mais altos padrões em tudo o que fazemos: atentos
aos detalhes, profundamente comprometidos com as pessoas
que atendemos e sempre em busca de evolução contínua.