Damia Group Portugal

Especialistas em recrutamento de TI, definimo-nos como H2H (Humano para Humano). Com a ambição de proporcionar uma mudança positiva na vida das pessoas, buscamos encontrar as melhores soluções para os nossos clientes e candidatos. Somos curiosos, inovadores, transparentes, descontraídos, e ADORAMOS TI!
Sobre a empresa

Engenheiro de Fiabilidade de Site na Nuvem

Presencial

location Lisboa

date 7 de abril de 2026

types Tempo integral

Descrição do Papel

Sobre a empresa: Damia Group é uma agência internacional de recrutamento tecnológico com 3 décadas de experiência. A nossa chegada a Portugal, 7 anos depois, teve como missão transformar as experiências de recrutamento em TI e, através delas, alcançar melhores resultados. Acreditamos em relações de longo prazo com uma mentalidade transparente e descontraída. Num curto período, chegámos aos corações tanto de startups como de organizações maiores, ao fornecer listas curadas de candidatos, aumento nas taxas de aceitação de ofertas de emprego e menor tempo de contratação.

Requisitos Principais

Sobre o papel: Como Engenheiro Sênior na equipa da Plataforma Cloud, o seu impacto será medido pela melhoria contínua da fiabilidade, escalabilidade e segurança da nossa plataforma.

Propriedade de SLO e Gestão do Orçamento de Erros: Assuma a propriedade direta dos Indicadores de Nível de Serviço (SLIs) e Objetivos de Nível de Serviço (SLOs) estabelecidos para os serviços principais da plataforma (por exemplo, latência, disponibilidade, taxa de erros). Você gerenciará e usará o Orçamento de Erros como o principal motor para priorizar o trabalho de fiabilidade.

Escalar e Fortalecer a Plataforma Central: Aplique uma profunda experiência técnica em Kubernetes, AWS, gestão de tráfego e Infraestrutura como Código para escalar e fortalecer a plataforma fundamental que alimenta as cargas de trabalho do produto da empresa.

Promover Melhorias Sistémicas: Este papel centra-se nas competências de engenharia prática, liderança técnica e melhorias de fiabilidade sistémica dentro da sua plataforma distribuída e complexa.

O que você fará:

- Engenharia de Plataforma Kubernetes Use sua experiência em Kubernetes e AWS para evoluir o ciclo de vida do EKS, isolamento multi-tenant e consistência regional, garantindo que os clusters permaneçam seguros, eficientes e previsíveis à medida que escalamos.

- Fiabilidade de Tráfego e Ingress Aplicar conhecimento avançado em gestão de tráfego nativo da nuvem e gateways de API.

- Infraestrutura como Código em Grande Escala Demonstre domínio em IaC para gerir arquitetura complexa e multi-regional.

- Segurança e Controlo de Acesso Promova uma postura de zero confiança estabelecendo restrições de serviço e controlos de acesso em toda a plataforma.

- Engenharia de Fiabilidade e Liderança de Incidentes Demonstre forte liderança na resposta a incidentes para isolar rapidamente problemas em clusters, redes e cargas de trabalho.

- Colaboração, Influência e Mentoria Oriente e influencie equipas de engenharia em toda a organização através de revisões de design, melhores práticas operacionais e decisões focadas em fiabilidade.

Requisitos:

- Expertise em Plataforma e Infraestrutura Principal Demonstre grande habilidade em gerir ambientes complexos e distribuídos em grande escala, focando especificamente em: - Orquestração Nativa da Nuvem: Especialização em Kubernetes - Automação de Infraestrutura: Mestrado em Infraestrutura como Código (IaC), incluindo Terraform - Redes Avançadas e Conectividade: compreensão dos fundamentos de redes, incluindo routagem, DNS, segmentação de rede (VPC.subnets) e serviços de conectividade (p.ex., gateways de trânsito e pontos finais de rede) - Sistemas de Plataforma: Competência profunda em sistemas de tráfego/ingress e fortes fundamentos de programação em Go ou Python.

- Habilidades em Segurança e Fiabilidade - Fluência com IAM/IRSA, Vault, mTLS e design de menor privilégio, combinada com uma capacidade comprovada de fornecer melhorias mensuráveis em fiabilidade através de automação, restrições e engenharia inteligente.

- Liderança e Comunicação - Demonstre uma forte mentalidade operacional, excelente comunicação técnica (escrita e verbal) e a capacidade de influenciar designs, mentorar outros e elevar práticas de engenharia de plataforma entre equipas.

- Experiência e Proficiência Demonstre proficiência avançada e liderança técnica na gestão de sistemas de produção resilientes e de grande escala. Esta experiência é geralmente adquirida em papéis como: - Engenheiro de Fiabilidade de Site (SRE) - Engenheiro de Plataforma Cloud - Engenheiro DevOps - Outro papel de infraestrutura intimamente relacionado.