
Intermedia
Engenheiro de Fiabilidade de Site - idp
Coimbra
16 de maio de 2026
Tempo integral
Engenheiro de Fiabilidade de Site - IDP
Departamento: Desenvolvimento & Engenharia
Tipo de Emprego: Tempo Inteiro
Localização: Portugal
Sobre o Papel
Os Engenheiros de Fiabilidade de Site (SREs) da Intermedia desempenham um papel crítico em garantir a fiabilidade, disponibilidade, escalabilidade e desempenho das nossas aplicações e serviços mais importantes.
Como SRE na Intermedia, você se concentrará em melhorar a fiabilidade das aplicações e a excelência operacional, trabalhando de perto com as equipas de engenharia de software, plataforma e DevOps para projetar, monitorar, automatizar e aprimorar continuamente a estabilidade do serviço.
Embora seja principalmente remoto, este papel requer visitas ocasionais ao escritório em Coimbra. Planeamos abrir escritórios em Aveiro e Porto no futuro.
O que você irá fazer:
- Garantir a disponibilidade, desempenho e fiabilidade das aplicações e serviços críticos, projetando e implementando estratégias robustas de monitoramento, alerta e otimização.
- Definir, medir e manter SLIs, SLOs e orçamentos de erro para apoiar os objetivos de fiabilidade do serviço.
- Parceria com equipas de desenvolvimento para melhorar o desempenho, reduzir a latência e aumentar a resiliência das aplicações em produção.
- Trabalhar em estreita colaboração com as equipas de plataforma e DevOps para garantir um alinhamento suave entre a infraestrutura e a fiabilidade da aplicação.
- Definir padrões de fiabilidade e diretrizes operacionais para capacidades de plataforma e caminhos ideais.
- Parceria com equipas de engenharia de plataforma para projetar capacidades de autoatendimento resilientes.
- Automatizar tarefas operacionais, como implantações, reversões, escalonamento, failover e processos de recuperação.
- Melhorar continuamente os pipelines de CI/CD para reduzir a intervenção manual e apoiar práticas de entrega seguras e progressivas.
- Integrar validações automatizadas, verificações de fiabilidade e diretrizes operacionais nos fluxos de trabalho de desenvolvimento e implantação.
- Implementar e manter capacidades de observabilidade em sistemas de produção, incluindo métricas, logs, rastros e painéis.
- Desenvolver painéis, alertas e vistas operacionais que forneçam visibilidade em tempo real sobre a saúde do sistema e o comportamento da aplicação.
- Atuar como um dos principais respondentes durante incidentes, colaborando entre equipas para solucionar, mitigar e resolver problemas de produção.
- Realizar análises de causa raiz para incidentes e impulsionar ações corretivas a longo prazo para prevenir recorrências.
- Realizar exercícios de simulação de falhas, dias de jogo e engenharia do caos para validar a resiliência do sistema em condições de falha.
- Monitorar a utilização de recursos, tendências de capacidade e comportamento de escalonamento para apoiar o crescimento e as necessidades de desempenho futuras.
- Colaborar com equipas de segurança para garantir que os serviços estejam alinhados com as melhores práticas de segurança, incluindo comunicação segura, controles de acesso e proteção de dados.
- Liderar ou contribuir para reuniões regulares de prontidão de produção e revisão operacional para avaliar a saúde do sistema, rever incidentes e preparar-se para lançamentos.
- Promover as melhores práticas de engenharia de fiabilidade entre equipas e ajudar a fortalecer a maturidade operacional geral da organização.
O que você trará para o papel:
- Licenciatura em Ciência da Computação, Engenharia ou área relacionada, ou experiência prática equivalente.
- Experiência comprovada em Engenharia de Fiabilidade de Site, Engenharia de Plataforma ou funções de Infraestrutura/DevOps com forte responsabilidade operacional.
- Forte experiência em monitoramento de aplicações, plataformas de observabilidade, resposta a incidentes e resolução de problemas em ambientes de produção.
- Forte compreensão dos conceitos de engenharia de fiabilidade, como SLIs, SLOs, orçamentos de erro, qualidade de alerta e gestão de incidentes.
- Proficiência em scripting e automação usando ferramentas e linguagens como Python, Bash, Terraform, Ansible ou semelhantes.
- Experiência com plataformas de nuvem como AWS, Azure ou Google Cloud.
- Sólidos conhecimentos de pipelines de CI/CD, automação de implantação e práticas de entrega progressiva.
- Sólidos conhecimentos de infraestrutura como código e abordagens de gestão de configuração.
- Experiência com contenção e orquestração, como Docker e Kubernetes.
- Fortes habilidades de resolução de problemas, julgamento operacional e atenção aos detalhes.
- Excelentes habilidades de comunicação e colaboração, com a capacidade de trabalhar efetivamente entre equipas de engenharia, plataforma e segurança.
Habilidades Bónus
- Experiência com práticas e ferramentas de engenharia do caos.
- Experiência a apoiar plataformas internas ou equipas de engenharia de plataforma.
- Familiaridade com portais de desenvolvedores, caminhos ideais, catálogos de serviços ou padrões de plataforma de autoatendimento.
- Compreensão de métricas de experiência de desenvolvedor e maturidade operacional para plataformas internas.
- Familiaridade com arquiteturas de microserviços e ambientes multi-inquilinos.
- Experiência com pilhas modernas de observabilidade e padrões de telemetria.
- Compreensão das plataformas UCaaS e CCaaS, especialmente fluxos de serviços de voz e comunicação.
- Experiência na liderança de iniciativas de fiabilidade, revisões de incidentes ou programas de melhoria de produção.
- Familiaridade com planejamento de capacidade, testes de resiliência e práticas de prontidão operacional.
Diversidade, Inclusão e Igualdade de Oportunidades
Contratamos, promovemos e compensamos os colaboradores com base na sua capacidade de executar as suas responsabilidades, sem distinção de raça, cor, credo, religião, sexo, género, estado civil, origem nacional, ancestralidade, idade, cidadania, deficiência física ou mental, orientação sexual, ou qualquer outra base protegida pela legislação aplicável (coletivamente referidas no nosso Código de Conduta como “Classes Protegidas”). Não toleramos a discriminação no emprego no local de trabalho e estamos comprometidos em fazer acomodações razoáveis para deficiências identificadas ou outras limitações conforme exigido por todas as leis aplicáveis. Somos um empregador que promove a igualdade de oportunidades e valorizamos a diversidade na nossa empresa.
Sobre a Intermedia Intelligent Communications
Para explorar outras oportunidades, consulte a nossa página de carreiras: https://www.intermedia.com/about-us/careers