
PDMFC
Engenheiro de IA
August 1, 2025
Visão Geral da Posição
Estamos à procura de um engenheiro de IA talentoso e inovador com habilidades excepcionais em Python para se juntar à nossa equipa de IA de ponta. O candidato ideal terá experiência prática em implementar e otimizar grandes modelos de linguagem (LLMs) e sistemas de IA multimodais usando estruturas como llama.cpp e vLLM. Você será responsável por construir e manter serviços de IA robustos que alimentam as nossas capacidades de conversão de voz para texto, texto para voz, resumo, RAG (Geração Aumentada por Recuperação) e geração multimodal. Este papel oferece uma oportunidade emocionante para trabalhar na interseção de vários domínios de IA e desenvolver soluções que transformem a forma como os nossos usuários interagem com a tecnologia.
Responsabilidades Principais
- Projetar, implementar e otimizar a infraestrutura de distribuição de modelos de IA usando llama.cpp, vLLM ou estruturas semelhantes para garantir inferência e implementação eficientes.
- Desenvolver e manter pipelines de conversão de voz para texto e de texto para voz que ofereçam capacidades de processamento de áudio de alta qualidade.
- Criar sistemas RAG robustos que recuperem informações relevantes e gerem respostas precisas e contextualizadas.
- Construir e otimizar sistemas de IA multimodais capazes de processar e gerar texto, imagens e conteúdo de áudio.
- Implementar capacidades eficientes de resumo de documentos para vários tipos e comprimentos de conteúdo.
- Avaliar e melhorar continuamente o desempenho do modelo, latência e utilização de recursos.
- Colaborar com equipas multifuncionais para integrar capacidades de IA no nosso ecossistema de produtos.
- Pesquisar e implementar técnicas de ponta para melhorar as capacidades dos nossos sistemas de IA.
- Desenvolver estruturas de monitoramento e avaliação para acompanhar o desempenho do sistema de IA e identificar áreas de melhoria.
Qualificações Requeridas
- Licenciatura em Ciência da Computação, Inteligência Artificial ou um campo técnico relacionado.
- Fortes habilidades de programação em Python com experiência demonstrada em desenvolvimento de IA/ML.
- Experiência prática em implementar e otimizar LLMs usando llama.cpp, vLLM ou estruturas semelhantes.
- Experiência com tecnologias de processamento de voz (ASR/TTS) e bibliotecas relevantes.
- Conhecimento de arquiteturas RAG e bases de dados vetoriais (por exemplo, Pinecone, Weaviate, Milvus).
- Familiaridade com sistemas de IA multimodais que processam texto, imagens e áudio.
- Experiência com estruturas de aprendizado profundo, como PyTorch ou TensorFlow.
- Compreensão de técnicas de quantização, otimização e distribuição de modelos.
- Proficiência com tecnologias de containerização (Docker) e ambientes de nuvem.
Qualificações Preferenciais
- Mestrado ou doutoramento em IA, ML, PLN ou área relacionada.
- Experiência com ONNX Runtime, TensorRT ou outras estruturas de otimização de modelos.
- Conhecimento de sistemas distribuídos para distribuição de modelos de IA em larga escala.
- Experiência com processamento de dados em fluxo para aplicações de IA em tempo real.
- Familiaridade com aceleração e técnicas de otimização de GPU/TPU.
- Contribuições para projetos de IA de código aberto ou publicações de pesquisa.
- Experiência em ajustar e adaptar modelos base para tarefas específicas.
- Conhecimento de práticas e ferramentas de MLOps para implementação e monitoramento de sistemas de IA.
- Experiência com engenharia de prompts e metodologias de avaliação de LLM.
O Que Nós Oferecemos
- Oportunidade de trabalhar em tecnologias de IA inovadoras que impactam milhões de usuários.
- Acesso a recursos computacionais de última geração e aos mais recentes modelos de IA.
- Ambiente colaborativo com especialistas líderes em pesquisa e engenharia de IA.
- Oportunidades contínuas de aprendizagem e desenvolvimento profissional.
- Pacote salarial competitivo e benefícios abrangentes.
- Disposições de trabalho flexíveis para apoiar o equilíbrio entre vida profissional e pessoal.
- Oportunidades regulares de apresentar e publicar o seu trabalho.
Junte-se à nossa equipa e ajude a moldar o futuro dos sistemas de IA multimodais. A sua experiência em desenvolvimento Python e na distribuição de modelos de IA será instrumental na criação de experiências de IA eficientes e poderosas que transformam a forma como as pessoas interagem com a tecnologia em múltiplas modalidades.
Se tiver alguma dúvida, envie-nos um email para