Engenheiro(a) de Dados Pleno

CLT, São Paulo Remote

Impactar positivamente bilhões de vidas é nosso propósito e também pode ser o seu! 🚀

Fundada em 2010, no Brasil, a Semantix é referência em Big Data, Analytics e Inteligência Artificial.

Somos um time de apaixonados por inovação, com diversas origens e diferentes graus de experiência. O que nos une, é a motivação compartilhada de transformar a experiência de nossos clientes através da cultura data driven.

Se você se identificou, a Semantix é seu lugar.

Estamos ansiosos para ter você como parte do time.

Afinal, o futuro se faz juntos. 💜

Requirements

Estamos em busca de um(a) Engenheiro(a) de Dados com conhecimentos avançados em Python, PySpark e SQL, para atuar em engenharia analítica e arquitetura distribuída.

Esse profissional será responsável por projetar e desenvolver pipelines escaláveis que organizem, transformem e disponibilizem dados de forma estruturada, convertendo dados brutos em informações estratégicas para análise e tomada de decisão.

Responsabilidades e atribuições:

Desenvolver e manter pipelines de dados escaláveis para processamento em larga escala.
Projetar arquitetura distribuída para armazenamento, transformação e consumo de dados.
Garantir organização, governança e estrutura adequada das camadas de dados.
Realizar tratamento, limpeza, transformação e enriquecimento de dados.
Construir fluxos de ingestão e processamento de dados estruturados e não estruturados.
Garantir padronização e qualidade dos datasets.
Identificar e implementar melhorias contínuas na confiabilidade, performance e escalabilidade.
Otimizar consultas e processamento de grandes volumes de dados.
Monitorar e melhorar a eficiência de pipelines.
Desenvolver algoritmos e estruturas que simplifiquem o consumo de dados por áreas de negócio.

Requisitos e qualificações:

Sólida experiência com Azure, Data Factory e Databricks.
Domínio em Python e Spark (PySpark ou Scala).
Conhecimento avançado em SQL e modelagem de dados.
Experiência com processamento distribuído e arquitetura de dados em larga escala.
Vivência com metodologias ágeis (Scrum/Kanban).
Capacidade de atuar em engenharia analítica com foco em performance e escalabilidade.

Diferenciais:

Experiência com ecossistema Big Data (Hadoop, Hive).
Vivência com Teradata, SAS ou ferramentas legadas de integração.
Conhecimentos sólidos em Governança de Dados.
Experiência com arquitetura Lakehouse ou modelo Medalhão.

Perfil Comportamental:

Perfil analítico e estruturado.
Proatividade na identificação de melhorias técnicas.
Forte senso de responsabilidade sobre qualidade e confiabilidade dos dados.
Capacidade de traduzir necessidades de negócio em soluções técnicas escaláveis.
Foco em eficiência, automação e melhoria contínua.

Benefits

💰 Salário compatível com o mercado;

🍎 Caju (cartão flexível) com a recarga de R$ 1.060/mês;

🚑 Plano de Saúde Bradesco;

🦷 Plano Odontológico Bradesco;

👩‍⚕️ Medicina preventiva com Dr. Alper;

💜 Seguro de Vida;

🏋🏽‍♂️ Gympass;

🏞️ SESC;

👶🏼 Auxílio Creche para mamães e papais;

💰 PLR;

🧠 Learning – área focada no desenvolvimento de hard e soft skills;

📖 Parceria com instituições de ensino para formação técnica, MBA, pós-graduação, certificações, inglês e espanhol;

🚀 Plano de Carreira;

🛒 Desconto em produtos de um portal parceiro.

Ressaltamos que todas as nossas vagas estão abertas a pessoas de todos os perfis e origens, valorizando a diversidade e promovendo um ambiente inclusivo e acolhedor para todos. 💎

Apply

by Quickin

Português | English | Español