Engenheiro(a) de Dados Pleno

CLT, São Paulo Remote

Impactar positivamente bilhões de vidas é nosso propósito e também pode ser o seu! 🚀

 

Fundada em 2010, no Brasil, a Semantix é referência em Big Data, Analytics e Inteligência Artificial. 

 

Somos um time de apaixonados por inovação, com diversas origens e diferentes graus de experiência. O que nos une, é a motivação compartilhada de transformar a experiência de nossos clientes através da cultura data driven.

 

Se você se identificou, a Semantix é seu lugar. 

Estamos ansiosos para ter você como parte do time.

 

Afinal, o futuro se faz juntos. 💜  

Requirements

Estamos em busca de um(a) Engenheiro(a) de Dados com conhecimentos avançados em Python, PySpark e SQL, para atuar em engenharia analítica e arquitetura distribuída.

Esse profissional será responsável por projetar e desenvolver pipelines escaláveis que organizem, transformem e disponibilizem dados de forma estruturada, convertendo dados brutos em informações estratégicas para análise e tomada de decisão.


Responsabilidades e atribuições: 

  • Desenvolver e manter pipelines de dados escaláveis para processamento em larga escala.
  • Projetar arquitetura distribuída para armazenamento, transformação e consumo de dados.
  • Garantir organização, governança e estrutura adequada das camadas de dados.
  • Realizar tratamento, limpeza, transformação e enriquecimento de dados.
  • Construir fluxos de ingestão e processamento de dados estruturados e não estruturados.
  • Garantir padronização e qualidade dos datasets.
  • Identificar e implementar melhorias contínuas na confiabilidade, performance e escalabilidade.
  • Otimizar consultas e processamento de grandes volumes de dados.
  • Monitorar e melhorar a eficiência de pipelines.
  • Desenvolver algoritmos e estruturas que simplifiquem o consumo de dados por áreas de negócio.
     

Requisitos e qualificações:

  • Sólida experiência com Azure, Data Factory e Databricks.
  • Domínio em Python e Spark (PySpark ou Scala).
  • Conhecimento avançado em SQL e modelagem de dados.
  • Experiência com processamento distribuído e arquitetura de dados em larga escala.
  • Vivência com metodologias ágeis (Scrum/Kanban).
  • Capacidade de atuar em engenharia analítica com foco em performance e escalabilidade.

Diferenciais: 

  • Experiência com ecossistema Big Data (Hadoop, Hive).
  • Vivência com Teradata, SAS ou ferramentas legadas de integração.
  • Conhecimentos sólidos em Governança de Dados.
  • Experiência com arquitetura Lakehouse ou modelo Medalhão.

Perfil Comportamental:

  • Perfil analítico e estruturado.
  • Proatividade na identificação de melhorias técnicas.
  • Forte senso de responsabilidade sobre qualidade e confiabilidade dos dados.
  • Capacidade de traduzir necessidades de negócio em soluções técnicas escaláveis.
  • Foco em eficiência, automação e melhoria contínua.
Benefits

💰 Salário compatível com o mercado;

🍎 Caju (cartão flexível) com a recarga de R$ 1.060/mês;

🚑 Plano de Saúde Bradesco;

🦷 Plano Odontológico Bradesco;

👩‍⚕️ Medicina preventiva com Dr. Alper;

💜 Seguro de Vida;

🏋🏽‍♂️ Gympass;

🏞️ SESC;

👶🏼 Auxílio Creche para mamães e papais;

💰 PLR;

🧠 Learning – área focada no desenvolvimento de hard e soft skills;

📖 Parceria com instituições de ensino para formação técnica, MBA, pós-graduação, certificações, inglês e espanhol;

🚀 Plano de Carreira;

🛒 Desconto em produtos de um portal parceiro.

 

Ressaltamos que todas as nossas vagas estão abertas a pessoas de todos os perfis e origens, valorizando a diversidade e promovendo um ambiente inclusivo e acolhedor para todos. 💎