Cientista de Dados Sênior ( Machine Learning | IA | Databricks)

São Paulo Remote

Sobre nós:
Desde 2001, o INDT é um instituto de tecnologia que inspira inovação e respira tecnologia! Desenvolver está no nosso DNA e oferecemos um ambiente colaborativo com muitos desafios para o aprendizado e crescimento.

Surgimos em Manaus (AM) através da Nokia, e hoje atuamos em todo Brasil com o objetivo de apresentar os nossos serviços e a nossa Cultura para todas as regiões brasileiras. Atualmente, possuímos mais de 200 colaboradores atuando ativamente.

Para nós, eliminar as barreiras geográficas e culturais foi só uma consequência por acreditarmos que nada é impossível. Por isso, hoje, mais do que nunca, podemos olhar no espelho e pensar: trabalhamos em uma empresa que vive e cresce cada dia mais!

Você quer ter a oportunidade de desenvolver seus talentos?

Quer trabalhar num ótimo ambiente de trabalho e com colegas que te ajudarão na tua jornada?

Quer ter a uma experiência incrível de sentir valorizado?

Quer potencializar suas entregas diárias e projetos tendo líderes inspiradores?

Quer ter liberdade para propor e desenvolver projetos inovadores, com autonomia e protagonismo? Então vem com a gente promover a diferença! #VEMSERINDT

Buscamos um(a) Cientista de Dados Sênior para atuar em nosso Centro de Excelência (CoE) de Ciência de Dados, desenvolvendo análises avançadas, soluções de Machine Learning e Inteligência Artificial com foco direto em problemas reais de negócio.

Essa posição é ideal para quem tem forte capacidade técnica aliada à visão de negócio, atuando de ponta a ponta , desde a exploração dos dados até a entrega de soluções com impacto mensurável e sustentável.

Requirements

Principais responsabilidades

  • Atuar em casos de uso estratégicos, traduzindo necessidades de negócio em soluções analíticas orientadas a dados
  • Conduzir análises de ponta a ponta: exploração, entendimento, preparação e entrega dos dados
  • Trabalhar com grandes volumes de dados, garantindo qualidade, integridade e coerência estatística
  • Desenvolver, validar e evoluir modelos estatísticos e de Machine Learning, assegurando performance, estabilidade e explicabilidade
  • Monitorar indicadores de performance dos modelos, propondo melhorias contínuas
  • Contribuir na construção e evolução de Feature Stores, promovendo padronização e governança
  • Criar e manter notebooks e pipelines no Databricks, seguindo boas práticas de engenharia analítica
  • Atuar de forma colaborativa com times multidisciplinares (Engenharia, Governança, BI e Negócio)
  • Comunicar resultados, hipóteses e insights de forma clara e estratégica, utilizando data visualization e storytelling
  • Garantir foco no valor de negócio e na aplicabilidade das soluções entregues

 

Requisitos técnicos

  • Experiência sólida como Cientista de Dados, atuando em projetos de ponta a ponta
  • Forte conhecimento em Machine Learning e Estatística aplicada
  • Experiência com Python (pandas, scikit-learn, entre outros)
  • Vivência com Databricks e Apache Spark
  • Experiência com grandes volumes de dados (Big Data)
  • Conhecimento na construção e consumo de pipelines de dados
  • Experiência com versionamento de código (Git)
  • Vivência com MLOps, incluindo monitoramento e ciclo de vida de modelos
  • Acompanhar tendências, técnicas e boas práticas em Ciência de Dados, Machine Learning e IA, aplicando de forma prática ao contexto do negócio
  • Contribuir continuamente para a evolução técnica das soluções, com foco em inovação e geração de valor

 
Requisitos e qualificações

  • Formação superior em Computação, Estatística, Economia, Matemática, Física ou áreas correlatas
  • Experiência consolidada como Cientista de Dados Sênior, atuando em problemas complexos e ambientes de larga escala
  • Domínio de algoritmos de Machine Learning (regressão, classificação, árvores de decisão, clustering e modelos probabilísticos)
  • Forte experiência com PySpark e bibliotecas de ciência de dados
  • Conhecimento em engenharia de atributos (Feature Engineering) e Feature Store
  • Experiência em tratamento, preparação e análise de dados
  • Capacidade de conduzir análises de forma autônoma, com pensamento crítico e visão de negócio
  • Habilidade de comunicar resultados e conceitos técnicos de forma clara e acessível para diferentes públicos
     
     Diferenciais
  • Experiência prática com Databricks (Spark, notebooks e pipelines)
  • Vivência em ambientes regulados ou de alta criticidade
  • Conhecimento em deploy, monitoramento e governança de modelos (MLOps)
  • Experiência com visualização de dados e storytelling analítico
  • Vivência com cloud (AWS, Azure ou GCP)
  • Experiência com CI/CD aplicado a Machine Learning
  • Conhecimento em frameworks de explicabilidade de modelos (ex: SHAP, LIME)
     
    Perfil esperado
  • Forte pensamento analítico aliado à visão de negócio
  • Capacidade de traduzir problemas complexos em soluções práticas e escaláveis
  • Boa comunicação e habilidade de storytelling com dados
  • Proatividade e senso de dono
  • Facilidade para atuar em ambientes colaborativos e multidisciplinares