Cientista de Dados Sênior ( Machine Learning | IA | Databricks)

São Paulo Remote

Sobre nós:
Desde 2001, o INDT é um instituto de tecnologia que inspira inovação e respira tecnologia! Desenvolver está no nosso DNA e oferecemos um ambiente colaborativo com muitos desafios para o aprendizado e crescimento.

Surgimos em Manaus (AM) através da Nokia, e hoje atuamos em todo Brasil com o objetivo de apresentar os nossos serviços e a nossa Cultura para todas as regiões brasileiras. Atualmente, possuímos mais de 200 colaboradores atuando ativamente.

Para nós, eliminar as barreiras geográficas e culturais foi só uma consequência por acreditarmos que nada é impossível. Por isso, hoje, mais do que nunca, podemos olhar no espelho e pensar: trabalhamos em uma empresa que vive e cresce cada dia mais!

Você quer ter a oportunidade de desenvolver seus talentos?

Quer trabalhar num ótimo ambiente de trabalho e com colegas que te ajudarão na tua jornada?

Quer ter a uma experiência incrível de sentir valorizado?

Quer potencializar suas entregas diárias e projetos tendo líderes inspiradores?

Quer ter liberdade para propor e desenvolver projetos inovadores, com autonomia e protagonismo? Então vem com a gente promover a diferença! #VEMSERINDT

Buscamos um(a) Cientista de Dados Sênior para atuar em nosso Centro de Excelência (CoE) de Ciência de Dados, desenvolvendo análises avançadas, soluções de Machine Learning e Inteligência Artificial com foco direto em problemas reais de negócio.

Essa posição é ideal para quem tem forte capacidade técnica aliada à visão de negócio, atuando de ponta a ponta , desde a exploração dos dados até a entrega de soluções com impacto mensurável e sustentável.

Requirements

Principais responsabilidades

Atuar em casos de uso estratégicos, traduzindo necessidades de negócio em soluções analíticas orientadas a dados
Conduzir análises de ponta a ponta: exploração, entendimento, preparação e entrega dos dados
Trabalhar com grandes volumes de dados, garantindo qualidade, integridade e coerência estatística
Desenvolver, validar e evoluir modelos estatísticos e de Machine Learning, assegurando performance, estabilidade e explicabilidade
Monitorar indicadores de performance dos modelos, propondo melhorias contínuas
Contribuir na construção e evolução de Feature Stores, promovendo padronização e governança
Criar e manter notebooks e pipelines no Databricks, seguindo boas práticas de engenharia analítica
Atuar de forma colaborativa com times multidisciplinares (Engenharia, Governança, BI e Negócio)
Comunicar resultados, hipóteses e insights de forma clara e estratégica, utilizando data visualization e storytelling
Garantir foco no valor de negócio e na aplicabilidade das soluções entregues

Requisitos técnicos

Experiência sólida como Cientista de Dados, atuando em projetos de ponta a ponta
Forte conhecimento em Machine Learning e Estatística aplicada
Experiência com Python (pandas, scikit-learn, entre outros)
Vivência com Databricks e Apache Spark
Experiência com grandes volumes de dados (Big Data)
Conhecimento na construção e consumo de pipelines de dados
Experiência com versionamento de código (Git)
Vivência com MLOps, incluindo monitoramento e ciclo de vida de modelos
Acompanhar tendências, técnicas e boas práticas em Ciência de Dados, Machine Learning e IA, aplicando de forma prática ao contexto do negócio
Contribuir continuamente para a evolução técnica das soluções, com foco em inovação e geração de valor

Requisitos e qualificações

Formação superior em Computação, Estatística, Economia, Matemática, Física ou áreas correlatas
Experiência consolidada como Cientista de Dados Sênior, atuando em problemas complexos e ambientes de larga escala
Domínio de algoritmos de Machine Learning (regressão, classificação, árvores de decisão, clustering e modelos probabilísticos)
Forte experiência com PySpark e bibliotecas de ciência de dados
Conhecimento em engenharia de atributos (Feature Engineering) e Feature Store
Experiência em tratamento, preparação e análise de dados
Capacidade de conduzir análises de forma autônoma, com pensamento crítico e visão de negócio
Habilidade de comunicar resultados e conceitos técnicos de forma clara e acessível para diferentes públicos

Diferenciais
Experiência prática com Databricks (Spark, notebooks e pipelines)
Vivência em ambientes regulados ou de alta criticidade
Conhecimento em deploy, monitoramento e governança de modelos (MLOps)
Experiência com visualização de dados e storytelling analítico
Vivência com cloud (AWS, Azure ou GCP)
Experiência com CI/CD aplicado a Machine Learning
Conhecimento em frameworks de explicabilidade de modelos (ex: SHAP, LIME)

Perfil esperado
Forte pensamento analítico aliado à visão de negócio
Capacidade de traduzir problemas complexos em soluções práticas e escaláveis
Boa comunicação e habilidade de storytelling com dados
Proatividade e senso de dono
Facilidade para atuar em ambientes colaborativos e multidisciplinares

Apply

by Quickin

Português | English | Español