Responsável por projetar, construir e manter a infraestrutura de dados da companhia, garantindo a extração, organização e disponibilidade de dados corporativos para análises estratégicas e operacionais. Responsável pela construção e manutenção do Data Lake e Data Warehouse da empresa, garantindo qualidade, confiabilidade e escalabilidade dos dados utilizados pelas áreas de negócio, BI e analytics.
– Projetar, implementar e evoluir a arquitetura de dados da empresa, garantindo escalabilidade, segurança e eficiência no armazenamento e processamento das informações.
– Estruturar, administrar e manter ambientes de Data Lake e Data Warehouse, definindo padrões de organização, armazenamento e acesso aos dados.
– Definir e implementar padrões de ingestão, transformação e armazenamento de dados, assegurando consistência e confiabilidade das informações.
– Desenvolver e manter pipelines de ingestão e processamento de dados (ETL/ELT), automatizando fluxos de atualização e processamento.
– Garantir a qualidade, rastreabilidade e confiabilidade dos dados ao longo de todo o ciclo de processamento.
– Integrar dados provenientes de diferentes sistemas corporativos, assegurando consistência entre múltiplas fontes de informação.
– Conectar e estruturar dados oriundos do ERP Sankhya e demais sistemas utilizados pela companhia.
– Atuar na construção, manutenção e evolução da plataforma de dados baseada em Databricks.
– Desenvolver notebooks e pipelines de processamento utilizando Python e Spark.
– Otimizar a performance e escalabilidade das cargas e rotinas de processamento de dados.
– Implementar boas práticas de governança, catalogação e documentação das estruturas de dados.
– Monitorar continuamente a qualidade, consistência, disponibilidade e integridade dos dados utilizados pela organização.
Localidade: SANTA LUZIA