Engenharia e Análise de Dados

Construindo pipelines de dados robustos e soluções de automação para resolver problemas complexos de negócio.

Minha Stack de Tecnologias

Python
SQL
Pandas
Polars
AWS / GCP
Apache Airflow
Spark (PySpark)
Docker
Git & GitHub
Power BI
SQL Server
Oracle

Projetos em Destaque

Pipeline de ETL para Análise de Créditos Fiscais

Problema: Análise manual de créditos de PIS/COFINS era lenta e sujeita a erros, consumindo dezenas de horas da equipe.

Solução: Desenvolvi um processo de ETL em Python que ingere, transforma e valida dados de arquivos TXT, aplicando regras de negócio para identificar créditos elegíveis.

Impacto: Redução de 75% no tempo de análise e criação de uma arquitetura reutilizável.

Python Pandas ETL
Ver no GitHub →

Pipeline de Consolidação e Limpeza de Dados

Problema: Ingestão de dados dificultada por múltiplos arquivos (Excel/TXT) com cabeçalhos e tipos de dados inconsistentes.

Solução: Construí uma aplicação com interface gráfica (PySide6) e motor de processamento em Polars para orquestrar a leitura, limpeza e consolidação dos dados.

Impacto: Melhora de 100% na eficiência da disponibilização dos dados, eliminando gargalos no processo.

Python Polars PyQt6 Data Pipeline
Ver no GitHub →

Data Analyzer

Problema: Processar arquivos excel ou csv, e realizar confrontos ou cruzamentos com os dados de suas colunas.

Solução: Criei uma ferramenta, usando PySide6, que pode confrontar ou cruzar colunas de arquivos excel, usando coluna(s) chave(s) como parâmetro.

Impacto: Com a automação do processo de confronto e cruzamento, a margem de erro reduziu em pelo menos 75%, garantindo assim entregas de maior qualidade.

Python PyQt6 Pandas
Ver no GitHub → .