⚽ Brasileirão Analytics: Da Engenharia à Ciência de Dados
A Regra de Ouro
"Os dados não mentem, mas sozinhos eles não contam a história completa." — Ariel Shlomoh
Este projeto representa uma jornada completa de Data Analytics, saindo de um legado de planilhas para um pipeline moderno de engenharia de dados em Python, culminando em visualizações de alta performance e análises estatísticas avançadas.
🚀 O Diferencial deste Projeto
Diferente de dashboards convencionais, aqui tratamos o futebol como um ecossistema de dados complexos. Refatoramos toda a infraestrutura para garantir escalabilidade e precisão.
🛡️ Engenharia de Dados (Python)
Utilizamos Python e Pandas para criar um pipeline de limpeza robusto, processando mais de 7.600 partidas. - Normalização Automática: Tratamento de nomes de clubes e técnicos. - Feature Engineering: Cálculo dinâmico de pontos e fator de mando de campo direto no script.
📊 Dashboard Interativo (Power BI)
Uma experiência visual intuitiva para gestores esportivos e analistas de desempenho.

🧪 Ciência de Dados & Teste de Hipóteses (EDA)
Não apenas mostramos o que aconteceu, mas por que aconteceu. Usamos análise exploratória avançada (EDA) para validar mitos do futebol:
Muitos analistas sugerem que a vantagem de jogar em casa está diminuindo devido a gramados melhores, logística profissional e o VAR.

- Insight Técnico: O gráfico de regressão linear acima (gerado via
sns.regplot) mostra a tendência real da taxa de vitória dos mandantes ao longo das décadas. - Conclusão: O "fator casa" ainda existe, mas os dados mostram uma inclinação negativa sutil, sugerindo que o campeonato está se tornando mais equilibrado e menos dependente do estádio.
Analisamos como o volume total de gols de uma partida se distribui conforme o resultado final (Mandante vence, Visitante vence ou Empate).

- Observação: Partidas que terminam em Empate possuem uma concentração de gols significativamente menor (baixo desvio padrão), enquanto vitórias de visitantes costumam ocorrer em jogos de placares mais abertos e caóticos (maior dispersão no Boxplot).
Será que marcar muitos gols garante um aproveitamento de pontos proporcional, ou o equilíbrio defensivo é mais importante?

- Análise Correlacional: Existe uma correlação forte (R²) entre a média de gols marcados e a média de pontos ganhos. Times que mantêm média > 1.5 gols em casa (eixo X) raramente ficam fora das zonas de elite em aproveitamento (eixo Y).
🛠️ Stack Tecnológica
| Camada | Tecnologia |
|---|---|
| Linguagem Base | |
| Manipulação | |
| Visualização BI | |
| Estilo do Site |
📈 Modelagem de Dados (Star Schema)
Para garantir que o Dashboard responda em milissegundos, implementamos uma arquitetura de dados otimizada:

Este repositório é um laboratório vivo de técnicas de BI e Data Science aplicadas ao esporte.