Blog

Postado em em 13 de setembro de 2023

Esquema Estrela no Power BI – O que é e qual a Importância

Aprenda o que é o esquema estrela no Power BI e qual a importância dessa estrutura fundamental para aperfeiçoar suas análises de dados.

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:

Esquema Estrela no Power BI – O que é e qual a Importância

Na aula de hoje eu quero te apresentar o esquema estrela no Power BI. Essa é uma estrutura de relacionamento de dados entre tabelas que vai te auxiliar a ter uma organização melhor dos seus dados e fazer análises mais precisas dentro do Power BI.

Muitas vezes nos deparamos com tabelas repletas de informações, o que não é ideal, pois pode atrapalhar nossa análise e poluir com dados desnecessários. O esquema estrela nos permite ter menos informações e tornar a base de dados menor e mais eficiente.

Em resumo, o esquema estrela relaciona tabelas fato com tabelas dimensão, mas vamos entrar em mais detalhes sobre isso.

Para acompanhar esta aula e entender melhor o que é o esquema estrela no Power BI, sua importância e como aplicá-lo, não deixe de fazer o download do material disponível nesta postagem.

Tabela Fato e Tabela Dimensão

Para compreendermos melhor o esquema estrela no Power BI, antes precisamos abordar o que são as tabelas fato e as tabelas dimensão.

Dentro de uma base de dados, encontraremos várias tabelas que podem ser classificadas em dois tipos: tabela fato e tabela dimensão.

A tabela fato é responsável por armazenar os acontecimentos e o histórico da empresa. Por exemplo, uma tabela fato de vendas registrará a data da venda, a quantidade vendida, o código da loja, do cliente, do produto, entre outros dados.

Normalmente, a tabela fato possui milhares de linhas e informações. Muitas das suas colunas serão de IDs, códigos que usamos para relacioná-las com as tabela dimensão.

Tabela fato

Por sua vez, a tabela dimensão contém as informações e os atributos de um determinado elemento. Ela complementa a tabela fato, trazendo características relacionadas aos acontecimentos registrados.

As tabelas dimensão são menores do que as tabelas fato, e em nenhuma delas os elementos principais se repetem. Cada elemento é único e utilizamos essas informações para relacionar e complementar os dados contidos na tabela fato.

Tabela dimensão

Por exemplo, a partir dessas duas tabelas, podemos relacionar a tabela dimensão dProduto com a tabela fato fVendas, através da coluna Código Produto. Isso nos permite determinar qual foi o produto da venda registrada e suas características.

Dentro do Power BI, na aba de Exibição de modelo, geralmente organizamos esses relacionamentos da seguinte forma: as tabelas fato ficam na parte de baixo, enquanto as tabelas dimensão ficam na parte de cima. Essa é apenas uma convenção de organização.

Organização das tabelas

Observe que não relacionamos as tabelas fato entre si, pois elas possuem diversas informações que se repetem. Portanto, sempre iremos relacionar tabelas dimensão com tabelas fato.

Por que esquema estrela?

Esse nome é dado porque, quando temos apenas uma tabela fato se relacionando com diversas tabelas dimensão, a organização dessas tabelas na Exibição de modelo lembra uma estrela.

Exibição de modelo Esquema Estrela

O que é e qual a importância do esquema estrela?

Muitas vezes quando estiver trabalhando, é possível que você não receba as tabelas separadas em tabela dimensão e tabela fato. E, em algumas situações, pode acontecer de você se deparar com um cenário ainda menos ideal, onde só existe uma única tabela com todas as informações, um “tabelão”.

Tabelão

Nessa tabela, encontramos tanto os eventos registrados quanto as características dos elementos. Esse modelo é considerado ruim devido à repetição desnecessária de informações, o que compromete a eficiência do nosso Power BI, tornando-o mais pesado e lento.

Já no esquema de estrela não teremos informações desnecessárias sendo exibidas. Retomando o nosso exemplo anterior, só precisamos ter o código do produto na tabela fVendas, para através da relação com a tabela de produtos dProduto obter todas as características do produto.

Relação entre a tabela fVendas e a dProduto

Outro problema que enfrentamos ao lidar com uma única tabela que contém todas as informações é a incapacidade de relacioná-la com outras tabelas. Pois não há nela uma informação única na tabela que possa ser utilizada como chave para estabelecer essa relação.

No exemplo do nosso “tabelão”, além da tabela de Vendas, temos também a tabela de Devoluções. No entanto, como ambas são tabelas fato, não conseguimos estabelecer uma relação direta entre elas.

Vendas e Devoluções no modelo do "tabelão"

Para estabelecermos um relacionamento entre tabelas, é necessária uma coluna que contenha valores únicos, que não se repetem, como o Código do Produto da tabela dProduto que vimos no exemplo das tabelas fVendas e dProduto. Esse código será a chave para criar essa relação.

Além disso, as tabelas dimensão funcionam como uma ponte para relacionar informações entre tabelas fato.

No exemplo do esquema estrela, temos as tabelas fVendas e fDevoluções relacionadas com as tabelas dCliente, dLojas e dProduto. Através dessas relações, podemos construir conexões para analisar informações entre a tabela de fVendas e a tabela de fDevoluções.

Por exemplo, vamos supor que desejamos obter o número de vendas e devoluções dos produtos em nossa empresa. Utilizando o esquema estrela, podemos usar as tabelas fVendas, fDevoluções e dProduto para construir essa análise.

Para visualizar essas informações, você pode criar uma matriz na guia de relatórios e importar os seguintes campos: a Marca da tabela dProduto, a Qtd Vendida da tabela fVendas e a Qtd Devolvida da tabela fDevoluções.

Matriz com a Marca da tabela dProduto, a Qtd Vendida da tabela fVendas e a Qtd Devolvida da tabela fDevoluções.

Isso só é possível porque tanto a tabela fVendas quanto a fDevoluções estão relacionadas com a tabela dProduto.

Tabela fVendas e fDevoluções relacionadas com a tabela dProduto.

No caso do nosso “tabelão”, essa ponte não existe e, portanto, não é possível estabelecer essa relação.

Como podemos resolver e ajustar o “tabelão” com todas as informações?

Para resolver e ajustar o “tabelão” com todas as informações, o ideal é passá-lo pelo processo de modelagem de dados. Isso envolve quebrar a tabela em tabelas fato e tabelas dimensão.

A modelagem de dados é um procedimento crucial para lidar com casos como esse e obter as informações de forma correta e clara como gostaríamos.

É possível realizar a modelagem de dados dentro do próprio Power BI. Se você quiser aprender passo a passo como executar esse processo, recomendo que acompanhe essa aula super detalhada clicando aqui.

Esquema Floco de Neve no Power BI

No Power BI, além do esquema estrela, existe outra opção chamada de esquema floco de neve. Nesse esquema, a tabela fato está conectada a várias tabelas dimensões que, por sua vez, estão divididas em várias outras tabelas dimensões relacionadas entre si.

Esse esquema é muito comum em bancos de dados de grandes empresas. No entanto, no contexto do Power BI, esse tipo de esquema não é o ideal, pois resulta em informações fragmentadas e compromete a eficiência do processo.

Esquema Floco de Neve

Assim como podemos ajustar o “tabelão” dividindo-o em novas tabelas, também podemos agrupar as tabelas do esquema floco de neve em um número menor.

Conclusão – Esquema Estrela no Power BI

Nessa aula você aprendeu que o esquema estrela no Power BI é a abordagem ideal para criar relacionamentos entre tabelas e obter uma melhor organização de dados.

Ao aplicar o esquema estrela, você reduzirá a quantidade de informações desnecessárias, resultando em uma base de dados menor e mais eficiente para construir suas análises. Isso permitirá que você analise as informações de forma mais objetiva e precisa.

Além disso, discutimos as diferenças entre o “tabelão” e o esquema floco de neve em relação ao esquema estrela no Power BI, e o que pode ser feito para tratar os dados quando não estão no modelo ideal do esquema estrela.

Hashtag Treinamentos

Para acessar outras publicações de Power BI, clique aqui!


Quer aprender mais sobre Power BI com um minicurso básico gratuito?

Quer sair do zero no Python e virar uma referência na sua empresa? Inscreva-se agora mesmo no Python Impressionador