Nessa aula eu vou te mostrar como você pode ler arquivo em Excel com várias abas para obter exatamente as informações que deseja!
Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!
Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:
Nessa aula eu vou te mostrar como você pode ler arquivo em Excel no Python, mas não é um arquivo qualquer.
É aquele arquivo que tem várias abas, que tem tabelas que não estão logo no início da planilha, que tem mais de uma tabela na mesma aba.
Vou abordar todas essas opções para que você saiba como ler qualquer uma dessas tabelas independentemente de como elas estão dispostas no seu arquivo em Excel.
O que vamos aprender nessa aula para ler arquivo em Excel com várias abas:
Para poder ler arquivo Excel no Python nós vamos utilizar a famosa Biblioteca Pandas no Python. Se você ainda não conhece ou sabe muito pouco dessa biblioteca, nós temos um post mais completo sobre ela, basta clicar aqui para acessá-lo!
Com o Pandas Python vamos conseguir fazer a leitura e importação dessas informações para dentro do Python e fazer todos os tratamentos necessários para sua análise de dados.
Mas nessa aula nosso objetivo é te mostrar como você vai ler arquivo Excel no Python em diferentes situações.
Antes de começar a ler planilha específica no Python você precisa ter a biblioteca do Pandas instalada e importá-la para poder usar!
Isso é bem simples, para instalar basta ir até o prompt Anaconda (se estiver utilizando o Jupyter) ou ir ao terminal e digitar pip install pandas.
Para importar vamos utilizar o comando import pandas as pd. Esse pd é para substituir os comandos, então ao invés de sempre ter que escrever pandas só vamos precisar escrever pd para utilizar os comandos dessa biblioteca.
LEITURA PADRÃO
Aqui temos o código para fazer a leitura padrão de um arquivo em Excel no Pandas Python!
É possível notar que nesse caso temos apenas uma tabela, que é a tabela da primeira aba, então mesmo importando o arquivo que tem várias abas temos apenas uma única tabela.
LEITURA DE ABA ESPECÍFICA (PELO NOME)
Aqui nós estamos utilizando o sheet_name para indicar qual é o nome da aba que vamos extrair as informações.
Então você já pode começar a ser mais específico para obter exatamente as informações que deseja dentro de um arquivo.
Viu como ler planilha específica no Python é bem simples? Basta informar qual é o nome da planilha (aba) que deseja extrair as informações para começar seu tratamento de dados.
LEITURA DE ABA ESPECÍFICA (PELO ÍNDICE)
Muita das vezes os nomes das abas podem ser diferentes ou até serem modificados, então é útil que você possa também obter as informações que precisa através do índice da aba.
Nesse caso estamos pegando a aba com índice 1, que significa que estamos pegando a segunda aba, pois dentro do Python essas contagens de índices começam em 0.
Então 0 seria a primeira aba e 1 seria a segunda aba. Dessa forma mesmo que o nome da aba mude nós vamos continuar pegando as informações da segunda aba!
Assim estamos selecionando abas do Excel no Python de acordo com o índice que pode ser mais fácil do que inserir o nome caso ele seja alterado com frequência.
SELECIONANDO AS COLUNAS PELO ÍNDICE
Como você deve ter notado, na aba Planilha3 do nosso arquivo em Excel nós temos 2 tabelas, e nesse caso estamos selecionando as informações da segunda, que estão nas colunas 5 e 6 (novamente o índice começa do 0).
Então aqui estamos selecionando colunas do Excel no Python pelo seu número, que seriam as colunas F e G.
SELECIONANDO AS COLUNAS PELO NOME
Da mesma forma que fizemos a seleção das abas pelo índice e pelo nome, nós podemos fazer o mesmo em relação as colunas do Excel.
Então podemos tanto selecioná-las pelo índice quanto pelo próprio nome da coluna que nem fazemos dentro do Excel.
OBS: Nesse caso você vai notar que temos várias informações escrito NaN isso quer dizer que não temos valores nessas células. E se você observar de fato nas colunas C e D não temos nenhuma informação.
BUSCANDO TODAS AS INFORMAÇÕES DE UM ARQUIVO
Aqui nós temos uma maneira para obter todas as informações que um arquivo possui, então com o mesmo código que já utilizamos, você pode notar que o Python vai mostrar todas as tabelas que temos com um “nome”.
Em seguida basta utilizar esse nome para identificar qual dessas tabelas vamos trazer para dentro do Python para fazer o tratamento/análise de dados.
Essa parte é bem interessante, pois você vai conseguir visualizar todas as informações que têm no arquivo como um todo e não somente de uma única aba.
Dessa forma você vai poder ver essas informações e escolher exatamente a informação que precisa extrair para sua análise!
BUSCAR INFORMAÇÕES FORA DA CÉLULA A1
É bem comum todas as tabelas começarem pela célula A1 do Excel, mas é possível que alguns casos você encontre tabelas que estão deslocadas e para isso esse simples código vai te auxiliar.
Aqui temos duas seleções que já utilizamos anteriormente, a seleção da aba pelo índice e a seleção de colunas.
O que é novo é o skiprows que se você traduzir seria como “pular linha”, ou seja, o Python vai ignorar essas linhas na hora de ler essa informação.
Dessa forma vai desconsiderar 7 linhas que é exatamente a quantidade de linhas vazias que temos acima da tabela e vai considerar a partir da oitava linha.
Como já temos a especificação das colunas vamos obter a tabela exatamente como precisamos para fazer o tratamento de dados.
BUSCANDO APENAS INFORMAÇÕES DESEJADAS
Esse exemplo é bem parecido com o exemplo anterior, só que aqui vamos estar limitando a quantidade de informações que vamos extrair.
Nessa aba por exemplo temos duas tabelas uma embaixo da outra, e queremos pegar a penas a primeira, só que precisamos limitar a quantidade linhas, caso contrário o Python vai trazer as duas tabelas juntas.
Isso quer dizer que ele vai trazer as duas tabelas juntas como se fossem uma única tabela, e dessa forma ficaria mais difícil sua análise de dados.
Nessa aula eu te mostrei como obter informações de um arquivo Excel com várias abas no Python de algumas maneiras diferentes para abordar as situações que podem acontecer.
Então agora você vai poder ler planilha específica no Python e extrair somente as informações que precisa sem ter que ajustar o arquivo em Excel ou fazer qualquer outro procedimento extra.
E aí, que tal você fazer alguns testes de cada um desses exemplos pra ver se fixou o conteúdo? Aposto que esses exemplos vão te ajudar muito!
Já deixa esse arquivo aí guardado em uma pasta que vai te ajudar bastante nas suas análises de dados!
Para acessar outras publicações de Python, clique aqui!
Quer aprender mais sobre Python com um minicurso gratuito?
Expert em conteúdos da Hashtag Treinamentos. Auxilia na criação de conteúdos de variados temas voltados para aqueles que acompanham nossos canais.