Blog

Postado em em 4 de junho de 2024

Pandas Python – O que é, para que Serve e Como Instalar

Aprenda o que é o Pandas Python, como instalar e como utilizar essa biblioteca muito útil do Python para análise de dados!

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:

Pandas Python – O que é, para que Serve e Como Instalar

Na aula de hoje, eu vou te mostrar o que é o Pandas Python, como instalar essa biblioteca do Python e como utilizá-la para análise de dados.

Você aprenderá algumas formas diferentes de instalar o Pandas no seu computador, como importar e toda a lógica de funcionamento do Pandas.

Esta é uma aula direto ao ponto para te apresentar o Pandas e o que ele pode fazer para te auxiliar na área de dados.

Então, faça o download do material disponível e venha comigo que eu vou te mostrar como instalar o Pandas e utilizá-lo em suas análises de dados.

O que é o Pandas? Para que ele serve?

O Pandas é uma ferramenta essencial para trabalhar com dados em Python, sendo fundamental nas áreas de ciência de dados e análise de dados.

Profissionais que lidam com grandes volumes de informações utilizam o Pandas no Python por conta da sua eficiência e facilidade de manipulação de dados.

A biblioteca do Pandas é uma poderosa ferramenta que permite a manipulação eficiente de bases de dados, incluindo tratamento, limpeza e análise estatística dos mesmos.

Além disso, o Pandas possibilita consultas em bancos de dados, visualizações gráficas e integração com outras ferramentas amplamente utilizadas na área de dados.

Entre essas ferramentas temos o scikit-learn para trabalhar com IA e machine learning; o Matplotlib, Seaborn e Plotly para a criação e visualização de gráficos; o NumPy para trabalhar com estatísticas e manipulação de matrizes e vetores. E assim por diante.

Como Instalar e Usar o Pandas Python?

Vou te mostrar 3 formas diferentes para instalar e utilizar o Pandas no seu computador.

onsiderando que você já tenha o Python instalado no seu computador, a primeira forma de instalar o Pandas será pelo Prompt de Comando. Basta você abrir o prompt no seu computador e fazer a instalação através do comando pip install pandas.

pip install pandas

Uma recomendação que eu te dou é de, junto ao Pandas, instalar também a biblioteca do OpenPyXL para integração com planilhas e arquivos em Excel. Basta executar o comando da seguinte forma: pip install pandas openpyxl

pip install pandas openpyxl

A segunda forma de instalar o Pandas é através da instalação do pacote Anaconda. Esse pacote faz a instalação do Python com uma série de bibliotecas voltadas para a área de dados, machine learning e inteligência artificial, entre elas a biblioteca do Pandas.

Para fazer a instalação do Anaconda, basta acessar o site oficial e seguir o processo de instalação padrão. Caso queira um passo a passo detalhado, pode ver a nossa aula completa sobre o Anaconda clicando aqui.

Feita a instalação, você pode acessar o Anaconda através do Anaconda Navigator no seu computador.

Anaconda Navigator

Perceba que, além da instalação do Python e das bibliotecas, o Anaconda também instala alguns editores de código para que você possa utilizar, como o Jupyter Lab, Jupyter Notebook e PyCharm.

A terceira maneira para você usar o Pandas no seu computador é através do Google Colab. Essa é uma alternativa para quem quer utilizar o Pandas sem precisar instalar nada localmente no computador.

O Google Colab é uma opção online que te permite programar sem instalar softwares. Ele é bem semelhante ao ambiente do Jupyter Notebook em que vamos programando por meio de células de código.

E, assim como no Anaconda, dentro do Google Colab você já terá o Pandas disponível para utilizar.

Funcionamento do Pandas – Trabalhando com Bases de Dados

Feita a instalação do Pandas, vamos falar um pouco agora sobre o seu funcionamento e uso. O Pandas, como eu já falei, é uma ferramenta essencial para o trabalho e manipulação de bases de dados em Python.

No material disponível para download, você encontrará uma base de dados e um arquivo inicial, que você pode acessar por qual editor de códigos preferir, para visualizar o funcionamento do Pandas.

O primeiro passo, sempre que você for utilizar o Pandas, é importá-lo para dentro do seu código através do comando import pandas ou import pandas as pd.

Essa segunda forma é recomendada porque você está dando um apelido (alias) para o Pandas, o que facilitará a escrita de futuros comandos utilizando-o, reduzindo a quantidade de texto no seu código. Além disso, essa forma é amplamente utilizada pelos programadores que trabalham com Pandas.

import pandas as pd

Feito isso, você importará ou criará uma base de dados para começar a trabalhar. No material disponível, você encontrará uma base de dados em CSV, uma extensão de arquivo muito comum quando lidamos com dados.

Para facilitar a importação da base de dados, você pode colocar o arquivo que você estiver utilizando no mesmo local do seu código Python. Caso contrário, precisará fornecer o caminho completo do arquivo para acessá-lo.

Arquivos no mesmo destino

Para importar essa base de dados para dentro do código, você só precisa criar uma variável que receberá a função read_csv do Pandas, passando o caminho do arquivo com os dados.

import pandas as pd

tabela_clientes = pd.read_csv("clientes.csv")

Você pode reparar que, ao digitar pd.read_, o editor de códigos já exibirá outros tipos de extensão de arquivos que essa função do Pandas é capaz de carregar.

Para visualizar os dados, basta utilizarmos a função display ou print, dependendo do seu editor de código.

import pandas as pd

tabela_clientes = pd.read_csv("clientes.csv")
display(tabela_clientes)

Display do DataFrame

Lógica de Funcionamento do Pandas

O Pandas trabalha com DataFrames, que são essencialmente tabelas, como essa que acabamos de gerar.

O DataFrame é composto por várias linhas e colunas, sendo que cada linha é associada a um índice, geralmente numérico. Essa estrutura facilita a organização e manipulação dos dados com Pandas.

Series no Pandas

Além dos DataFrames, o Pandas nos permite visualizar Series, que representam as colunas do DataFrame individualmente.

display(tabela_clientes["idade"])

Series no Pandas

Ao exibir uma coluna específica, podemos visualizar informações detalhadas sobre essa serie. Cada serie é composta por valores específicos, tamanhos e tipos de dados. E são muito importantes para a compreensão das informações presentes na base de dados.

Transformar Dicionários em DataFrames

Além de trabalhar com uma base de dados existente, o Pandas te permite criar um DataFrame a partir de um dicionário Python como fonte.

dicionario_produtos = {"nome": ["iphone", "ipad", "airpod"], "preco": [5000, 9000, 2000], "estoque": [100, 50, 60]}

tabela_produtos = pd.DataFrame(dicionario_produtos)
display(tabela_produtos)

Transformar Dicionários em DataFrames

Quando passamos um dicionário para o Pandas, ele entende a estrutura desse dicionário e gera um DataFrame a partir dele. E com isso você pode trabalhar com esses dados usando os métodos do Pandas, que te permitem análises mais eficientes.

Conclusão – Pandas Python – O que é, para que Serve e Como Instalar

Nessa aula eu te mostrei o que é o Pandas no Python, como instalá-lo e utilizá-lo para análise de dados.

Você aprendeu 3 formas diferentes de usar essa importante biblioteca do Python e como ela pode ser aplicada para trabalhar com análise de dados.

Hashtag Treinamentos

Para acessar outras publicações de Python, clique aqui!


Quer aprender mais sobre Python com um minicurso básico gratuito?