Blog

Postado em em 9 de julho de 2022

Juntar Informações de Tabelas no Python – Mesclando Informações de Tabelas

Hoje eu quero te mostrar como juntar informações de tabelas no Python para que você possa fazer suas análises de dados corretamente!

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:

Como Juntar Tabelas no Python

Essa é uma dúvida que muitas pessoas acabam tendo ao trabalhar com bases de dados dentro do Python.

Você já sabe como juntar bases de dados no Python? Se não sabe pode ficar tranquilo que nessa aula eu vou te mostrar algumas técnicas para juntar tabelas no Python!

Mesclar Bases de Dados no Python

É muito importante que você saiba como juntar bases de dados em algumas ocasiões para que consiga juntá-las de modo correto.

Se precisa colocar uma embaixo da outra, uma do lado da outra, pois isso vai influenciar na hora que for fazer suas análises.

Então para isso nós vamos utilizar a biblioteca pandas, é a biblioteca para trabalhar com bases de dados e é muito utilizada nessa área de análise de dados!

import pandas as pd

tabela_python = pd.read_excel("python.xlsx")
tabela_cienciadados = pd.read_excel("cienciadados.xlsx")

display(tabela_python)
display(tabela_cienciadados)

Aqui é a parte inicial onde vamos fazer a importação da biblioteca do pandas e vamos importar as 2 tabelas que queremos juntar.

# ignore_index
# keys (sem ignore_index)

tabela_cursos = pd.concat([tabela_python, tabela_cienciadados])
display(tabela_cursos)

Aqui nós temos o método concat que vai concatenar essas informações. Então vamos ter uma tabela embaixo da outra, fazendo uma análise do nome das suas colunas para garantir que as informações serão concatenadas de forma correta.

Além de concatenar as informações nós temos 2 argumentos que podem ser utilizados junto com esse método que são: ignore_index e keys.

O primeiro método ele ignora os índices das tabelas originais e começa do 0 e vai até a última informação normalmente.

Já no segundo método você pode especificar um nome para saber de onde vem essa informação para facilitar a sua análise de dados caso precise dessa informação.

tabela_produtos = pd.merge(tabela_python, tabela_cienciadados, on="Cliente")
display(tabela_produtos)
Método merge
Método merge

Aqui nós temos o método merge, ele é um pouco diferente do anterior, pois aqui vamos juntar as tabelas uma do lado da outra, mas com um detalhe.

Não vamos apenas colocar uma do lado da outra, aqui nós vamos ter que indicar quais informações são comuns nas duas tabelas.

Como assim? Nesse exemplo nós temos uma tabela de clientes de Python e outra tabela de clientes de Ciência de Dados.

Então quando colocamos o merge com o argumento on=“informação em comum” você vai notar que vamos juntar a informação da segunda tabela na primeira.

Só que isso só vai ser feito com as informações que são comuns nas duas tabelas, então só vamos ter aqui as informações dos clientes que são clientes tanto de Python quanto de Ciência de Dados.

Então dessa forma só vamos ter as informações que aparecem nas duas tabelas ao mesmo tempo (que seria o inner).

OBS: Pode utilizar o argumento how com inner, outer, left ou rigth para trazer essas informações também. Para mais detalhes você pode e deve ler sempre a documentação para que consiga utilizar os métodos da forma correta!

Conclusão – Juntar Informações de Tabelas no Python

Nessa aula eu te mostrei como você pode mesclar tabelas no Python para que possa fazer sua análise de dados de forma correta.

Você provavelmente já recebeu informações em diferentes tabelas e ficou com dúvida de como faria para juntar essas informações dentro do Python para deixar tudo mais fácil não é mesmo? Agora você já sabe como fazer!

Hashtag Treinamentos

Para acessar outras publicações de Python, clique aqui!


Quer aprender mais sobre Python com um minicurso básico gratuito?