🎉 SEMANA DO CONSUMIDOR

Últimos dias para comprar os cursos com 50% de desconto

Ver detalhes

Postado em em 3 de abril de 2025

Aprenda 5 funções essenciais do Pandas para de forma simples e com exemplos de uso. Se você está começando a trabalhar com análise de dados em Python, provavelmente já ouviu falar da biblioteca Pandas.

Essa biblioteca é como uma caixa de ferramentas para quem precisa organizar, limpar e entender grandes quantidades de dados.

Mas, para aproveitar todo o potencial dela, existem algumas funções que você simplesmente precisa conhecer.

Neste post, vamos conhecer cinco delas: describe(), apply(), groupby(), fillna() e merge(). Essas funções são fáceis de aprender e vão transformar a maneira como você lida com dados. Vamos lá?

Este conteúdo também está disponível em vídeo! Assista aqui embaixo ou acesse o nosso canal do YouTube!

Para fazer o download do(s) arquivo(s) utilizados na aula, preencha com o seu e-mail:

Não vamos te encaminhar nenhum tipo de SPAM! A Hashtag Treinamentos é uma empresa preocupada com a proteção de seus dados e realiza o tratamento de acordo com a Lei Geral de Proteção de Dados (Lei n. 13.709/18). Qualquer dúvida, nos contate.

Preparando o ambiente

Para usar o Pandas, você precisa instalá-lo (basta um pip install pandas no terminal) e importar a biblioteca no seu código com o famoso import pandas as pd.

import pandas as pd

Aqui, vamos criar uma tabela simples com nomes, idades e salários de funcionários para nossos exemplos:

dados = {
    'Nome': ['Ana', 'Bruno', 'Carlos', 'Daniela', 'Eduardo'],
    'Idade': [25, 30, 35, 40, 45],
    'Salário': [3000, None, 7000, None, 11000]
}
tabela = pd.DataFrame(dados)

Repare que alguns salários estão como None (vazios). Isso é comum em bases de dados reais e vamos lidar com isso mais tarde!

1. describe() – Um Raio-X dos Seus Dados

Quer saber tudo sobre seus dados num piscar de olhos? A função describe() é o seu atalho. Ela te dá um resumo estatístico das colunas numéricas, como média, mínimo, máximo e até os quartis.

print(tabela.describe())

Com isso, você descobre que a média de idade é 35 anos e que 75% dos funcionários ganham até R$ 9.000. É perfeito para ter uma visão geral rapidinha, especialmente quando você está começando a explorar uma base de dados.

2. apply() – Personalize Seus Cálculos

E se você precisar ajustar os salários com um aumento de 10%? A função apply() deixa você aplicar uma operação em cada item de uma coluna de forma simples e eficiente. Olha só:

tabela["Salario Ajustado"] = tabela["Salário"].apply(lambda x: x * 1.1)
print(tabela)

Aqui, criamos uma nova coluna com os salários ajustados. O lambda x: x * 1.1 multiplica cada valor por 1.1 (10% a mais). É como mágica: você pode usar funções simples ou até criar cálculos mais complexos para personalizar seus dados.

3. groupby() – Organize e Resuma por Grupos

Imagine que você quer saber a média de idade e salário por área da empresa (como Administrativo, Financeiro ou Vendas). O groupby() agrupa os dados e faz cálculos para você. Vamos adicionar uma tabela com áreas:

tabela_areas = pd.DataFrame({
    "Nome Funcionario": ['Ana', 'Bruno', 'Carlos', 'Eduardo'],
    'Área': ["Administrativo", "Financeiro", "Vendas", "Financeiro"]
})

Depois de juntar as tabelas (falaremos disso no merge()), você pode usar:

medias_area = tabela.groupby("Área").mean(numeric_only=True)
print(medias_area)

Isso te mostra, por exemplo, que o Financeiro tem uma média salarial de R$ 8.000. Simples, rápido e poderoso para análises por categoria!

4. fillna() – Adeus, Valores Vazios

Dados incompletos são um pesadelo, né? Na nossa tabela, Daniela e Bruno não têm salário preenchido. O fillna() resolve isso substituindo os valores vazios. Vamos usar a média dos salários:

media_salarial = tabela["Salário"].mean()
tabela["Salário"] = tabela["Salário"].fillna(media_salarial)
print(tabela)

Aqui, calculamos a média (R$ 7.000) e preenchemos os campos vazios com esse valor. Você pode usar a média, zero ou qualquer número que faça sentido para o seu caso. Problema resolvido!

5. merge() – Junte Tabelas como um Mestre

E se os dados estiverem espalhados em várias tabelas? O merge() é a solução para combinar tudo. Vamos juntar nossa tabela principal com a tabela de áreas:

tabela = tabela.merge(tabela_areas, how="left", left_on="Nome", right_on="Nome Funcionario")
tabela = tabela.drop(columns="Nome Funcionario")
print(tabela)

Com how=”left”, mantemos todos os funcionários da tabela original e adicionamos as áreas quando disponíveis. Daniela, por exemplo, fica sem área porque não está na segunda tabela. O drop() no final remove a coluna extra que não precisamos. É como montar um quebra-cabeça de dados!

Conclusão – Por que essas funções são essenciais?

Essas cinco funções cobrem o básico de qualquer análise de dados: explorar (describe), transformar (apply), agrupar (groupby), limpar (fillna) e combinar (merge). Elas são fáceis de usar e te dão um controle incrível sobre seus dados.

Quer praticar mais? Experimente criar um projeto com essas funções – quem sabe calcular médias salariais ou simular ajustes em uma base de dados da sua empresa fictícia. Com o Pandas, o céu é o limite!

E se quiser mais conteúdos como esse, não deixe de conferir nossos outros conteúdos sobre Python.

Hashtag Treinamentos

Para acessar outras publicações de Python, clique aqui!


Quer aprender mais sobre Python com um minicurso básico gratuito?

Posts mais recentes de Python

Posts mais recentes da Hashtag Treinamentos

w background3jpg 1

Redator de conteúdo na Hashtag Treinamentos. Produzo textos didáticos sobre tecnologia, buscando informar e engajar o público de forma acessível e descomplicada.