Aprenda 5 funções essenciais do Pandas para de forma simples e com exemplos de uso. Se você está começando a trabalhar com análise de dados em Python, provavelmente já ouviu falar da biblioteca Pandas.
Essa biblioteca é como uma caixa de ferramentas para quem precisa organizar, limpar e entender grandes quantidades de dados.
Mas, para aproveitar todo o potencial dela, existem algumas funções que você simplesmente precisa conhecer.
Neste post, vamos conhecer cinco delas: describe(), apply(), groupby(), fillna() e merge(). Essas funções são fáceis de aprender e vão transformar a maneira como você lida com dados. Vamos lá?
Para fazer o download do(s) arquivo(s) utilizados na aula, preencha com o seu e-mail:
Não vamos te encaminhar nenhum tipo de SPAM! A Hashtag Treinamentos é uma empresa preocupada com a proteção de seus dados e realiza o tratamento de acordo com a Lei Geral de Proteção de Dados (Lei n. 13.709/18). Qualquer dúvida, nos contate.
O que você vai ver hoje? – 5 Funções Essenciais do Pandas
Preparando o ambiente
Para usar o Pandas, você precisa instalá-lo (basta um pip install pandas no terminal) e importar a biblioteca no seu código com o famoso import pandas as pd.
import pandas as pd
Aqui, vamos criar uma tabela simples com nomes, idades e salários de funcionários para nossos exemplos:
dados = { 'Nome': ['Ana', 'Bruno', 'Carlos', 'Daniela', 'Eduardo'], 'Idade': [25, 30, 35, 40, 45], 'Salário': [3000, None, 7000, None, 11000] } tabela = pd.DataFrame(dados)
Repare que alguns salários estão como None (vazios). Isso é comum em bases de dados reais e vamos lidar com isso mais tarde!
1. describe() – Um Raio-X dos Seus Dados
Quer saber tudo sobre seus dados num piscar de olhos? A função describe() é o seu atalho. Ela te dá um resumo estatístico das colunas numéricas, como média, mínimo, máximo e até os quartis.
print(tabela.describe())
Com isso, você descobre que a média de idade é 35 anos e que 75% dos funcionários ganham até R$ 9.000. É perfeito para ter uma visão geral rapidinha, especialmente quando você está começando a explorar uma base de dados.
2. apply() – Personalize Seus Cálculos
E se você precisar ajustar os salários com um aumento de 10%? A função apply() deixa você aplicar uma operação em cada item de uma coluna de forma simples e eficiente. Olha só:
tabela["Salario Ajustado"] = tabela["Salário"].apply(lambda x: x * 1.1) print(tabela)
Aqui, criamos uma nova coluna com os salários ajustados. O lambda x: x * 1.1 multiplica cada valor por 1.1 (10% a mais). É como mágica: você pode usar funções simples ou até criar cálculos mais complexos para personalizar seus dados.
3. groupby() – Organize e Resuma por Grupos
Imagine que você quer saber a média de idade e salário por área da empresa (como Administrativo, Financeiro ou Vendas). O groupby() agrupa os dados e faz cálculos para você. Vamos adicionar uma tabela com áreas:
tabela_areas = pd.DataFrame({ "Nome Funcionario": ['Ana', 'Bruno', 'Carlos', 'Eduardo'], 'Área': ["Administrativo", "Financeiro", "Vendas", "Financeiro"] })
Depois de juntar as tabelas (falaremos disso no merge()), você pode usar:
medias_area = tabela.groupby("Área").mean(numeric_only=True) print(medias_area)
Isso te mostra, por exemplo, que o Financeiro tem uma média salarial de R$ 8.000. Simples, rápido e poderoso para análises por categoria!
4. fillna() – Adeus, Valores Vazios
Dados incompletos são um pesadelo, né? Na nossa tabela, Daniela e Bruno não têm salário preenchido. O fillna() resolve isso substituindo os valores vazios. Vamos usar a média dos salários:
media_salarial = tabela["Salário"].mean() tabela["Salário"] = tabela["Salário"].fillna(media_salarial) print(tabela)
Aqui, calculamos a média (R$ 7.000) e preenchemos os campos vazios com esse valor. Você pode usar a média, zero ou qualquer número que faça sentido para o seu caso. Problema resolvido!
5. merge() – Junte Tabelas como um Mestre
E se os dados estiverem espalhados em várias tabelas? O merge() é a solução para combinar tudo. Vamos juntar nossa tabela principal com a tabela de áreas:
tabela = tabela.merge(tabela_areas, how="left", left_on="Nome", right_on="Nome Funcionario") tabela = tabela.drop(columns="Nome Funcionario") print(tabela)
Com how=”left”, mantemos todos os funcionários da tabela original e adicionamos as áreas quando disponíveis. Daniela, por exemplo, fica sem área porque não está na segunda tabela. O drop() no final remove a coluna extra que não precisamos. É como montar um quebra-cabeça de dados!
Conclusão – Por que essas funções são essenciais?
Essas cinco funções cobrem o básico de qualquer análise de dados: explorar (describe), transformar (apply), agrupar (groupby), limpar (fillna) e combinar (merge). Elas são fáceis de usar e te dão um controle incrível sobre seus dados.
Quer praticar mais? Experimente criar um projeto com essas funções – quem sabe calcular médias salariais ou simular ajustes em uma base de dados da sua empresa fictícia. Com o Pandas, o céu é o limite!
E se quiser mais conteúdos como esse, não deixe de conferir nossos outros conteúdos sobre Python.
Hashtag Treinamentos
Para acessar outras publicações de Python, clique aqui!
Posts mais recentes de Python
- Biblioteca NumPy: o que é, vantagens e como usarAprenda como usar a biblioteca NumPy no Python para otimizar o processamento de dados e melhorar sua eficiência em projetos de ciência de dados.
- Set em Python: o que é, quando e como usar no seu projetoAprenda tudo sobre sets em Python: o que são, como usar e quando aplicar. Descubra operações com conjuntos e vantagens sobre listas!
- ETL com Python: guia completo para criar pipelines de dadosAprenda como construir pipelines ETL com Python do zero! Descubra as melhores bibliotecas, resolva desafios comuns e torne-se um especialista!
Posts mais recentes da Hashtag Treinamentos
- Exercícios de Listening em Inglês – Como Melhorar sua CompreensãoFaça estes exercícios de listening em inglês e melhore sua compreensão! Descubra técnicas e estratégias para praticar e evoluir no aprendizado do idioma!
- TCP e UDP: o que são, diferenças e quando usarEntenda o que é TCP e UDP, as diferenças entre os protocolos, suas vantagens e quando usar cada um. Aprenda com exemplos práticos e linguagem acessível.
- Power Apps: o que é, benefícios e como usarDescubra o que é Power Apps, como a ferramenta revoluciona a criação de aplicativos e como você pode começar a usá-la hoje mesmo!
Redator de conteúdo na Hashtag Treinamentos. Produzo textos didáticos sobre tecnologia, buscando informar e engajar o público de forma acessível e descomplicada.