Blog

Postado em em 14 de fevereiro de 2022

Análise em Tempo Real com Python – Analisando o Twitter

Hoje eu quero te mostrar como fazer a análise em tempo real com Python com o exemplo do Twitter para pegar comentários!

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:

Análise em Tempo Real com Python

Você sabia que é possível fazer análise em tempo real com Python? Isso é muito útil principalmente quando precisamos coletar muitas informações para análise de dados com Python.

Hoje vamos estar analisando o Twitter em tempo real com Python! Já imaginou você pegando todos os comentários mais recentes sobre o assunto que quer?

Análise do Twitter com Python

Antes de iniciar é importante que você saiba que o Twitter é uma ótima ferramenta para que você consiga visualizar o que estão comentando.

Então se está fazendo alguma promoção, venda, promovendo um produto… você vai conseguir visualizar o que as pessoas estão comentando e com isso vai saber o que está dando mais certo, qual o produto mais comentado…

Então a ideia é fazer essa análise com o que está sendo mais comentado pelas pessoas. Como você deve saber, está rolando o BBB e podemos utilizar o Python para verificar isso também!

Para que possamos fazer a comunicação com programas nós utilizamos APIs, e aqui não seria diferente, então vamos utilizar a API do Twitter (na parte de desenvolvimento vamos utilizar a biblioteca tweepy).

Como você já deve saber nós sempre vamos utilizar a documentação das bibliotecas para saber quais ferramentas e quais comandos vamos utilizar em cada caso.

Aqui não será diferente, então você pode acessar o link abaixo para verificar a documentação da biblioteca Tweepy.

https://docs.tweepy.org/en/stable/

IMPORTANTE: Para prosseguir com a aula você vai precisar ter uma conta no Twitter e vai precisar ter um telefone cadastrado!

Outro ponto importante é que temos que nos cadastrar na API de desenvolvimento do Twitter.

Você pode buscar direto no Google por Developer Twitter e já vai ser o primeiro link!

Plataforma de desenvolvimento do Twitter
Plataforma de desenvolvimento do Twitter

Basta clicar em Sign Up na parte superior direita da página, a primeira parte são informações básicas que precisa para fazer o seu cadastro.

Depois que confirmar o seu e-mail você já tem acesso e já pode criar seu aplicativo, que vai te dar as credenciais para fazer o acesso à API.

Criando o seu aplicativo
Criando o seu aplicativo

Aqui você vai colocar o nome do seu aplicativo para receber suas chaves e poder utilizar na API do Twitter.

Obtendo as chaves para acesso a API
Obtendo as chaves para acesso a API

Aqui é importante que você não compartilhe com ninguém essas chaves, elas são suas e se outra pessoa utilizar ela está cadastrada com suas informações, então tome muito cuidado!

Depois disso basta clicar em Skip to Dashboard e terá uma janela de confirmação para verificar se você salvou essas chaves.

Verificando a versão da API
Verificando a versão da API

No canto esquerdo você pode ir em produtos para verificar qual é a API que foi atribuída, isso é muito importante na hora de ler a documentação, então fique ligado!

Além da biblioteca Tweepy nós vamos utilizar a famosa biblioteca pandas (que é uma biblioteca para análise de dados).

DICA: Antes de utilizar qualquer biblioteca é importante que você acessa a documentação dela para verificar os recursos que ela tem e o que você pode fazer com ela, assim você já sabe por onde começar e quais informações pode procurar depois!

Como vimos que a versão do Tweepy é a versão v2 nós vamos utilizar essa biblioteca.

Documentação de API que vamos utilizar
Documentação de API que vamos utilizar

Na parte de chaves você vai poder pedir para gerar uma nova caso tenha esquecido alguma delas e pode gerar o Access Token and Secret.

Gerando o Access Token and Secret
Gerando o Access Token and Secret

Agora nós vamos para o Jupyter começar a nossa programação, lembrando que se não tiver a biblioteca instalada do Tweepy, basta escrever !pip install tweepy.

Feito isso vamos utilizar o código que acabamos de ver do tweepy.client para fazer a conexão!

Feito isso nós já podemos começar o nosso código, lembrando que tudo o que precisar você pode pegar na documentação.

Código para obter os 100 retweets mais recentes com um horário específico para o BBB
Código para obter os 100 retweets mais recentes com um horário específico para o BBB

Aqui nós vamos limitar o tempo inicial e final da nossa busca, e vamos guardar nosso resultado dos tweets recentes na variável resposta.

Aqui nós estamos utilizando a documentação para verificar onde vamos colocar cada informação, inclusive estamos aumentando a quantidade padrão de tweets recentes de 10 para 100.

Na parte logo abaixo no código grande nós vamos utilizar a estrutura de repetição for para passar por todos esses tweets recentes e verificar onde está a posição do RT dentro do texto para que possamos fazer nossas buscas.

Dentro dessa estrutura nós vamos fazer uma busca por todos os nomes dos integrantes do BBB (Big Brother Brasil) em alguns formatos diferentes para podermos pegar tudo.

Com isso nós estamos atribuindo o valor 1 caso a pessoa tenha sido citada e 0 se não aparecer a informação.

Contagem dos comentários para cada participante
Contagem dos comentários para cada participante

Em seguida nós vamos poder criar uma tabela para ver essa tabela e verificar quem foi citado em cada um desses tweets.

Como assim fica meio difícil de saber quantidade de comentários de cada participante nós vamos fazer um breve tratamento para somar essas quantidades e agrupar de forma decrescente.

Ajustando os comentários dos participantes
Ajustando os comentários dos participantes

Agora já temos uma visualização mais fácil para verificar quais dos participantes possui o maior número de comentários.

Nesse caso você pode fazer para os seus produtos que estão sendo comentados, então já pode começar a pensar em outras análises, como por exemplo o percentual em relação ao total de comentários.

Análise em Tempo Real com Python
Calculando o percentual dos comentários

Podemos verificar também o percentual acumulado desses comentários.

Análise em Tempo Real com Python
Calculando o percentual acumulado

Em seguida podemos formatar esses percentuais para facilitar a visualização.

Análise em Tempo Real com Python
Formatando como percentual

Por fim podemos mostrar apenas os comentários com os percentuais para facilitar sua análise de dados e verificar quais ações você vai tomar com esses resultados.

Análise em Tempo Real com Python
Trazendo os resultados finais já formatados

Você percebeu que mesmo com uma análise simples do BBB você já consegue resultados excelentes para os seus projetos?

Agora imagine na sua empresa para buscar o que os clientes estão falando de cada produto, isso é muito útil para que você tenha essa análise e saiba qual ação tomar baseado nos seus resultados.

Nessa aula nós não detalhamos muito o conteúdo, pois nós temos aqui no canal a explicação de vários desses conteúdos, então para facilitar vou deixar todos listados aqui caso não saiba de algum já pode acessar o post:

Conclusão da Análise em Tempo Real com Python

Hoje eu te mostrei como você pode fazer uma análise real com Python usando o Twitter. Então pode utilizar isso não só para entretenimento quanto para trabalho.

Você vai conseguir fazer suas próprias análises para verificar o que estão comentando da sua empresa, dos seus produtos e com isso vai poder tomar suas ações para melhorar o que está acontecendo.

Veja que a análise de dados em Python é muito importante mesmo em redes sociais para podermos tirar muitas informações úteis.

Hashtag Treinamentos

Para acessar outras publicações de Ciência de Dados, clique aqui!


Quer aprender mais sobre Python com um minicurso gratuito?


Vire uma referência no Mercado de Trabalho por causa do Power BI!

Quer saber como? Inscreva-se no Intensivão de Power BI! É gratuito!