Hoje eu quero te mostrar um case prático de análise de dados no Python fazendo a análise de turbina eólica para o setor de energia!
Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!
Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:
Case Prático de Análise de Dados
Hoje nós vamos fazer uma análise de dados com case prático no Python, então vamos fazer uma análise de turbina eólica com Python.
Isso mesmo, nós vamos fazer uma análise para setor de energia com Python, mas mesmo que você não seja da área essa aula vai ser útil!
Análise de Turbina Eólica
Para poder fazer uma análise de dados é ter essa base de dados. Essa que vamos utilizar foi retirada o Kaggle que possui diversas bases de dados gratuitas para que você possa treinar.
Já com a base de dados nós podemos dar início a programação para fazer essa análise de dados. Vamos iniciar com a importação das bibliotecas que serão utilizadas.
Vamos utilizar o pandas (que é uma biblioteca de análise de dados), o Seaborn e o Matplotlib que são bibliotecas gráficas do Python.
O nosso primeiro passo é a leitura do arquivo que vamos utilizar e verificar se de fato vamos precisar de todas as informações.
Nesse caso nós estamos lendo o arquivo em CSV que possui mais de 50.000 linhas e estamos excluindo a coluna de direção do vento, pois nessa análise não vamos utilizar essas informações.
Vamos transformar a coluna de data/hora para o formato de data para que as informações fiquem corretas.
Por fim vamos mostrar a tabela para que você consiga visualizar como estão organizados os dados.
Agora nós vamos a parte de plotagem dos dados em um gráfico. Inicialmente vamos começar com os dados reais de velocidade do vento pela potência ativa que está sendo gerada.
Aqui temos um gráfico de pontos para facilitar a visualização de cada uma das informações da nossa tabela.
Agora vamos partir para a os dados teóricos, que deveriam ser gerados de acordo com a velocidade do vento da base de dados.
Aqui você já começa a visualizar que o modelo real ele segue o modelo teórico, mas ao considerar todos os elementos do mundo real nós temos algumas variações.
Mas no geral você pode notar que temos a curva real seguindo o mesmo padrão da curva teórica.
Agora nós vamos criar os “limites aceitáveis” desses dados para a nossa análise para verificarmos em relação a curva teórica quais dessas potências geradas que estão dentro ou fora desses limites.
Vamos agora a explicação dessa parte para que fique mais fácil de entender.
Inicialmente nós estamos transformando tanto a coluna de potência quanto a de curva teórica em listas para facilitar o trabalho com esses dados.
Em seguida nós vamos criar 3 outras listas, uma de potência máxima, uma de potência mínima e por fim a classificação se a potência analisada está dentro ou fora desse limite.
Na primeira estrutura de repetição FOR nós vamos criar os dados de potência máxima e mínima.
Essas informações serão baseadas no valor da potência teórica, então para o máximo vamos aumentar o valor em 5% e para o mínimo vamos diminuir o valor em 5%.
Isso é para que possamos ter uma faixa de análise com variação de 5% para cima ou para baixo em relação ao valor teórico.
Agora na segunda estrutura de repetição FOR nós vamos começar a classificar se o nosso valor real está dentro, fora ou se é igual a zero.
Se o valor estiver dentro da variação dos 5% ele está dentro dos nossos limites aceitáveis, caso esteja acima dessa variação estará fora e ainda tem a possibilidade desse valor ser igual a zero, então não gerou nada nesse momento.
Por fim vamos fazer um cálculo para verificar o percentual de informações que temos dentro do limite em relação ao total de medições.
Você pode notar que esse percentual é de aproximadamente 37%. Com essa informação você vai saber se a turbina está ok, se precisa de ajustes ou se precisa de uma outra ação a ser tomada.
Agora nós vamos inserir essa nova coluna que acabamos de criar dentro da nossa base de dados para que possamos visualizar isso de forma mais fácil e depois criar um gráfico.
Aqui temos a nova coluna dentro da tabela e agora vamos plotar novamente o gráfico, mas essa plotagem será feita em relação as 3 categorias que criamos: dentro, fora e zero.
Assim vamos poder visualizar de forma mais visual os dados que estão dentro e fora dos limites de 5% que foram criados.
No gráfico você pode notar que boa parte dos nossos dados estão fora dos limites que foram criados.
E na parte inferior vai notar que ainda temos alguns valores de potência que foram iguais a 0, ou seja, não geraram energia naquele momento.
Então nós conseguimos sair daquele gráfico todo em azul com dados um pouco confusos para uma análise mais detalhada e verificar como está a eficiência dessa turbina.
Com isso você vai poder verificar se está no padrão de uma turbina que está analisando, se é necessário algum reparo, se houve outro problema.
OBS: Nesse caso talvez seja interessante adicionar a coluna que excluímos no começo de direção do vento para verificar se as informações fora do limite são justificadas pela direção do vento. Pois essa direção pode afetar diretamente na geração de energia e por isso tivemos apenas 37% dentro do limite aceitável.
Conclusão da Análise de Turbina Eólica
Nessa aula eu trouxe pra você um case prático de análise de dados no Python para que você consiga entender como é que fazemos uma análise de dados.
Pode ser que você não seja da área de energia, mas aposto que as ideias, os gráficos e as análises feitas vão te auxiliar a criar suas próprias análises e até ter ideias de como pode abordar um problema.
Hashtag Treinamentos
Para acessar outras publicações de Python, clique aqui!
Quer aprender mais sobre Python com um minicurso gratuito?
Expert em conteúdos da Hashtag Treinamentos. Auxilia na criação de conteúdos de variados temas voltados para aqueles que acompanham nossos canais.