Blog

Postado em em 18 de abril de 2022

Estimativa de Vendas no Python Usando Machine Learning

Continuando as aulas de ciência de dados eu vou te mostrar como fazer uma estimativa de vendas no Python com machine learning.

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:

Estimativa de Vendas no Python

Você sabe como estimar vendas no Python? Hoje eu quero te mostrar como fazer isso fazer uma análise de dados no Python.

Além disso para continuar as aulas de ciência de dados no Python nós vamos utilizar machine learning para resolver esse problema de estimativa!

Como Estimar Vendas no Python

Antes de iniciar com o nosso problema a ser resolvido é interessante falar sobre as bibliotecas que vamos utilizar nesse projeto.

Vamos utilizar a biblioteca pandas, biblioteca matplotlib e a biblioteca numpy.

import pandas as pd
import matplotlib as plt
import numpy as np

# Importando a base de vendas
base = pd.read_excel("Investimento x Venda.xlsx")

# Exibindo as 5 primeiras linhas
base.head()
Importando as bibliotecas e a base de dados
Importando as bibliotecas e a base de dados

A ideia é responder essa pergunta da estimativa de vendas, então vamos importar as bibliotecas, importar a base de dados e visualizar as 5 primeiras linhas para verificar como está a base de dados.

# Visualizando de forma gráfica essas informações
plt.scatter(base["Investimento em marketing"],base["Venda Qtd"])
plt.show

# Traçando uma reta passando por esses pontos
plt.scatter(base["Investimento em marketing"],base["Venda Qtd"])
x0 = base["Investimento em marketing"][0]
y0 = base["Venda Qtd"][0]
x1 = base["Investimento em marketing"][6]
y1 = base["Venda Qtd"][6]
plt.plot([x0,x1],[y0,y1],"r")
plt.show()
Gráfico dos dados + criação de uma reta passando no primeiro e último ponto
Gráfico dos dados + criação de uma reta passando no primeiro e último ponto

Em seguida vamos visualizar a forma gráfico dos dados para analisar melhor. Uma das maneiras de fazer essa estimativa é traçar uma reta, pois ela passa por quase todos os pontos.

Claro que esse não é o cenário ideal, mas com isso você já tem uma ideia de como os dados estão se comportando.

def EncontraY(x_reta,y_reta,x):
	a = (y_reta[1] - y_reta[0])/(x_reta[1] - x_reta[0])
	b = y_reta[1] - a*x_reta[1]
	y = a*x + b
	return y

EncontraY[x0,x1],[y0.y1]75)

plt.scatter(base["Investimento em marketing"],base["Venda Qtd"])
plt.scatter(75,EncontraY[x0,x1],[y0,y1],75),color="k")
x0 = base["Investimento em marketing"][0]
y0 = base["Venda Qtd"][0]
x1 = base["Investimento em marketing"][6]
y1 = base["Venda Qtd"][6]
plt.plot([x0,x1],[y0,y1],"r")
plt.show() 
Estimativa de Vendas no Python
Determinando o estoque com base no valor inicial

Podemos então utilizar a equação da reta para determinar a quantidade de estoque baseado no nosso valor inicial de 75.000 em marketing.

Agora nós vamos utilizar o scikit learn para importar o modelo de regressão linear no Python.

from sklearn import linear_model

reg = linear_model.LinearRegression()

reg.fit(base["Investimento em marketing"].values.reshape(-1,1),base["Vendas Qtd"])

reg.coef_

reg.intercept_

plt.scatter(base["Investimento em marketing"],base["Vendas Qtd"])
x = np.array(base["Investimento em marketing"])
y = reg.intercept_ + x*reg.coef_
plt.plot(x,y,"r")
plt.show()
Estimativa de Vendas no Python
Usando machine learning para descobrir a venda

Veja que temos uma reta muito parecida com a que traçamos anteriormente, só que nesse caso tivemos menos trabalho e não precisamos criar nada de forma manual para tentar descobrir qual é a função para descobrir o valor de estoque.

reg.predict([[75]])


plt.scatter(base["Investimento em marketing"],base["Vendas Qtd"])
plt.scatter(75,reg.predict([[75]])[0],color="k")
x = np.array(base["Investimento em marketing"])
y = reg.intercept_ + x*reg.coef_
plt.plot(x,y,"r")
plt.show()
Estimativa de Vendas no Python
Inserindo a informação no gráfico para verificar onde ela vai cruzar nossa linha

Você deve estar se perguntando, mas de onde tiramos essa regressão linear? Na verdade, isso vem de pesquisas e estudos, então já sabíamos que existe essa possibilidade para poder fazer essa estimativa.

No próprio site do scikit learn que deixamos tem todas as informações necessárias para que você utilize essa regressão e os códigos que vai utilizar.

É importante saber que muita das coisas que você precisa para resolver um problema alguém já criou e disponibiliza um código já pronto ou uma biblioteca que tenha essas ferramentas.

Então você precisa pesquisar e ler a documentação para que consiga entender o que está sendo feito e aplicar ao seu problema.

Essa parte é muito importante, pois é isso que vai diferenciar você de um programador iniciante, você tendo a capacidade de ler e aplicar ao seu problema já te torna muito eficiente.

Então a ideia dessas aulas de data Science é de mostrar ferramentas que você pode utilizar nos seus projetos!

Conclusão

Nessa aula eu te mostrei como fazer uma estimativa de vendas utilizando a regressão linear que vai calcular a combinação linear mais próxima dos dados que temos.

Agora você tem mais uma ferramenta para a resolução dos seus problemas e para sua análise de dados no Python!

Hashtag Treinamentos

Para acessar outras publicações de Ciência de Dados, clique aqui!


Quer aprender mais sobre Python com um minicurso básico gratuito?

Quer sair do zero no Python e virar uma referência na sua empresa? Inscreva-se agora mesmo no Python Impressionador