Blog

Postado em em 17 de abril de 2023

CIÊNCIA DE DADOS do ZERO – Como Aprender?

Nesta aula vou te passar dicas de como aprender ciência de dados do zero! Vou explicar em que ordem estudar e o que é mais importante.

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:

Fala Impressionadores! Na aula de hoje eu quero te mostrar como aprender Ciência de Dados do Zero da forma que eu queria ter aprendido!

A ideia é te mostrar qual melhor caminho para aprender Ciência de Dados sem que você fique neurótico estudando tudo de um único conteúdo porque acha que precisa dominar um conteúdo x ou y.

Quer saber quais são os passos para ser um cientista de dados? Então vem comigo que eu vou te dar algumas dicas de como você pode chegar lá.

Uma das dúvidas que vou responder é algo muito comum, “Quando vou aprender tudo em Ciência de Dados”. Essa é uma dúvida comum, mas muitos já sabem a resposta!

Ciência de Dados do Zero!

Para começar vamos entender que podemos dividir ciências de dados em duas etapas, a parte básica e a parte específica.

Conhecimento básico e específico
Conhecimento básico e específico

A segunda etapa é mais difícil de definir o tempo que leva para aprender, porque depende muito da empresa que você for trabalhar.

A maioria das empresas não mostra qual estrutura possui para ciências de dados, geralmente você irá descobrir apenas quando entrar nela, assim como as pesquisas e artigos são processos mais complexos.

Vamos então nos focar na primeira etapa do aprendizado, sendo os conceitos fundamentais, as etapas básicas de um projeto os cursos e tutoriais, nesta etapa conseguimos aprender até 80% do que precisamos para nos candidatar para qualquer vaga.

Ciências de dados trabalha muito com estatística, você deve saber com que ferramentas irá trabalhar e não apenas procurar pelos altos salários, outro alicerce é a programação, saber programação é fundamental para ser cientista de dados.

Então, a principal dica que dou é, gastem tempo em aprender estatística e lógica de programação, ter essa base reforçada no começo facilita todo o caminho depois.

Existem sites onde você pode aprender a programar -> o Projecteuler é um que vou deixar como dica.

primeiros passos
primeiros passos

Assim que a parte de programação estiver bem estabelecida é natural começar a conhecer as bibliotecas, para isso vamos usar muito o Pandas.

Quando se trata de bibliotecas nada é tão bom para estudar quanto a documentação, sim, você deve ter o hábito de ler as documentações, isso vai te familiarizar as bibliotecas e as possibilidades que elas entregam.

Utilizar as bibliotecas vai te dar o primeiro contato com bases de dados, e esse é o passo inicial como cientista de dados porque agora estamos incorporando dados ao nosso processo.

Outra dica importante para o estudante de ciências de dados é, teve dúvidas sobre um resultado ou cálculo? Se aprofunde naquela dificuldade assim que ela surgir, pesquise a fundo sobre os cálculos feitos e sobre o impacto que aquele resultado traz para o negócio.

Aprender de forma aplicada evita que você gaste tempo em assuntos que são interessantes, mas que, para fins práticos, você pode acabar nunca usando…

Outro ponto é que alguns assuntos considerados chatos podem mudar o sentido quando estudado de forma aplicada, quando você estuda com situações reais, usar a estatística e cálculos até chegar em uma solução pode mudar sua relação com esses conhecimentos e chegar até a se tornar prazeroso.

Visualização de dados

O próximo passo após usar a programação e estatística para solucionar os problemas do negócio é visualizar os resultados obtidos.

Vamos fazer isso por meio de imagens e gráficos, fazendo com que o resultado fique mais visual para uma apresentação. Tenho duas dicas de bibliotecas importantes para visualização de dados Matplotlib e o Cyborg

Análise Exploratória de dados

Nesta parte, vamos explorar todos os resultados que já encontramos e começar a gerar resultados para a empresa, como:

  • Um produto chave para a empresa que os dados mostram que está em queda.
  • Um padrão que se repete que pode gerar um aumento de vendas

Aqui o objetivo é juntar as perguntas do negócio com os resultados obtidos para gerar valor para a empresa.

Às vezes gerar uma análise exploratória com agregação de valor para o negócio já é mais do que suficiente, não sendo exigido nem mesmo as outras aplicações de ciências de dados como previsões ou modelos específicos.

Mas, Lucas! Ainda não estou em uma empresa, estou criando o meu portfólio.

Neste caso você deve, sim, criar modelos e colocá-los em produção, quando estamos criando nosso portfólio é interessante que saibam até onde vai o nosso conhecimento em diversos projetos.

E quando vou aprender tudo de Ciências de Dados?

A resposta é nunca, claro que temos que sempre estar estudando, mas a área de tecnologia é uma área que está em constante evolução e sempre em uma velocidade muito grande, é importante ter em mente que o estudo nesta área é uma constante.

Procure saber bem o que resolve os problemas do seu dia a dia e não com novidades de tecnologias supercomplexas que a maioria das empresas nem possui uma maturidade de dados suficiente para suportar.

Saibam o suficiente para estar por dentro do assunto, mas mantenham o foco em entender os princípios básicos! Vocês estão começando, então sejam consistentes em seu aprendizado e isso mais tarde vai trazer benefícios, pois vão ter uma base ótima.

Machine learning e Modelos

Agora vamos falar um pouco sobre o aprendizado de máquinas e criação de modelos. Minha dica neste caso é que você desenvolva esse modelo da maneira mais simples que puder, chegando até o ponto de apresentar o modelo.

Escolha uma base simples, faça a importação da base, visualize, entenda os dados, faça as análises exploratórias, crie um modelo simples de machine learning e apresente o modelo.

Feito isso, presente o modelo para um amigo, para sua família, poste em seu portfólio, enfim, consiga feedbacks do seu trabalho, isso será muito importante para seu desenvolvimento como cientista de dados.

No começo use o dataset iris, faça arvore de decisão e resolva problemas simples, sempre com o foco em resolver um problema, mesmo sendo simples e não em descobrir sistemas complexos que você ainda não sabe onde ou como usar.

À medida que você for ficando mais seguro, faça o mesmo com bases um pouco mais difíceis gradativamente.

Ciências de Dados do Zero
Guia para estudo

Procure sempre aprender de forma progressiva colocando metas, passando para o próximo passo assim que o anterior estiver confortável sem pular etapas.

O mesmo vale para se adequar a uma vaga, pesquise por 20 empresas onde você gostaria de trabalhar e veja o que os funcionários dessas empresas estão postando é o que a empresa valoriza, faça um resumo dos elementos em comum entre elas e coloque na sua meta de aprendizado.

Ciências de Dados do Zero
Programas

Eu fico por aqui! Vou deixar algumas sugestões de aulas que explicam o que é ciências de dados passando por diversos conceitos para que você amplie ainda mais seu conhecimento:

Conclusão – Ciências de Dados do Zero

Nesta aula trouxe dicas importantes que gostaria de ter escutado no início dos meus estudos, essas dicas com certeza vão ajudar vocês a percorrer um caminho mais assertivo e agradável para se tornar um cientista de dados experiente e com ótimas oportunidades.

Aproveite para clicar nos links e continuar seus estudos, temos muito material para você se aprofundar ainda mais.

Hashtag Treinamentos

Para acessar outras publicações de Ciência de Dados, clique aqui!


Quer aprender mais sobre Python com um minicurso básico gratuito?

Quer sair do zero no Python e virar uma referência na sua empresa? Inscreva-se agora mesmo no Python Impressionador