Nessa aula eu vou te mostrar como fazer reconhecimento de fala em Python isso mesmo que você leu, o Python vai reconhecer o que você falar!
Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!
Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:
Você sabia que é possível reconhecer fala no Python? É isso mesmo nós vamos aprender como reconhecer fala no Python. Mas como funciona isso?
Você vai poder falar no seu microfone e o código vai fazer o reconhecimento de frases no Python e vai escrever o que falou.
Bem similar ao que temos no nosso celular por exemplo, que ele consegue entender o que falou e fazer uma pesquisa, mas no nosso caso ele vai entender e vai poder printar essa mensagem.
Antes de iniciar nós vamos fazer a instalação da biblioteca SpeechRecognition e da biblioteca PyAudio.
Então como de costume vamos utilizar os seguintes códigos no terminal para instalar: pip install SpeechRecognition e pip install PyAudio.
OBS: É possível que tenha um erro na instalação do PyAudio, então se você tiver Windows você pode escrever pipwin install pyaudio, caso tenha outro sistema operacional pode procurar no Google qual o seu sistema para verificar qual o procedimento tem que seguir, mas é bem simples!
Lembrando que para essa aula nós vamos utilizar o PyCharm, mas você pode utilizar outro editor. Caso queira utilizar esse editor para acompanhar exatamente o que temos na aula basta clicar aqui que temos um passo a passo de instalação.
import speech_recognition as sr
rec = sr.Recognizer()
# print(sr.Microphone().list_microphone_names())
with sr.Microphone(3) as mic:
rec.adjust_for_ambient_noise(mic)
print("Pode falar que eu vou gravar")
audio = rec.listen(mic)
texto = rec.recognize_google(audio, language="pt-BR")
print(texto)
O código que nós vamos utilizar é esse, ele é bem simples, mas vai pegar o áudio que falar logo após o print “Pode falar que eu vou gravar”.
Nesse momento você pode começar em silêncio e quando terminar também, assim a obtenção das frases vai ficar melhor e o resultado vai sair exatamente como você falou.
OBS: Você deve ter notado que temos uma linha comentada, que é o print(sr.Microphone().list_microphone_names()). Essa linha é necessária para você verificar qual dos microfones vai utilizar, pois algumas pessoas podem ter mais de um no computador. Então de acordo com essa posição é que vamos colocar dentro do argumento do With.
Então nós vamos gravar o que foi falado com o rec.listen(mic) e então vamos transformar isso para texto com o código rec.recognize_google(audio, language=”pt-BR”).
Essa parte é importante, pois você deve ter notado que estamos colocando pt-BR que é a linguagem português Brasil.
Isso é importante porque o padrão é inglês, então é possível que o texto não fique correto caso você não informe exatamente qual é a linguagem que está trabalhando.
Após rodar o código e verificar o print para iniciar você vai poder falar seu texto e logo em seguida vai ver o resultado na parte inferior do programa.
Aqui temos a “tradução” do texto falado para o texto escrito. Outro ponto importante é falar pausadamente sem atropelar as palavras para que essa tradução funcione corretamente.
Nessa aula eu te mostrei como você pode fazer o reconhecimento de fala em Python, assim vai poder falar o seu texto que o código vai traduzir em um texto escrito.
É importante que você fale pausadamente para que funcione corretamente.
Esse é um procedimento que você pode utilizar para automatizar o seu código e você pode até utilizar uma aula que temos que é de Como Fazer Ligações Telefônicas com Python.
Então você já pode gravar sua mensagem falada e já utilizar ela para enviá-la através de uma ligação! Não é o máximo isso?
Para acessar outras publicações de Python, clique aqui!
Quer aprender mais sobre Python com um minicurso gratuito?
Expert em conteúdos da Hashtag Treinamentos. Auxilia na criação de conteúdos de variados temas voltados para aqueles que acompanham nossos canais.