Blog

Postado em em 24 de fevereiro de 2023

Como usar Split no Python – Separação de Strings

Você sabe como fazer a separação de strings no Python? Hoje eu vou te ensinar como usar o split no Python para fazer essa separação!

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Como Sair do Zero com Split no Python

Você já trabalhou com strings no Python e precisou separar as informações para poder fazer suas análises?

Eu vou te mostrar como fazer a separação de strings no Python usando SPLIT. Se você ainda não sabe strings são textos, então vamos fazer a separação de textos no Python.

O que é uma string no Python?

Uma string no Python é um conjunto variável de caracteres que formam um texto com sentido (ou não necessariamente). A definição string é um tipo de dados bem amplo, que inclui desde uma única letra a um texto completo com diversas sentenças e parágrafos. 

Ou seja, inicialmente, uma string é um tipo que permite guardar dados de diversos tamanhos. Então não há como reservar um espaço específico no Python. Isso é feito quando o valor é atribuído para a string.

Cada string pode ser gerenciada com métodos de manipulação específicos que permitem extrair informações dentro do conjunto de caracteres.

Por exemplo, no conceito de string, temos também o de substring. Trata-se de um conjunto de caracteres que estão dentro da minha string. É similar à ideia de conjuntos e subconjuntos.

Toda string tem substrings, que são todas as combinações de elementos dentro delas.

Por exemplo, na frase que acabamos de escrever: “toda frase tem substrings”. Temos diversas possibilidades de substrings: “toda frase”, “frase”, “tem”, “toda a frase tem” são alguns dos exemplos. As possibilidades são inúmeras.

Ou seja, uma string pode ser encarada como uma lista encadeada de substrings. Assim, você pode acessar facilmente cada um dos elementos, só que com a vantagem de não precisar percorrer em um método sistemático, como seria preciso com uma lista. 

Entendendo isso, você consegue compreender que a manipulação de strings no Python é um recurso incrivelmente poderoso.

E compreendendo tudo isso, você entende também o método split.

O que é o método split?

O método split consiste em uma forma de manipular uma string pela divisão dela nas substrings. 

Precisamos entender isso para saber como usar o split no Python. 

Às vezes o programador precisa de algo dentro de uma string, uma informação importante ou simplesmente quer dividir a string maior para fins de análise. Nesse caso, o split é muito útil e importante. 

Basicamente, o split enxerga a string como uma lista de elementos que podem ser acessados e manipulados separadamente. Isso abre uma janela de oportunidades para que a edição seja feita, de acordo com a vontade do programador.

Dado um texto, o split é um marcador e identificador de strings com base em um separador, que pode ser, por exemplo, a vírgula. 

Não importa a lógica. O que importa é que ele possibilita entender as palavras.

Esse tipo de manipulação é útil em sistemas mais simples, mas também pode ser poderoso em uma aplicação complexa e robusta de Processamento de Linguagem Natural, por exemplo. A lógica é exatamente a mesma: pegar as palavras, dividi-las e tentar entendê-las.

Mesmo que não se use o split, isso nos ajuda a entender a importância desse método e da manipulação de string do Python.

Com isso em mente, você já consegue avançar para entender como usar split em Python. 

Split Python: como usar?

Para que nós possamos te mostrar como funciona essa ferramenta de separação, vamos abrir o arquivo txt no Python utilizando o with.

with open('texto.txt', "r", encoding="utf-8") as arquivo:
    texto = arquivo.read()
    print(texto)
image 1

Esse é um arquivo de texto que vamos utilizar para te mostrar alguns exemplos da separação de strings.

palavras = texto.split()
print(palavras)
VzvBaqRygM7jpZmNaLet7 LWmqp1gPnUfhJN Z14CplrICtOaAwKeQlqfn4uxm4D2UMxj1WUcj8A8QJ6CgulogRXAbNFALVqsQ8VB2sxQ6GiN20 c1H02sOpidCacID8f7W6Lg wzan JWHRLnXP3 M

Para fazer isso nós vamos utilizar o split. Se você notar, nesse exemplo estamos separando tudo que possui espaço no texto. Então basicamente temos todas as palavras do texto separadas.

Agora, para deixar isso um pouco mais visual, nós podemos utilizar uma estrutura de repetição para “printar” cada uma das palavras.

palavras = texto.split()

for palavra in palavras:
    
    print(palavra)
image 3

O que podemos fazer em seguida é utilizar a estrutura condicional para verificar quais dessas palavras possuem vírgula e remover 1 caractere dessa palavra.

Que vai ser o último caractere, que é exatamente onde temos a vírgula.

palavras = texto.split()

for palavra in palavras:
    
    if ',' in palavra or ';' in palavra or ':' in palavra or '.' in palavra:
        print(palavra[:-1])
    else:
        print(palavra)
image 4

OBS: Nessa parte nós utilizamos o OR para poder inserir as outras pontuações que podem aparecer como “;”, “:” e “.”.

Algo bem interessante que você já pode estar pensando é em contar a ocorrência dessas palavras para fazer alguma análise mais específica.

palavras.count('acusação')
image 5

Aqui temos outro exemplo que é parecido com o nosso primeiro, mas agora nós vamos trazer o texto que tem até a ocorrência da vírgula, por exemplo (da vírgula + espaço).

linhas = texto.split('\n')

for linha in linhas:
    print(linhas.indes(linha), ')' , linha)
Split no Python

Então, dessa forma, ao invés de separar todas as palavras, nós vamos trazer todo o texto até a aparição de uma vírgula, e depois vamos repetir o procedimento.

linhas = texto.split('\n')

for linha in linhas:
    
    print(palavras_virgula.index(linha)+1, ')' , linha)
image 7

Aqui nós estamos utilizando o \n, que é o comando para pular uma linha, então nós estamos separando os textos onde temos a quebra de linha.

Já está conseguindo visualizar as aplicações que você pode ter com esses recursos? São diversas aplicações não só para usar essa ferramenta sozinha, mas adicioná-la dentro dos seus projetos para deixá-los ainda melhores.

Para aprender mais opções de separação de strings com o Python você pode acessar o blog de Python split da Betrybe.

Você vai poder ver outros exemplos de separação de strings que podem te auxiliar nos seus projetos.

Conclusão do Split no Python

Nessa aula eu te mostrei o básico de como usar o Split no Python para fazer a separação de strings, que nada mais é do que a separação de textos no Python.

A separação de textos é importante, pois nem sempre vamos trabalhar com números, então em alguns casos precisamos extrair informações de textos para conseguir fazer nossa análise!

Dessa forma, você vai ter mais uma ferramenta para acrescentar nos seus projetos para melhorar ainda mais sua análise e suas programações em Python.

Hashtag Treinamentos

Para acessar outras publicações de Python, clique aqui!


Quer aprender mais sobre Python com um minicurso básico gratuito?

Quer sair do zero no Power BI e virar uma referência na sua empresa? Inscreva-se agora mesmo no Power BI Impressionador