Blog

Postado em em 22 de dezembro de 2022

Como Mesclar PDFs com Python em Menos de 10 Linhas de Código.

Você sabe como mesclar PDFs com Python? Vamos resolver este desafio e você vai sair desta aula mesclando PDFs tranquilamente!

Caso prefira esse conteúdo no formato de vídeo-aula, assista ao vídeo abaixo ou acesse o nosso canal do YouTube!

Para receber por e-mail o(s) arquivo(s) utilizados na aula, preencha:

A primeira coisa que podemos fazer quando surgem essas dúvidas no Python é buscar uma biblioteca que nos ajude a resolver o problema.

É muito provável que alguém já tenha chegado neste mesmo problema que nós estamos tendo que resolver agora.

O que são bibliotecas?

São pacotes de códigos que podemos utilizar criados para resolver um problema.

Para esta resolução vamos usar a biblioteca PyPDF2.

Após instalar a biblioteca vamos usar o merger.

Import
Import

Esta parte do código → PdfFileMerger é responsável por mesclar os PDFs para nós.

Agora podemos adicionar um arquivo neste merger:

Como Mesclar PDFs com Python
Merger.append

Após escrever o código, os arquivos que já temos dentro do programa podem ser mesclados.

Para isso vamos escrever seus nomes dentro dos parênteses do código.

Como Mesclar PDFs com Python
Merger.append

E acrescentar no código o merger.write, esta última linha gera e nomeia o arquivo final.

merger.write
merger.write

Resumo:

Como Mesclar PDFs com Python
Resumo

Este código se resume em 3 fases principais!

Na primeira fase nós inicializamos.

Depois na segunda fase nós fazemos o append de todos os arquivos PDF que queremos mesclar.

E por fim, a terceira fase, após adicionar os PDFs fazemos um merger.write, que vai nomear e gerar o arquivo final.

Existe um modo de executar essa lógica de forma mais prática? E se forem muitos PDFs teremos que fazer o append um por um?

O que podemos fazer?

Podemos resolver este problema, para isso vamos deletar o PDF final que criamos.

Agora precisamos pegar todos os arquivos e colocá-los em uma pasta, vamos nomeá-la como pdfs_mesclar.

A pasta e o código que criados devem estar no mesmo local, na mesma pasta para isso funcionar.

Agora vamos reinicializar o código, a ideia é fazer com que o código percorra a pasta com todos os PDFs.

Para percorrer a pasta vamos ter que importar outra biblioteca, vamos importar a biblioteca OS.

Essa biblioteca nos permite navegar entre as pastas e locais do nosso computador.

Agora é a parte mais simples!

temos apenas que acrescentar nossa lista de arquivos usando a biblioteca OS e passando o nome da pasta com os PDFs → “pdfs_mesclar”.

Observe o código:

Exemplo.
Exemplo.

Percorrendo nossa lista de arquivos!

Para isso vamos usar a estrutura de repetição For:

Para cada arquivo desta lista nós queremos fazer um merger.append, correto?

Observe que no merger.append temos que colocar somente o nome do arquivo, só que este arquivo esta dentro da pasta pdf_mesclar.

Para resolver isso vamos escrever um texto dentro dos parênteses do merger.append:

(f”pdfs_mesclar/arquivo”)

Pelo nome do arquivo ser uma variável dentro do texto vamos colocar o f na frente e colocar a variável arquivo entre chaves para que ele possa substituir de forma dinâmica a variável.

Feito isso o código vai fazer o append do primeiro, segundo e terceiro PDF.

Após adicionar todos os arquivos passamos para a terceira fase e o merger.write que cria e nomeia o PDF final.

Resultado:

Resultado.
Resultado.

Arquivo oculto:

Obs. Um cuidado importante que devemos ter é:

Sempre que você for percorrer os arquivos de uma pasta, deve tomar alguns cuidados, o seu sistema operacional pode criar arquivos ocultos dentro da pasta, e isso pode dar erro no momento de mesclar.

Para evitar este erro podemos tomar alguns cuidados no código:

Podemos colocar uma condição que vá garantir que só serão mesclados os arquivos em PDF.

Podemos fazer esta condição usando o comando If.

Em outras palavras, podemos escrever no código → “Se o arquivo for do tipo PDF, então o código mescla o arquivo”.

Resultado com o if.
Resultado com o if.

Fazendo isso temos uma garantia de que o código vai mesclar os arquivos corretos.

Agora só precisamos rodar o código e independente de quantos PDFs ou quantas páginas temos nos PDFs os arquivos serão mesclados!

Se você quiser mesclar os arquivos em uma ordem, isso é possível, mas antes de mesclar a dica é ordenar os arquivos em uma ordem específica, ordenar por nome ou número e deixar na ordem correta no append.

Conclusão – Como Mesclar PDFs com Python

Essa aula foi feita para te ajudar a resolver um desafio comum, como mesclar PDFs com Python?

Em um trabalho ou projeto pode ser necessário mesclar PDFs!

Por este motivo esta aula foi feita, para te ensinar como fazer a mesclagem de PDFs em poucas linhas de código em um passo a passo muito simples.

Eu fico por aqui! Espero ter ajudado! Até mais,

Hashtag Treinamentos

Para acessar outras publicações de Python, clique aqui!


Quer aprender mais sobre Python com um minicurso básico gratuito?

Quer sair do zero no Python e virar uma referência na sua empresa? Inscreva-se agora mesmo no Python Impressionador