Tech By Rocha

@techbyrocha

Converter PDF em ficheiros png, tiff ou txt

É frequente deparar-se com a necessidade de desmontar um pdf para manipular o seu conteúdo pois por definição o formato pdf não permite a edição. Um dos métodos que nos permite esse tipo de manipulação é a transformação simples do pdf em ficheiros de formatos que viabilizem a sua edição. Com este propósito vou aqui partilhar alguns métodos simples para conseguir essa transformação na linha de comandos em Linux.

Converter pdf em ficheiros png
gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=png16m -r300 -sOutputFile=out_%03d.png ficheiro.pdf

A instrução apresentada anteriormente ira criar um ficheiro png com resolução de 300 dpi por cada página existente no ficheiro pdf. Os nomes dos ficheiros png serão gerados com a mascara out_%03d.png pelo que todos assumirão de forma sequencial nomes do tipo out_001.png, out_002.png, out_003.png, etc…

Converter pdf em ficheiros tiff
convert -density 300x300 in.pdf out_%03d.tiff

A instrução apresentada anteriormente ira criar um ficheiro tiff com resolução de 300 dpi por cada página existente no ficheiro pdf. Os nomes dos ficheiros tiff serão gerados com a mascara out_%03d.png pelo que todos assumirão de forma sequencial nomes do tipo out_001.tiff, out_002.tiff, out_003.tiff, etc…

Se o utilitário convert não estiver disponível terá de o instalar com a instrução

sudo apt-get install imagemagick
Converter pdf num ficheiro txt
pdftotext -eol unix ficheiro.pdf ficheiro.txt

A instrução apresentada anteriormente ira criar um ficheiro de texto a partir do ficheiro pdf. Pode modificar o formato do ficheiro de texto de acordo com as suas necessidades mudando o parâmetro -eol entre unix, dos ou mac para melhor compatibilidade com o ambiente onde pretende editar o ficheiro.

Se o utilitário pdftotext não estiver disponível terá de o instalar com a instrução

sudo apt-get install pdftotext

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Este site utiliza o Akismet para reduzir spam. Fica a saber como são processados os dados dos comentários.