Capita a molti utenti di dover estrarre un PDF magari per modificarlo e poi salvarlo in un’altro formato, se per estrarre o copiare il testo è abbastanza semplice dato che i nuovi reader di PDF ci permettono di copiarne il testo e poi salvarlo per esempio nel nostro editor di testo, con le immagini invece non è molto semplice.
Sopratutto se vogliamo copiare tutte le immagini contenuti su un documento (nel mio caso era un catalogo con oltre 900 immagini) può diventare un’impresa non da poco. Ma grazie ad un semplice comando da terminale in pochi secondi potremo estrarre tutte le immagini contenute su un PDF grazie a Pdfimages
Pdfimages è un semplice tool contenuto nel pacchetto xpdf-utils (di solito già presente nelle più diffuse Distribuzioni Linux) il quale ci permette di elaborare documenti PDF nel nostro caso estraendone tutte le immagini contenute.
L’utilizzo è semplicissimo basta da terminale digitare:
pdfimages [opzione] file.pdf nome_immagine_estratta
dove come opzione potremo inserire -j per estrarre le immagini nel formato jpeg oppure -f potremo indicare da quale pagina estrarre le immagini (per esempio -f 5 per avviare l’elaborazione dalla pagina 5 in poi) e -l invece per indicare l’ultima pagina per estrarre l’immagini (per esempio -l 19 elaboreremo le pagine fino alla 19).
Per esempio se voglio estrarre le immagini in jpeg dal file lffl.pdf e nominarle appunto lffl basta digitare da terminale:
pdfimages -j lffl.pdf lffl
se invece voglio estrarre le immagini del file lffl.pdf in jpeg dalla pagina 3 alla pagina 8 per esempio e rinominare con il nome provalffl basta dare da terminale:
pdfimages -j -f 3 -l 8 lffl.pdf lf
unica nota negativa di pdfimages è che non possiamo salvare le immagini in altri formati (se non diamo -j saranno salvare in .ppm) e la risoluzione per il resto lo trovo molto semplice e sopratutto utile.