Linux: Estrarre le immagini da un PDF direttamente da terminale
Abbiamo visto nei giorni scorsi come possiamo, con facilità, convertire una semplice pagina web in documento PDF. Utile per salvarci guide dal web (esempio la guida per l’installazione di Arch Linux) oppure articoli da leggere con tranquillità quando siamo offline.
Oggi vedremo un’altra interessante funzionalità, come estrarre immagini da un documento PDF. Se un nostro amico, collega ecc ci ha inviato un documento PDF dal quale vogliamo estrarne le immagini possiamo farlo con molta facilità il tutto direttamente da terminale.
Per far tutto questo utilizzeremo un tool che fa il contrario di wkhtmltopdf ossia crea un html da un documento PDF in modo tale che ne estrarrà le immagini per poi realizzare la pagina web.
Per convertire un PDF in Html utilizzeremo un semplice tool a riga di comando denominato poppler-utils.
Poppler è un tool presente nelle principali distribuzioni Linux per installarlo basta digitare da terminale:
Per Ubuntu, Debian e derivate
sudo apt-get install poppler-utils
Per Fedora
sudo yum install poppler-utils
Per openSUSE
sudo zypper install poppler
Per Arch Linux
sudo pacman -Sy poppler
una volta installato Poppler basta copiare il documento PDF nella home e digitare il seguente comando:
pdftohtml documento.pdf documento.html
esempio per lffl.pdf:
pdftohtml lffl.pdf lffl.html
al termine dell’operazione avremo le immagini dei PDF estratte nella nostra home.