Tesseract-GUI software OCR in Ubuntu Linux e derivate
Semplice e davvero molto utile Tesseract-GUI è un’ottimo software per il riconoscimento ottico dei caratteri (OCR) che richiede pochissimi mb di RAM e può funzionare in qualsiasi ambiente desktop. Grazie al pacchetto creato da noi, avremo già a disposizione il supporto per la lingua italiana e inglese oltre ad importare i più diffusi formati di immagini digitali come jpeg, png ecc.
– Installare Tesseract-GUI
Tesseract-GUI è disponibile per Ubuntu e derivate scaricando il pacchetto deb da questa pagina. Per Debian Stabile (e derivate) basta installare il pacchetto per Ubuntu 12.04 Precise mentre per Debian Testing e SID possiamo installare il pacchetto per Ubuntu 14.04 Trusty LTS.
Una volta scaricato il pacchetto deb basta dare un doppio click su di esso e confermare l’installazione, al termine basta avviare il software da menu.
Se dobbiamo effettuare la scansione OCR di libri antichi in italiano consiglio di installare il pacchetto tesseract-ocr-ita-old digitando da terminale:
sudo apt-get install tesseract-ocr-ita-old
e confermiamo.
Tesseract-GUI è disponibile anche per Arch Linux attraverso AUR.