gImageReader: Scansione testo OCR su Ubuntu 0.7
gImageReader è una seplice applicazione per eseguire scansioni di testo in documenti o immagini. gImageReader è una GUI di Tesseract OCR, un’applicazione dedicata alla conversione di un’immagine contenente testo in testo modificabile con un normale programma di videoscrittura. Tesseract OCR si avvale dei progressi dell’intelligenza artificiale e dell’evoluzione degli algoritmi legati al riconoscimento delle immagini.
L’utilizzo è semplicissimo avviamo l’applicazione, per farlo avviamo il terminale e digitiamo
gimagereader
una volta avviata clicchiamo su “OpenImage” e selezioniamo il Documento Pdf o l’immagine da scansionare, selezioniamo delle aree particolari (in caso si voglia scansionare una parte dell’immagine o documento) e impostiamo la lingua di riconoscimento. Il testo riconosciuto verrà visualizzato in una finestra di editor dove può essere corretto, salvato su disco o copiato negli appunti.
Per installare gImageReader su Ubuntu, Debian o Fedora basta scaricare il pacchetto dal link posto sotto e cliccarci sopra e confermare.
Installato gImageReader dovremo aggiungere la scansione per lingua italiana (in caso il testo da scansione sia in italiano) per farlo avviamo il terminale e digitiamo:
sudo apt-get install tesseract-ocr-ita
e confermiamo
download gimagereader_0.7-2_all.deb