Il Blog del Tempo Libero
17 gen
Avete una lunga relazione da trascrivere sul pc ma non avete nè il tempo nè la voglia?
Allora Tesseract è il programma che fa al caso vostro!
Tesseract è un software open source rilasciato da google perfetto per la nostra ubuntu.
Vediamo subito come possiamo utilizzarlo per risolvere il nostro problema:
Per prima cosa dobbiamo installarlo. Basta cercare il pacchetto “tesseract-ocr” con synaptic. Tesseract è nei repository universe. Inoltre possiamo installare anche i pacchetti per altre lingue come quella italiana “tesseract-ocr-ita“.
Usiamo Xsane per scannerizzare le nostre immagini, acquisiamole in bianco e nero (non scala di grigi) usando almeno 250-300 dpi e salviamole in formato .tiff.
A questo punto apriamo il terminale, spostiamoci nella directory in cui abbiamo salvato l’immagine e digitiamo il seguente comando:
tesseract nome_immagine.tiff risultato
Verrà creato un file .txt di nome “risultato” nella stessa directory.
Qui il sito ufficiale del progetto.
Remastersys: Backup della nostra Ubuntu su CD Live
2 Responses for "Tesseract OCR"
ciao ,per chi volesse analizzare gruppi di immagini può provare questo freeware ‘as is’ (per windows… ma sarebbe possibile anche farlo con mono..) può vedere qua http://ocrfreeware.somee.com,
Thank you for a great blog, I will be sure to bookmark your site and check back later
Leave a reply