Come estrapolare il testo di un file pdf con FreeOCR

Naviga SWZ: Home Page » How To
News del 20 Settembre 16 Autore: Fabio Ferraro
FreeOCR è un software gratuito, disponibile in ambiente Windows, che permette di utilizzare la tecnologia OCR per esportare il contenuto testuale di un file pdf o di un’immagine. Questo software, anche se non localizzato in italiano, risulta semplice da utilizzare e adatto quindi anche ad utenti meno esperti. 
Il layout è intuitivo e leggero e si suddivide in due sezioni che si sviluppano in verticale: la sezione di sinistra è dedicata all’anteprima del file da cui vorremo estrapolare il testo mentre, quella di destra mostra il testo ricavato.

Come estrapolare il testo di un file pdf con FreeOCR - immagine 1

Le due sezioni sono divise da una barra degli strumenti che permette di eliminare il testo estrapolato, salvarlo in un file txt, eliminarne tutte le interruzioni di pagina, copiarlo negli appunti di Windows, esportarlo in Microsoft Word o in RTF o modificarne il modificarne la formattazione.

Come estrapolare il testo di un file pdf con FreeOCR - immagine 2

La barra degli strumenti posta nella parte superiore della finestra consentirà invece di scegliere la fonte del file dq cui estrapolare il testo. Potremo infatti lavorare su un file proveniente da uno scanner o aprire un’immagine o un PDF. Un file potrà essere composto da una o più pagine: per navigare nel documento da estrapolare, potremo utilizzare i comandi che affiancano l’anteprima del file. Per avviare lo strumento OCR, basterà cliccare sull’apposita icona. Avremo la possibilità di effettuare lo scan della pagina corrente o dell’intero documento. Dal menu a tendina “OCR Language” potremo selezionare la lingua di riconoscimento dell’OCR. Infine, potremo salvare il documento anche in formato JPG, cliccando sul tasto “Save JPG”.

Come estrapolare il testo di un file pdf con FreeOCR - immagine 3

Il riconoscimento del testo, per quanto ben sviluppato, non riesce sempre ad offrire un’estrapolazione perfetta. Saremo quindi spesso costretti ad intervenire manualmente, correggendo le porzioni di testo non riconosciute correttamente, modificandole direttamente dalla sezione di anteprima o anche sul documento esportato in formato TXT, RTF o doc.
 FreeOCR è un buono strumento per l’estrapolazione di testo, semplice da utilizzare e completamente gratuito.

La Community di SWZone.it

La community con le risposte che cerchi ! Partecipa é gratis !
Iscrizione ForumIscriviti al Forum

Newsletter

Vuoi ricevere tutti gli aggiornamenti di SWZone direttamente via mail ?
Iscrizione NewsletterIscriviti alla Newsletter

NOTIZIE CORRELATE