User Guide    Modifica dei PDF    OCR (riconoscimento ottico dei caratteri)

OCR (riconoscimento ottico dei caratteri)

Usare OCR in PDFpen

OCR (Optical Character Recognition) è il processo di conversione di un'immagine bitmap di testo (come un documento scansionato) in testo che può essere selezionato, copiato e cercato da PDFpen e altri software di editing del testo. Una volta che il testo è stato riconosciuto dall'OCR, viene messo su un livello invisibile sopra l'immagine del testo che si può vedere. Quando si copia del testo, il testo viene copiato da questo livello OCR invisibile. La tecnologia OCR non produrrà una resa perfetta del testo bitmap. Dovrai rileggere e modificare il testo che risulta dall'OCR.

OCR automatico

  1. Aprire un PDF scansionato in PDFpen.
  2. Si apre una casella di avviso con il messaggio:
    "Questo documento sembra essere stato scannerizzato. Vuoi eseguire il riconoscimento ottico dei caratteri (OCR) su di esso? L'OCR ti permetterà di selezionare il testo".
  3. Avete tre opzioni:
  • Annulla: Non verrà eseguito alcun OCR.
  • Pagina OCR: L'OCR verrà eseguito sulla pagina corrente.
  • Documento OCR: Se il tuo documento ha più pagine, l'OCR verrà eseguito su tutte le pagine.

Scegli quali lingue sono riconosciute dall'OCR in Preferenze > OCR. (Preferenze utente).

Mentre PDFpen sta eseguendo l'OCR, apparirà una barra di progresso. L'operazione può richiedere pochi secondi o molto più tempo, a seconda delle dimensioni e del contenuto del documento scansionato.

OCR manuale

Per eseguire l'OCR manualmente, scegliete Edit > OCR Page. PDFpen inizia ad eseguire l'operazione OCR e appare la barra di avanzamento.

Forzare l'OCR

PDFpen guarda il documento e se vede un'immagine delle dimensioni di una pagina, suppone che il documento sia una scansione e si offre automaticamente di eseguire l'OCR. In alcuni casi, PDFpen potrebbe non riconoscere un documento scansionato. Sotto il menu Modifica, Pagina OCR sarà in grigio e non disponibile per la selezione.

  1. Tenere premuti insieme i tasti Comando e Opzione.
  2. Scegliere Modifica > Pagina OCR dal menu.

OCR in serie

(Funzione avanzata di PDFpenPro). Vedere Batch OCR.

Suggerimenti per migliorare i risultati OCR

  • La qualità del documento originale influisce sulla qualità delle prestazioni dell'OCR. Originali nitidi e puliti con testo chiaro produrranno risultati molto migliori di fotocopie sgualcite e sbiadite.
  • Mettete il vostro documento originale sullo scanner il più diritto possibile. Se avete una pagina scannerizzata che non è diritta, potete "allineare", o raddrizzare, l'immagine in PDFpen scegliendo Edit > Deskew e Adjust Image...
  • Aumentate il contrasto del vostro documento scansionato in modo che lo sfondo sia il più bianco possibile. Potete regolare il contrasto dell'immagine scegliendo Edit > Deskew e Adjust Image...

Dizionari e OCR

I dizionari medici e legali sono inclusi nel motore OCR di PDFpenper migliorare la qualità dell'output OCR per i documenti scansionati riconoscendo le parole specifiche delle professioni mediche e legali. Questa funzione è integrata, quindi non c'è bisogno di attivare o regolare alcuna impostazione. Se si sceglie di modificare il testo OCR, le parole sbagliate per il testo selezionato possono essere visualizzate con una sottolineatura ghirigia rossa.