[Linux-Biella] PDF OCR

Mar 10 Gen 2012 15:17:06 CET


On 10/01/2012 15:10, Remotes wrote:
> Alle 14:30 di martedì 10 gennaio 2012, Jumping Jack ha scritto:
>> On 10/01/2012 14:31, Daniele Segato wrote:
>>> io però dubito di aver capito da cosa parti / a cosa vuoi arrivare
>> Da un PDF composto da immagini digitalizzate ad un PDF con la stessa
>> struttura ma solo grafici e disegni digitali e il testo in caratteri.
> Il programma in questione, quindi, dovrebbe riconoscere l'area in cui c'è il
> disegno, ritagliarlo ed utilizzarlo come immagine che andrà poi inserita nel
> nuovo file nella giusta posizione?
Si, come detto, i programmi che indicizzano lo fanno senza problemi.
Ho provato anche un'altra cosa, dato che Google fornisce gratuitamente 
la conversione di un PDF in un PDF OCR, ho provato a splittare il file e 
mandare 30 pagine (dato che il max è 2Mb). Ma fa pietà, e dove c'è un 
disegno non converte.
Il sistema è sfruttato da molti, anche da programmi che scarichi, tanto 
Google indicizza tutto per cui tutto quello che passa per loro sono dati 
in più.

JJ