[SOFTWARE] OCR
dopo lunghi test ho concluso che OCRFeeder con cuneiform può salvare una pagina con immagini al posto giusto e altro: è il migliore; importa anche i pdf ma mi crasha se importo una cartella di immagini
Gscan2PDF è dotato di richiamo a gimp ma salva le immagini a caso (almeno io non ho fatto di meglio) e se ci sono immagini non riconosce il testo...
GImagereader legge anche documenti non perfetti e funge bene su più pagine ma ne fa un testo unico
ha il "cerca e sostituisci" che è molto comodo
lector è un'ottima GUI per tesseract e salva le immagini ma o in fondo o all'inizio del documento
YAGF va bene ma ha poche opzioni; ha però la possibilità di analizzare tutte le pagine e salvarle come untesto unico
sia tesseract che cuneiform sono da scaricare dal sito sopra indicato perché sono più aggiornati, e occorre far presto perché fra poco non ci saranno più
se il documento è in buono stato van bene già 300 DPI
comunque ho scaricato i files (ma solo di alcune lingue) sul pc, se serviranno ditemelo
Gscan2PDF è dotato di richiamo a gimp ma salva le immagini a caso (almeno io non ho fatto di meglio) e se ci sono immagini non riconosce il testo...
GImagereader legge anche documenti non perfetti e funge bene su più pagine ma ne fa un testo unico
ha il "cerca e sostituisci" che è molto comodo
lector è un'ottima GUI per tesseract e salva le immagini ma o in fondo o all'inizio del documento
YAGF va bene ma ha poche opzioni; ha però la possibilità di analizzare tutte le pagine e salvarle come untesto unico
sia tesseract che cuneiform sono da scaricare dal sito sopra indicato perché sono più aggiornati, e occorre far presto perché fra poco non ci saranno più
se il documento è in buono stato van bene già 300 DPI
comunque ho scaricato i files (ma solo di alcune lingue) sul pc, se serviranno ditemelo
-
- Moderatore
- Messaggi:883
- Iscritto il:ven 12 nov 2010, 18:56
- Contatta:
Re: OCR
Ehm...il leggittimo proprietario sono io
Ma niente...i miei non vogliono.
Comuque grazie per le informazioni
Ma niente...i miei non vogliono.
Comuque grazie per le informazioni
Re: OCR
JohnJ, scrivi un articolo sugli OCR e mettiamolo nel blog.
viwooshprogrammator, allora usa LiLi e vivi felice.
viwooshprogrammator, allora usa LiLi e vivi felice.
Re: OCR
Quello che è qui, però scritto tutto assieme, corredato da immagini, esempi... Boh vedi tu.
-
- Moderatore
- Messaggi:883
- Iscritto il:ven 12 nov 2010, 18:56
- Contatta:
Re: OCR
Per windows c'è FreeOCR 3.0
Re: OCR
scusate, ma ho molto da fare
non sono stato del tutto con le mani in mano
comunque anche quando un ocr piazza le imamgini fuori posto va bene, anzi potrebbe essere migliore se permette di scansionare anche testi e immagini mescolati
al momento non riesco a fare un tutorial... devo posticipare
è una cosa molto complessa
secodno me se fate prove varie magari mi date anche idee
non sono stato del tutto con le mani in mano
comunque anche quando un ocr piazza le imamgini fuori posto va bene, anzi potrebbe essere migliore se permette di scansionare anche testi e immagini mescolati
al momento non riesco a fare un tutorial... devo posticipare
è una cosa molto complessa
secodno me se fate prove varie magari mi date anche idee
Re: OCR
No, scemo io che non ci avevo fatto caso... XD Metti qualche screenshot dai, così si vede subito la gui che mi sembra ottima.
Re: OCR
ho dei problemi di copyright, per fare un documento serio
per pagine con testo e illustrazioni non è male anche lector
con lector il lavoro è velocissimo ma usa per gli spazi vuoti lo spazio, ocr feeder necessita di maggiori accorgimenti ma mette il tutto in una cornice, e consente di scegliere font e formatazione, anche se poi sballa per problemi di spaziatura
lector mette le illustrazioni in fondo anche se non lo sono e poi si devono spostare; le parole finiscono circa a posto, la formattazione si fa poi con il programma che si usa per aprire il file salvato
in entrambi i casi si devono usare finestre diverse per testi e illustrazioni
per soli testi senza illustrazioni gli altri ocr sono validi
per pagine con testo e illustrazioni non è male anche lector
con lector il lavoro è velocissimo ma usa per gli spazi vuoti lo spazio, ocr feeder necessita di maggiori accorgimenti ma mette il tutto in una cornice, e consente di scegliere font e formatazione, anche se poi sballa per problemi di spaziatura
lector mette le illustrazioni in fondo anche se non lo sono e poi si devono spostare; le parole finiscono circa a posto, la formattazione si fa poi con il programma che si usa per aprire il file salvato
in entrambi i casi si devono usare finestre diverse per testi e illustrazioni
per soli testi senza illustrazioni gli altri ocr sono validi
Re: OCR
Be' di preservare alla perfezione il layout non mi interessa, anche perché sappiamo bene che è difficile e non viene mai bene, l'importante è che scannerizzi e automatizzi un po' il discorso di riconoscere le colonne o roba simile.
Re: OCR
prima di procedere con l'ocr potrebbe essere utile utilizzare scan tailor
http://gimpitalia.it/forum/viewtopic.ph ... 655#p35655
http://gimpitalia.it/forum/viewtopic.ph ... 655#p35655