Pagina 1 di 2

[SOFTWARE] OCR

Inviato: dom 20 feb 2011, 11:09
da johnJ
per chi non lo sapesse, gli OCR sono i programmi che convertono un testo scannerizzato in un testo modificabile
dopo anni ne ho trovato uno valido per ubuntu: YAGF
http://www.lffl.org/2011/01/yagf-084-es ... ostre.html
si tratta di un'interfaccia per il programma "cuneiform"
necessita di xsane per scanneirzzare, se no comunque analizza immagini comunque acquisite
come dizionario fa uso di aspell
non ha funzioni avanzate, come imamgini e formattazioni complesse, ma se il dato di partenza è di qualità fa pochi errori che si possono correggere con facilità
l'interfaccia è semplicissima e permette di selezionare le parti come si vuogliono
si salva ODT o HTML, oppure si copia e incolla (mi ci trovo meglio)
lo trovo migliore di gocr, tesseract, ocrad, delle interfacce come ocrfeeder, TCL frontend, xsane e pure degli strumenti online come free ocr
pare che sia in via di sviluppo
speriamo che implementino quanto manca e che magari gli colleghino gimp, come fa scribus, per lavorare sulle immagini
se vi va provatelo e fatemi sapere che ne pensate!

Re: OCR

Inviato: dom 20 feb 2011, 12:51
da donGoGo
grazie per la segnalazione....potrebbe tornare utile per i pdf.

Re: OCR

Inviato: dom 20 feb 2011, 13:17
da johnJ
:cry: non li importa
la cosa che fa meglio è riconoscere files di immagini
ma solo il testo in essi
devono avere 300 dpi
se vuoi modificare un pdf o usi inkscape e fai una pagina per volta o il plugin di openoffice
scribus non ce l'ha ancora
almeno non la versione stabile
magari sai tutto ciò, ma scrivo per tutti :wink:

Re: OCR

Inviato: mar 22 feb 2011, 20:51
da Lazza
Perché migliore di Tesseract? Hai dati comparativi? Adoro gli OCR, sono curioso. :)

Re: OCR

Inviato: mer 23 feb 2011, 0:04
da johnJ
diciamo che oltre ad avere un'interfaccia molto intuitiva sbaglia meno parole, inoltre non necessita che il tutto sia importato bicolore
certo siamo mille anni luce da readiris, non importa colori e immagini, e neppure formattazioni strambe; non va bene per importare una pagina di rivista così come è; però per trasformare una pagina di libro o il testo di un articolo va benone, per me non è peggio dei software professionali, da questo punto di vista
ovviamente devi partire da un'immagine nitida, con almeno 300 DPI e con caratteri decenti, non sottili o smangiucchiati; però questo vale per qualunque OCR
ad ogni modo se lo provi fammi sapere che te ne pare, magari mi sbaglio...

Re: OCR

Inviato: mer 23 feb 2011, 14:59
da Lazza
Che io sappia Tesseract tra quelli open ha il grado di riconoscimento più alto. Ovvio che non ha la GUI, neppure Cuneiform, per quello esistono Gscan2PDF e Kooka. :P Lo voglio provare comunque. ;)

Re: OCR

Inviato: mer 23 feb 2011, 19:34
da johnJ
ennesima GUI per tesseract, oltre a quelle citate da te e da me
http://sourceforge.net/projects/gimager ... les/0.8.1/
adesso provo, ma a me per ora ha dato risultati peggiori di YAGF
vedremo...potremmo fare dei test su qualche imamgine...

Re: OCR

Inviato: dom 13 mar 2011, 13:22
da johnJ
segnalo una versione di cuneiform compilata per un PPA per lucid in via di estinzione
https://launchpad.net/~guido-iodice/+ar ... /+packages
qui c'è di tutto, oltre a cuneiform 1.0
in giro si parla di OCRopus, ma per ora non riesco ad installarlo
dovrebbe essere di ottima qualità...
gIimage reader fa il suo lavoro, comunque; fra le gui di tesseract è quella che mi lavora meglio
testate, gente, testate :D

Re: OCR

Inviato: lun 14 mar 2011, 20:20
da vincenzojrs
Per Windows? C'è qualche cosa?

Re: OCR

Inviato: lun 14 mar 2011, 22:50
da johnJ
on line
http://www.free-ocr.com/
basato su tesseract
http://www.dynamick.it/un-ocr-gratis-da-google-552.html
sempre per tesseract
http://www.programmifree.com/categorie/ocr.htm
ma mi pare ce ne siano anche altri
ovviamente poi se paghi ne hai di eccellenti
però... se passi a linux... almeno in dual boot... :D :mrgreen:

Re: OCR

Inviato: mar 15 mar 2011, 19:51
da vincenzojrs
Mi piacerebbe...ma in casa mia non sono io il più esperto di campo di installazione di sistemi operativi, quindi lascio fare a quelli che lo sanno fare meglio di me.
Scusate per il gioco di parole :roll:

Re: OCR

Inviato: mar 15 mar 2011, 20:32
da Lazza
Ho installato Mandrake (sì, si chiamava ancora Mandrake) circa 7-8 anni fa, quando ero in seconda media, non sapevo neppure cosa fosse una partizione. Ciò significa che chiunque ci può riuscire. :D

Re: OCR

Inviato: mar 15 mar 2011, 20:52
da vincenzojrs
Anche io (tutt' ora) sono in seconda media( te ne aveva già parlato in alcuni MP)!! Ma in casa mia regna la sovranità, quindi mi devo sottomettere e quindi non posso fare altro che navigare su internet, chattare e gimpare: la mia cosa preferita!

Re: OCR

Inviato: mar 15 mar 2011, 21:16
da Lazza
Installati una virtual machine con Virtualbox. Zero rischi e tanti vantaggi. :) Oppure ancora meglio con LiLi che ti fa sia liveusb che VirtualBox. ;) http://www.linuxliveusb.com/

Re: OCR

Inviato: mar 15 mar 2011, 21:47
da johnJ
ovviamente se i legittimi proprietari del pc non vogliono non puoi installare nulla
però ad esempio se ti scarichi linuxmint (o ubuntu, ma meglio mint per questa operazione) puoi farla funzionare dal cd senza installare niente
così fai pratica
quando i tuoi saranno d'accordo potrai installare ubuntu in dual boot
in pratica potrai far partire il pc o con windows o con linux ogni volta