[SOFTWARE] OCR
per chi non lo sapesse, gli OCR sono i programmi che convertono un testo scannerizzato in un testo modificabile
dopo anni ne ho trovato uno valido per ubuntu: YAGF
http://www.lffl.org/2011/01/yagf-084-es ... ostre.html
si tratta di un'interfaccia per il programma "cuneiform"
necessita di xsane per scanneirzzare, se no comunque analizza immagini comunque acquisite
come dizionario fa uso di aspell
non ha funzioni avanzate, come imamgini e formattazioni complesse, ma se il dato di partenza è di qualità fa pochi errori che si possono correggere con facilità
l'interfaccia è semplicissima e permette di selezionare le parti come si vuogliono
si salva ODT o HTML, oppure si copia e incolla (mi ci trovo meglio)
lo trovo migliore di gocr, tesseract, ocrad, delle interfacce come ocrfeeder, TCL frontend, xsane e pure degli strumenti online come free ocr
pare che sia in via di sviluppo
speriamo che implementino quanto manca e che magari gli colleghino gimp, come fa scribus, per lavorare sulle immagini
se vi va provatelo e fatemi sapere che ne pensate!
dopo anni ne ho trovato uno valido per ubuntu: YAGF
http://www.lffl.org/2011/01/yagf-084-es ... ostre.html
si tratta di un'interfaccia per il programma "cuneiform"
necessita di xsane per scanneirzzare, se no comunque analizza immagini comunque acquisite
come dizionario fa uso di aspell
non ha funzioni avanzate, come imamgini e formattazioni complesse, ma se il dato di partenza è di qualità fa pochi errori che si possono correggere con facilità
l'interfaccia è semplicissima e permette di selezionare le parti come si vuogliono
si salva ODT o HTML, oppure si copia e incolla (mi ci trovo meglio)
lo trovo migliore di gocr, tesseract, ocrad, delle interfacce come ocrfeeder, TCL frontend, xsane e pure degli strumenti online come free ocr
pare che sia in via di sviluppo
speriamo che implementino quanto manca e che magari gli colleghino gimp, come fa scribus, per lavorare sulle immagini
se vi va provatelo e fatemi sapere che ne pensate!
Re: OCR
grazie per la segnalazione....potrebbe tornare utile per i pdf.
Re: OCR
non li importa
la cosa che fa meglio è riconoscere files di immagini
ma solo il testo in essi
devono avere 300 dpi
se vuoi modificare un pdf o usi inkscape e fai una pagina per volta o il plugin di openoffice
scribus non ce l'ha ancora
almeno non la versione stabile
magari sai tutto ciò, ma scrivo per tutti
la cosa che fa meglio è riconoscere files di immagini
ma solo il testo in essi
devono avere 300 dpi
se vuoi modificare un pdf o usi inkscape e fai una pagina per volta o il plugin di openoffice
scribus non ce l'ha ancora
almeno non la versione stabile
magari sai tutto ciò, ma scrivo per tutti
Re: OCR
Perché migliore di Tesseract? Hai dati comparativi? Adoro gli OCR, sono curioso.
Re: OCR
diciamo che oltre ad avere un'interfaccia molto intuitiva sbaglia meno parole, inoltre non necessita che il tutto sia importato bicolore
certo siamo mille anni luce da readiris, non importa colori e immagini, e neppure formattazioni strambe; non va bene per importare una pagina di rivista così come è; però per trasformare una pagina di libro o il testo di un articolo va benone, per me non è peggio dei software professionali, da questo punto di vista
ovviamente devi partire da un'immagine nitida, con almeno 300 DPI e con caratteri decenti, non sottili o smangiucchiati; però questo vale per qualunque OCR
ad ogni modo se lo provi fammi sapere che te ne pare, magari mi sbaglio...
certo siamo mille anni luce da readiris, non importa colori e immagini, e neppure formattazioni strambe; non va bene per importare una pagina di rivista così come è; però per trasformare una pagina di libro o il testo di un articolo va benone, per me non è peggio dei software professionali, da questo punto di vista
ovviamente devi partire da un'immagine nitida, con almeno 300 DPI e con caratteri decenti, non sottili o smangiucchiati; però questo vale per qualunque OCR
ad ogni modo se lo provi fammi sapere che te ne pare, magari mi sbaglio...
Re: OCR
Che io sappia Tesseract tra quelli open ha il grado di riconoscimento più alto. Ovvio che non ha la GUI, neppure Cuneiform, per quello esistono Gscan2PDF e Kooka. Lo voglio provare comunque.
Re: OCR
ennesima GUI per tesseract, oltre a quelle citate da te e da me
http://sourceforge.net/projects/gimager ... les/0.8.1/
adesso provo, ma a me per ora ha dato risultati peggiori di YAGF
vedremo...potremmo fare dei test su qualche imamgine...
http://sourceforge.net/projects/gimager ... les/0.8.1/
adesso provo, ma a me per ora ha dato risultati peggiori di YAGF
vedremo...potremmo fare dei test su qualche imamgine...
Re: OCR
segnalo una versione di cuneiform compilata per un PPA per lucid in via di estinzione
https://launchpad.net/~guido-iodice/+ar ... /+packages
qui c'è di tutto, oltre a cuneiform 1.0
in giro si parla di OCRopus, ma per ora non riesco ad installarlo
dovrebbe essere di ottima qualità...
gIimage reader fa il suo lavoro, comunque; fra le gui di tesseract è quella che mi lavora meglio
testate, gente, testate
https://launchpad.net/~guido-iodice/+ar ... /+packages
qui c'è di tutto, oltre a cuneiform 1.0
in giro si parla di OCRopus, ma per ora non riesco ad installarlo
dovrebbe essere di ottima qualità...
gIimage reader fa il suo lavoro, comunque; fra le gui di tesseract è quella che mi lavora meglio
testate, gente, testate
-
- Moderatore
- Messaggi:883
- Iscritto il:ven 12 nov 2010, 18:56
- Contatta:
Re: OCR
Per Windows? C'è qualche cosa?
Re: OCR
on line
http://www.free-ocr.com/
basato su tesseract
http://www.dynamick.it/un-ocr-gratis-da-google-552.html
sempre per tesseract
http://www.programmifree.com/categorie/ocr.htm
ma mi pare ce ne siano anche altri
ovviamente poi se paghi ne hai di eccellenti
però... se passi a linux... almeno in dual boot...
http://www.free-ocr.com/
basato su tesseract
http://www.dynamick.it/un-ocr-gratis-da-google-552.html
sempre per tesseract
http://www.programmifree.com/categorie/ocr.htm
ma mi pare ce ne siano anche altri
ovviamente poi se paghi ne hai di eccellenti
però... se passi a linux... almeno in dual boot...
-
- Moderatore
- Messaggi:883
- Iscritto il:ven 12 nov 2010, 18:56
- Contatta:
Re: OCR
Mi piacerebbe...ma in casa mia non sono io il più esperto di campo di installazione di sistemi operativi, quindi lascio fare a quelli che lo sanno fare meglio di me.
Scusate per il gioco di parole
Scusate per il gioco di parole
Re: OCR
Ho installato Mandrake (sì, si chiamava ancora Mandrake) circa 7-8 anni fa, quando ero in seconda media, non sapevo neppure cosa fosse una partizione. Ciò significa che chiunque ci può riuscire.
-
- Moderatore
- Messaggi:883
- Iscritto il:ven 12 nov 2010, 18:56
- Contatta:
Re: OCR
Anche io (tutt' ora) sono in seconda media( te ne aveva già parlato in alcuni MP)!! Ma in casa mia regna la sovranità, quindi mi devo sottomettere e quindi non posso fare altro che navigare su internet, chattare e gimpare: la mia cosa preferita!
Re: OCR
Installati una virtual machine con Virtualbox. Zero rischi e tanti vantaggi. Oppure ancora meglio con LiLi che ti fa sia liveusb che VirtualBox. http://www.linuxliveusb.com/
Re: OCR
ovviamente se i legittimi proprietari del pc non vogliono non puoi installare nulla
però ad esempio se ti scarichi linuxmint (o ubuntu, ma meglio mint per questa operazione) puoi farla funzionare dal cd senza installare niente
così fai pratica
quando i tuoi saranno d'accordo potrai installare ubuntu in dual boot
in pratica potrai far partire il pc o con windows o con linux ogni volta
però ad esempio se ti scarichi linuxmint (o ubuntu, ma meglio mint per questa operazione) puoi farla funzionare dal cd senza installare niente
così fai pratica
quando i tuoi saranno d'accordo potrai installare ubuntu in dual boot
in pratica potrai far partire il pc o con windows o con linux ogni volta