¿Conocen algún programa ocr para pasar de jpg a texto?

  • javierreta
Escrito el 10 Marzo, 2010 - 16:59

Recientemente me compartieron una carpeta con imágenes en jpg de un libro escaneado. Pensé pasarlo a PDF, pero sería un archivo muy pesado, además de que, por ejemplo, si quiero que festival lo lea no podría, pues son imágenes, así que me pregunto ¿Existe algún programa OCR para Mandriva que pase las imágenes en jpg a texto?

Gracias, de antemano

Opciones de visualización de comentarios

Seleccione la forma que desee de mostrar los comentarios y haga clic en «Guardar opciones» para activar los cambios.

.

  • Gravatar de vfmBOFH
  • vfmBOFH
  • 12/29/09
  • 10 Marzo, 2010 - 18:02

Prueba con ClaraOCR. Está en los repos

[root@server ~]# urpmq -i clara
Name        : clara
Version     : 0.20031214
Release     : 3mdv2008.1
Group       : Graphics
Size        : 731002                       Architecture: x86_64
Source RPM  : clara-0.20031214-3mdv2008.1.src.rpm
URL         : http://www.geocities.com/claraocr
Summary     : An OCR (Optical Character Recognition) program
Description :
Clara OCR is intended for large scale digitalization projects.
It features a powerful GUI and a web interface for cooperative
digitalization of books. Clara OCR development started in 1999
and we're approaching production level.

[root@server ~]#
--

Atentamente,

La voz ésa del interior de tu cabeza que oyes cuando lees algo.

La URL de Geocities está muerta

  • Gravatar de javierreta
  • javierreta
  • 06/15/06
  • 10 Marzo, 2010 - 22:55

Pero su página oficial al parecer es http://www.claraocr.org/ desde donde se pueden descargar las fuentes.

--

___________
Necesitas instalar un interfaz RTFM

Siempre decepcionado por el

  • Gravatar de inot
  • inot
  • 10/12/07
  • 10 Marzo, 2010 - 22:25

Siempre decepcionado por el tema de ocr en Linux, veia una luz de esperanza proyectada por Vfmmeo, pero de momento, lo unico que me ha tirado clara (desde terminal), es una violación de segmento.:-(

Indagaré mas a ver...

De momento me conformo con el Fine reader que viene con mi escanner, usandolo en Virtualbox.

--


Al que está sentado en el trono, y al Cordero, sea la alabanza, la honra, la gloria
y el dominio por los siglos de los siglos.

Linux user #463168

Mira de cuándo es el paquete...

  • Gravatar de vfmBOFH
  • vfmBOFH
  • 12/29/09
  • 10 Marzo, 2010 - 22:33

Tal vez las nuevas versiones compiladas furulen algo mejor...

--

Atentamente,

La voz ésa del interior de tu cabeza que oyes cuando lees algo.

La acabo de bajar y compilar,

  • Gravatar de inot
  • inot
  • 10/12/07
  • 11 Marzo, 2010 - 19:20

La acabo de bajar y compilar, me tira el mismo error...Buahhhhhh!!!

--


Al que está sentado en el trono, y al Cordero, sea la alabanza, la honra, la gloria
y el dominio por los siglos de los siglos.

Linux user #463168

Hay varios en Mandriva

  • Gravatar de franciscodrake
  • franciscodrake
  • 09/01/04
  • 11 Marzo, 2010 - 03:15

Por ejemplo Gocr, Ocrad y Ocropus pero el reconocimiento es muy pobre. Creo que es mejor el Fine Reader como dice el bueno de Inot.

--

Un BOFH aprendiz de todos Linux user 469232
Usa el IRC de Blogdrake coopera con otros usuarios en vivo.

Muchas Gracias

  • Gravatar de javierreta
  • javierreta
  • 06/15/06
  • 11 Marzo, 2010 - 20:13

Probaré alguno de los que mencionas. Se puede cerrar este hilo.

--

___________
Necesitas instalar un interfaz RTFM

Opciones de visualización de comentarios

Seleccione la forma que desee de mostrar los comentarios y haga clic en «Guardar opciones» para activar los cambios.