gImageReader: interesante herramienta OCR para PDFs e imágenes

gimagereader-image11

El reconocimiento óptico de caracteres (OCR) es un proceso que nos permite extraer texto de imágenes o archivos PDF, es muy utilizado a la hora de digitalizar documentos, y nos permite ahorrar bastante tiempo en este tipo de tareas y seguramente algún dolor de cabeza 🙂

Tesseract es posiblemente el motor OCR libre, más potente del mercado, originalmente diseñada por Hewlett-Packard y en los últimos años mantenido por Google, cuenta con varias interfaces gráficas para facilitar su manejo, como es el caso de gImageReader, un frontend GTK.

gImageReader está diseñado para ser fácil de usar, reconoce multitud de lenguajes,  y con el podemos importar imágenes de nuestros discos, del portapapeles, dispositivos externos como puede ser un escáner e incluso realizar capturas de pantallas.

Es tan simple como cargar la imagen, y darle al botón de “recognize” (ahí podemos seleccionar el idioma del texto a extraer).

gimagereader-image13

Aunque también tenemos una cuantas opciones avanzadas que nos podrían interesar usar como el zoom, rotación de imágen, controles de brillo y contraste, ademas de detección automática del diseño o selección manual de regiones de texto.

gimagereader-image12

Al igual que la mayoría de aplicaciones OCR el resultado no es perfecto, es posible que tengáis que corregir algún caracter (y sí!… también incluye alguna herramienta para eso!)

Instalacion de gImageReader

  • En Ubuntu y derivadas como Linux Mint
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-spa tesseract-ocr-eng
  • En openSUSE

Nos vamos a 1-click install y elegimos la versión de gImageReader correspondiente a nuestra distribución

gimagereader-image14

hacemos click y como siempre nos dejamos llevar por el instalador de YaST

gimagereader-image15

Finalizada la instalación  de gImageReader, abrimos el gestor de software e instalamos tesseract y los idiomas que consideremos necesarios

gimagereader-image16

  • Arch Linux y derivadas como Manjaro, ArchBang o Antergos pueden descargar gImageReader desde AUR e instalarlo con
yaourt -S gimagereader

si no tenemos tesseract instalado, toca ejecutar:

sudo pacman -S tesseract tesseract-data-eng tesseract-data-spa
  • En cuanto a los usuarios de Fedora lo pueden instalar ejecutando como root:
yum install  tesseract tesseract-langpack-es gimagereader

 

Vía | lffl

10 thoughts on “gImageReader: interesante herramienta OCR para PDFs e imágenes”

  1. portaro says:

    Lo desconocia y paso a conocerlo, excelente post.

  2. Juanca_Cba says:

    Se probará en breve suponiendo que el paquete de Fedora funcione por aquí.
    La única parte que no me gusta es la que dice “y en los últimos años mantenido por Google” lo cual me lleva a desconfiar de su código.
    Tal vez debería decir “y en los últimos años modificada para espiarte por Google”.
    Gracias por el aporte.

    1. Carlos Rainbowarrior Orbayo says:

      Coincido. Pero probablemente los de google lo usen para si archivo de libros digitales.

  3. laudelinux says:

    Pues si el original no esta mal el resultado es de puta madre. He probado con varios pdf, incluida imágenes y va cojonudo, obviamente hay que retocarlo un poco, pero que coño, genial. Muchas gracias por la info amigo.

  4. dmacias says:

    Muchas veces que lo he necesitado y no sabia de su existencia, me lo apunto para la proxima replicante

    Un saludo 🙂

  5. jesushernandoguerrero says:

    En las otras opensuse 12.1 o 12.2 no se puede instalar este programa ocr? gracias.

  6. alunado says:

    un front-end para Kde hay-existe ?

  7. Polanco says:

    Estoy muy agradecido por tan excelente programa. Bendiciones de Dios y sigan adelante

    1. tannhausser says:

      De nada amigo! Un saludo y gracias a ti por pasarte y comentar!

  8. Jose L. says:

    Va genial en Linux Mint 17.2 32 bits. Muchas gracias y a seguir

Deja un comentario