gImageReader: interesante herramienta OCR para PDFs e imágenes

El reconocimiento óptico de caracteres (OCR) es un proceso que nos permite extraer texto de imágenes o archivos PDF, es muy utilizado a la hora de digitalizar documentos, y nos permite ahorrar bastante tiempo en este tipo de tareas y seguramente algún dolor de cabeza 🙂

Tesseract es posiblemente el motor OCR libre, más potente del mercado, originalmente diseñada por Hewlett-Packard y en los últimos años mantenido por Google, cuenta con varias interfaces gráficas para facilitar su manejo, como es el caso de gImageReader, un frontend GTK.

gImageReader está diseñado para ser fácil de usar, reconoce multitud de lenguajes, y con el podemos importar imágenes de nuestros discos, del portapapeles, dispositivos externos como puede ser un escáner e incluso realizar capturas de pantallas.

Es tan simple como cargar la imagen, y darle al botón de «recognize» (ahí podemos seleccionar el idioma del texto a extraer).

Aunque también tenemos una cuantas opciones avanzadas que nos podrían interesar usar como el zoom, rotación de imágen, controles de brillo y contraste, ademas de detección automática del diseño o selección manual de regiones de texto.

Al igual que la mayoría de aplicaciones OCR el resultado no es perfecto, es posible que tengáis que corregir algún caracter (y sí!… también incluye alguna herramienta para eso!)

Instalacion de gImageReader

En Ubuntu y derivadas como Linux Mint

sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-spa tesseract-ocr-eng

En openSUSE

Nos vamos a 1-click install y elegimos la versión de gImageReader correspondiente a nuestra distribución

hacemos click y como siempre nos dejamos llevar por el instalador de YaST

Finalizada la instalación de gImageReader, abrimos el gestor de software e instalamos tesseract y los idiomas que consideremos necesarios

Arch Linux y derivadas como Manjaro, ArchBang o Antergos pueden descargar gImageReader desde AUR e instalarlo con

yaourt -S gimagereader

si no tenemos tesseract instalado, toca ejecutar:

sudo pacman -S tesseract tesseract-data-eng tesseract-data-spa

En cuanto a los usuarios de Fedora lo pueden instalar ejecutando como root:

yum install  tesseract tesseract-langpack-es gimagereader

Vía | lffl

28 pensamientos en “gImageReader: interesante herramienta OCR para PDFs e imágenes”

portaro 3 mayo, 2014

Lo desconocia y paso a conocerlo, excelente post.

Juanca_Cba 4 mayo, 2014

Se probará en breve suponiendo que el paquete de Fedora funcione por aquí.
La única parte que no me gusta es la que dice «y en los últimos años mantenido por Google» lo cual me lleva a desconfiar de su código.
Tal vez debería decir «y en los últimos años modificada para espiarte por Google».
Gracias por el aporte.

Carlos Rainbowarrior Orbayo 4 mayo, 2014

Coincido. Pero probablemente los de google lo usen para si archivo de libros digitales.

laudelinux 4 mayo, 2014

Pues si el original no esta mal el resultado es de puta madre. He probado con varios pdf, incluida imágenes y va cojonudo, obviamente hay que retocarlo un poco, pero que coño, genial. Muchas gracias por la info amigo.

dmacias 4 mayo, 2014

Muchas veces que lo he necesitado y no sabia de su existencia, me lo apunto para la proxima replicante

Un saludo 🙂

jesushernandoguerrero 4 mayo, 2014

En las otras opensuse 12.1 o 12.2 no se puede instalar este programa ocr? gracias.

alunado 7 mayo, 2014

un front-end para Kde hay-existe ?

Polanco 15 junio, 2015

Estoy muy agradecido por tan excelente programa. Bendiciones de Dios y sigan adelante

tannhausser Autor15 junio, 2015

De nada amigo! Un saludo y gracias a ti por pasarte y comentar!

Jose L. 24 noviembre, 2015

Va genial en Linux Mint 17.2 32 bits. Muchas gracias y a seguir

aldobelus 28 febrero, 2017

Estaba usando OcrFeeder, que también usa Tesseract y me había dado un gran resultado en otra distribución, no recuerdo cuál, y en Manjaro, la que tengo ahora, no iba ni bien ni mal, nada. Pues ha sido hacerte caso con el gImageReader y va de cine. Solo el detalle que es un GTK como la copa de un pino y uso KDE, pero tampoco soy tan purista, vamos. Si me hace el apaño, encantado de haberte conocido.

Tengo un montonazo de PDF con imágenes que no había manera de sacarles el texto y acabo de adelantar lo que no está escrito… ¡Qué gusto tener programas que funcionan tan bien! Me voy a la cama tranquilo hoy, qué biennnnn… Y gracias por estar atento a estas cosas, ¡también!

tannhausser Autor28 febrero, 2017

Fantastico! me alegro de te funcione correctamente, esto del OCR siempre es algo odioso.

cascovida 28 febrero, 2017

Mirando en yaourt también puedes encontrar la versión en qt-5: gimagereader-qt5

manuel 30 junio, 2017

Muchas gracias, funciona a las mil maravillas, te agradezco tu esfuerzo para que los mas pacatos podamos aprender un poco

tannhausser Autor30 junio, 2017

Gracias a ti por comentar! En esto de Linux todos somos eternos principiantes 🙂
1. manuel 30 junio, 2017
  
  Posiblemente si ya que es algo en continuo desarrollo, pero yo llevo solo 5 año con otros sistemas (W7 y W10) y ahora 15 dias en GNU LINUS UBUNTU. y cuando encuentro personas que se esfuerzan en dar información, me gusta AGRADECERLO. A proposito UN ESTUPENDO BLOG, poco a poco iré ojeandolo ya q no tengo mucho tiempo. MUCHAS GRACIAS AMIGO.

Ben 9 agosto, 2017

Muchísimas gracias! Funcionó a la primera en Mint.

tannhausser Autor9 agosto, 2017

De nada! me alegro que te haya servido.

Un saludo!
tannhausser Autor9 agosto, 2017

De nada! me alegro que te haya servido.

Un saludo!

Andrés Alaniz 19 octubre, 2017

Se puede instalar en debían?

andersonbull 20 noviembre, 2017

sudo apt install gimagereader

rubengalussoblogRuben 21 diciembre, 2017

Funcionó muy bien, ahora a tomarle la mano, que como todo programa hay que conocerlo.
Muchas gracias

rubengalussoblogRuben 22 diciembre, 2017

Lo estuve probando y después de varias pruebas logré escanear y convertir a texto la o las partes que me interesan de una página, guardé y abrí con Libre office, corregí algún que otro error, cambié la tipografía…y maravilla ! ! ! , es un espectáculo, una vez más, gracias

tannhausser Autor22 diciembre, 2017

De nada! gracias a ti por seguir el blog 🙂

Diego 3 enero, 2019

Hola… ¿Cómo poner la lengua portuguesa en el tesseract? Parece Inglés y español, pero también necesitan el idioma portugués … saludos

Diego 3 enero, 2019

Para ponerlo en portugués: sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-por

Pingback: OCR en Linux - Arqueología y Software Libre

Mario Juarez 23 agosto, 2020

es una herramienta genial, pero tuve problemas cuando cambié mi scanner, con un epson L3110, siendo que da mensaje de que FALLO SCANEO y que se interrumpió… ¿alguna idea de que puede ser? con otro scanner, un epson L355 si funciona

Los comentarios están cerrados.