5 servicios gratuitos de OCR en línea probados y revisados


¿Tiene un documento PDF o una imagen que desea convertir en texto? Recientemente, alguien me envió un documento por correo que necesitaba editar y enviar con correcciones. La persona no pudo encontrar una copia digital, por lo que me encargaron de poner todo ese texto en formato digital.

No había forma de que me pasara horas escribiendo todo, así que terminé tomando una bonita imagen de alta calidad del documento y luego me prendí un montón de servicios de OCR en línea para ver cuál me daría los mejores resultados.

En este artículo, revisaré un par de mis sitios favoritos para OCR que son gratuitos. Vale la pena señalar que la mayoría de estos sitios ofrecen un servicio gratuito básico y luego tienen opciones de pago si desea funciones adicionales como imágenes más grandes, documentos PDF de varias páginas, diferentes idiomas de entrada, etc.

También es bueno sepa de antemano que la mayoría de estos servicios no podrán coincidir con el formato de su documento original. Estos son principalmente para extraer texto y eso es todo. Si necesita que todo esté en un diseño o formato específico, tendrá que hacerlo manualmente una vez que obtenga todo el texto del OCR.

Además, los mejores resultados para obtener el texto vendrán desde documentos con una resolución de 200 a 400 DPI. Si tiene una imagen de PPP baja, los resultados no serán tan buenos.

Finalmente, hubo muchos sitios que probé que simplemente no funcionaron. Si busca un OCR en línea gratuito, verá un montón de sitios, pero varios de los sitios en los 10 primeros resultados ni siquiera completaron la conversión. Algunos tendrían tiempo de espera, otros darían errores y algunos simplemente se quedarían atrapados en la página de "conversión", así que ni siquiera me molesté en mencionar esos sitios.

Para cada sitio, probé dos documentos para ver qué tan bien sería la salida. Para mis pruebas, simplemente usé mi iPhone 5S para tomar una foto de ambos documentos y luego subirlos directamente a los sitios web para su conversión.

En caso de que quiera ver cómo lucían las imágenes que usé para mi prueba, los he adjuntado aquí: Test1 y Test2. Tenga en cuenta que estas no son las versiones de resolución completa de las imágenes tomadas desde el teléfono. Usé la imagen de resolución completa al subir a los sitios.

OnlineOCR

OnlineOCR.net es un sitio limpio y simple que arrojó muy buenos resultados en mi prueba. Lo principal que me gusta de él es que no tiene toneladas de anuncios en todas partes, lo que suele ser el caso con este tipo de sitios de servicio de nicho.

free online ocr

Para comenzar, seleccione su archivo y espere hasta que termine de cargarlo. El tamaño máximo de carga para este sitio es de 100 MB. Si te registras para obtener una cuenta gratuita, obtienes algunas características adicionales como el tamaño de carga más grande, archivos PDF de varias páginas, diferentes idiomas de entrada, más conversiones por hora, etc.

Luego, elige tu idioma de entrada y luego elige el formato de salida. Puede elegir entre Word, Excel o texto sin formato. Haga clic en el botón Convertiry verá el texto que se muestra en la parte inferior de un cuadro junto con un enlace de descarga.

ocr output

Si todo lo que quiere es el texto, simplemente cópielo y péguelo del cuadro. Sin embargo, le sugiero que descargue el documento de Word porque hace un trabajo sorprendentemente bueno al mantener el diseño del documento original.

Por ejemplo, cuando abrí el documento de Word para mi segunda prueba, me sorprendió encontrar que el documento incluye una tabla con tres columnas, al igual que en la imagen.

online ocr output

De todos los sitios, este fue el mejor con mucho. Merece la pena registrarse si necesitas hacer muchas conversiones.

Para completar, también voy a vincular los archivos de salida creados por cada servicio para que puedas ver los resultados por ti mismo. Estos son los resultados de OnlineOCR: Test1 Doc y Test2 Doc.

Tenga en cuenta que cuando abra estos documentos de Word en su computadora, recibirá un mensaje en Se ha desactivado la palabra que indica que proviene de Internet y la edición. Eso está perfectamente bien porque Word no confía en documentos de Internet y realmente no tiene que habilitar la edición si solo quiere ver el documento.

i2OCR

Otro sitio que dio muy buenos resultados fue i2OCR. El proceso es muy similar: elija su idioma, archivo, y luego presione Extraer texto.

i2ocr

Tengo que esperar un minuto o dos aquí porque este sitio demora un poco más. Además, en el Paso 2, asegúrese de que su imagen se muestre hacia arriba en la vista previa, de lo contrario obtendrá un montón de galimatías como salida. Por alguna razón, las imágenes de mi iPhone se mostraban en modo retrato en mi computadora, pero se veían apaisadas cuando subía a este sitio.

i2ocr output

I tuvo que abrir manualmente la imagen en una aplicación de edición de fotos, rotarla 90 grados, luego girarla de nuevo a retrato y luego guardarla nuevamente. Una vez completo, desplácese hacia abajo y le mostrará una vista previa del texto junto con un botón de descarga.

Este sitio salió bastante bien con la salida para la primera prueba, pero no le fue tan bien con la segunda prueba que tenía el diseño de la columna. Estos son los resultados de i2OCR: Test1 Doc y Test2 Doc.

FreeOCR

Free-OCR.com tomará sus imágenes y convertirlas en texto sin formato. No tiene una opción para exportar a formato Word. Elija su archivo, seleccione un idioma y luego haga clic en Iniciar.

El sitio es rápido y obtendrá la salida bastante rápido. Simplemente haga clic en el enlace para descargar el archivo de texto a su computadora.

freeocr

Al igual que NewOCR mencionado a continuación, este sitio capitaliza todas las T en el documento. No tengo idea de por qué haría eso, pero por alguna extraña razón, este sitio y NewOCR hicieron esto. No es gran cosa cambiarlo, pero es un proceso tedioso que no debería tener que hacer.

Aquí están los resultados de FreeOCR: Test1 Doc y Test2 Doc.

ABBYY FineReader en línea

Para usar FineReader en línea, debe registrarse para obtener una cuenta, lo que le otorga 15 días prueba gratuita de OCR de hasta 10 páginas gratis. Si solo necesita hacer un OCR por única vez para un par de páginas, puede usar este servicio. Asegúrese de hacer clic en el enlace Verificar en el correo electrónico de confirmación después de registrarse.

finereader online

Haga clic en Reconoceren la parte superior y luego en Cargarpara seleccionar su archivo. Elija su idioma, formato de salida y luego haga clic en Reconoceren la parte inferior. Este sitio tiene una interfaz limpia y no anuncios.

En mis pruebas, este sitio fue capaz de tomar el texto del primer documento de prueba, pero fue absolutamente enorme cuando abrí el documento de Word, así que Terminé haciéndolo nuevamente y eligiendo Texto sin formato como formato de salida.

Para la segunda prueba con las columnas, el documento de Word estaba vacío y no pude encontrar el texto. No estoy seguro de lo que sucedió allí, pero parece que no puede manejar nada más que párrafos simples. Estos son los resultados de FineReader: Test1 Doc y Test2 Doc.

NewOCR

El siguiente sitio, NewOCR.com, estaba bien, pero no tan bueno como el primer sitio. En primer lugar, tiene anuncios, pero afortunadamente no mucho. Primero seleccione su archivo y luego haga clic en el botón Vista previa.

upload image

Puede rotar la imagen y ajustar la área en la que desea buscar texto. Es bastante parecido a cómo funciona el proceso de escaneo en una computadora con un escáner adjunto.

ocr image

Si el documento tiene varias columnas, puede compruebe el botón Análisis de diseño de páginae intentará dividir el texto en columnas. Haga clic en el botón OCR, espere unos segundos para que se complete y luego desplácese hacia abajo hasta que la página se actualice.

En la primera prueba, obtuvo todo el texto correctamente, pero por alguna razón se capitalizó cada T en el documento! No tengo idea de por qué haría eso, pero lo hizo. En la segunda prueba con el análisis de página habilitado, obtuvo la mayor parte del texto, pero el diseño estaba completamente apagado.

Estos son los resultados de NewOCR: Test1 Doc y Test2 Doc.

Conclusión

Como puede ver, la mayoría de las veces, realmente, los resultados realmente buenos no son muy buenos, lamentablemente la mayoría de las veces. El primer sitio mencionado es de lejos el mejor porque no solo hizo un gran trabajo al reconocer todo el texto, sino que también conservó el formato del documento original.

Si solo necesitas texto , la mayoría de los sitios web anteriores deberían poder hacer eso por usted. Si tiene alguna pregunta, siéntase libre de comentar. ¡Disfruta!

Artículos Relacionados:


2.12.2015