Así que me encontré con un problema el otro día cuando tuve que copiar un texto de un archivo PDF y pegarlo en una presentación que estaba haciendo. ¡El problema era que no podía copiar el texto! Hmm, pensé, debe haber algo estúpido que estoy haciendo ya que estoy bastante seguro de haber copiado el texto de un archivo PDF antes.
Afortunadamente, no fui tan estúpido, ya que terminó siendo eso el archivo PDF tenía varias páginas que se escanearon archivos de mapa de bits que se habían insertado en el PDF. Entonces no era texto real en primer lugar. En segundo lugar, donde había texto real que normalmente se podía copiar, ¡este PDF tenía algún tipo de permisos de seguridad establecidos para que no se permitiera la copia de contenido! ¡Grrrr!
Todavía necesitaba ese texto y iba a encontrar la manera de conseguirlo. En este artículo, recorreré la forma simple de copiar el texto que funciona si el documento no está protegido y el texto no es una imagen escaneada. También voy a ver qué hacer en el escenario de tricker donde no tienes permiso para copiar el texto. No es una solución ideal, pero es mejor que nada, especialmente si tiene que copiar mucho texto. Incluso si puede evitar escribir el 80% de forma manual, ¡eso es genial!
Seleccionar texto en un PDF
En Adobe Reader, si el texto es copiable, entonces todo lo que hay que hacer es seleccionarlo y hacer clic derecho y seleccionar Copiar.
En otros programas de visor de PDF como Foxit , debe hacer clic en Herramientasy luego en Seleccionar texto.
Obviamente, si pudieras hacer esto, ¡no estarías leyendo esta publicación! Pero por las dudas, así es como seleccionas el texto. Continúe con el tema más difícil de copiar texto de imágenes o archivos PDF protegidos.
Usar OCR para copiar texto PDF
Puede comprobar rápidamente si un archivo PDF está protegido en Adobe Lector al buscar en la barra de título y buscar la palabra ASEGURADO.
Puede ver los permisos específicos por haciendo clic en Editary luego en Proteccióny luego Propiedades de seguridad.
En las versiones más nuevas de Adobe Reader y Acrobat, debe hacer clic en Protegeren el panel de la derecha para que aparezcan las opciones de protección.
Luego, haga clic en Más opcionesy verá Propiedades de seguridad.
Como puede ver a continuación, no se permite el copiado de contenido y la seguridad está protegida por una contraseña. Si conoce la contraseña, puede eliminar la seguridad y copiar todo lo que desee.
A menos que sea un hacker, no es posible romper la contraseña. Entonces, lo único que puede hacer es tomar una captura de pantalla del texto y luego ejecutarlo a través de un programa de OCR. Parece demasiado trabajo, pero realmente no lo es. Puede tomar una captura de pantalla en una Mac o PC sin software adicional.
Mac- Simplemente presione Comando + Mayús + 4 en el teclado
Windows: simplemente use la herramienta de recortes de Windows
Además, si posee Adobe Acrobat, puede usarlo para convertir automáticamente texto de imagen en texto editable. Todo lo que tiene que hacer es abrir el archivo PDF y hacer clic en la herramienta Editar PDF en el panel de la derecha. Escaneará automáticamente todo el documento utilizando OCR y lo convertirá en un documento totalmente editable.
Si tiene una imagen con texto, cópiela en el portapapeles y abra Adobe Acrobat y elija Archivo - Crear - PDF desde el Portapapeles.
Simplemente haga clic en Editar PDF en el panel derecho y convertirá la imagen en editable texto.
Aquí hay una captura de pantalla que tomé de un texto que no pude copiar de un archivo PDF protegido:
Tenga en cuenta que cuando toma la captura de pantalla, asegúrese de que el zoom del documento esté configurado al 100% para que el texto sea nítido y claro. Una vez que tenga la captura de pantalla, descargue un programa gratuito de OCR. Hay muchas opciones y los resultados variarán enormemente entre los programas, por lo que tendrás que probar un par. Aquí hay dos que he usado en el pasado:
http://download.cnet.com/FreeOCR/3000-10743_4-10717191.html
https://www.simpleocr.com/OCR-Freeware
Tenga en cuenta que también puede usar Microsoft OneNote ya que tiene una función incorporada de OCR. Obviamente, si ya tiene el software OCR, simplemente use ese programa en su lugar.
El programa FreeOCR funciona bien, solo tiene que asegurarse de que cuando lo esté instalando no acepte ningún otro software "Ofertas", que solo instalará basura en su computadora. Pero mientras lo haga, el software no tiene spyware ni nada de eso. También es probado por CNET para garantizar esto.
De todos modos, una vez que hayas instalado el programa, haz clic en el gran botón Abriry elige tu imagen.
Le mostrará una vista previa de la imagen en el panel de la izquierda. Luego haga clic en OCRy Iniciar proceso de OCR.
¡Eso es todo! El texto ahora aparecerá en el lado derecho y puede copiarlo en el portapapeles o exportarlo a Microsoft Word.
En general, el programa hizo un muy buen trabajo con algunos pequeños errores aquí y allá. Me ahorró mucho tiempo sin tener que escribir manualmente todo ese texto. Con suerte, esto lo ayudará a copiar el texto que necesita de un documento PDF. Publique cualquier comentario o pregunta y responderé. ¡Disfruta!