Programas de OCR para convertir hojas de papel y PDF en texto editable

Sitios y programas gratuitos para extraer texto de un documento comprado con un escáner y convertir imágenes, faxes y fotocopias en archivos de Word editables

LOC es la abreviatura de Optical Character Recognition (reconocimiento óptico de caracteres) èd es una tecnología que permite convertir imágenes y archivos PDF que contienen texto escrito en documentos editables con programas de texto normales como Microsoft Word. Sin entrar en detalles técnicos, un software de OCR le permite tomar una hoja escrita y convertirla en un documento, cuyas palabras son editables. Se requiere este tipo de software cuando usamos el escáner, visto que a menudo se generarán imágenes en lugar de un documento listo para usar; gracias al OCR podemos reconocer los textos escritos en una imagen JPEG o en otros formatos gráficos y así obtener un texto legible, para luego ser guardado en formato de documento digital (PDF o Word).

En este artículo vemos lo que mejores programas y sitios web para convertir un documento en papel (impresión, fax, archivo, etc.) en un documento PDF digital o en un archivo de documento editable (con Microsoft Word o programas similares).

LEA TAMBIÉN: Reconozca y extraiga texto de la imagen en Android con aplicaciones OCR

Índice

    Programas y sitios para OCR

    Todos los programas y sitios que le mostraremos proporcionan conversión OCR de forma gratuita, por lo que no tendremos que pagar nada por ello. pasar documentos en papel en formato digital, simplemente elija la herramienta que se adapte a nuestras necesidades o el programa que consideremos más adecuado para la cantidad de hojas a convertir a digital.

    Programas para la conversión de OCR

    El primer programa que le recomendamos que intente convertir hojas de papel y PDF en texto editable es PDF23 Creator, descargable desde sitio oficial.

    Con este poderoso paquete de PDF, podemos convertir documentos de texto en papel en archivos PDF editables en unos sencillos pasos. Para usar este programa abrimos la aplicación PDF24, presionamos en el menú Reconocer texto, presionamos alto Agregar archivos y finalmente presionamos hacia arriba comienzo para iniciar el reconocimiento de caracteres escaneados. Al final de la conversión, haga clic en Guardar archivo en la parte superior para guardar los nuevos archivos PDF con el texto escaneado.

    Otro programa válido que podemos usar en nuestra PC para convertir hojas a PDF vía OCR es program Microsoft OneNote, disponible para descarga gratuita desde Microsoft Store.

    Para extraer el texto de las imágenes, primero agregamos la imagen a una de las notas del programa, haciendo clic en la parte superior insertar y presionando en el menú Imagenes. Después de agregar la imagen a la página de notas, haga clic derecho sobre ella y use la voz Copiar texto de la imagen para iniciar el OCR incluido en el programa; si la imagen contiene más páginas para importar también podemos usar la voz Copiar texto de todas las páginas de la impresión, para obtener todo el texto en OCR.
    Para conocer más podemos leer nuestra guía Descargue Microsoft OneNote gratis para Windows, Mac y teléfonos inteligentes.

    Si buscamos un programa gratuito y de código abierto para utilizar OCR, le recomendamos que pruebe OpenOCR cognitivo (cuneiforme), Disponible de sitio oficial.

    Cognitive OpenOCR (Cuneiform) es un programa de código abierto que le permite realizar reconocimiento óptico de caracteres (OCR) y, por lo tanto, transformar imágenes en documentos de texto editables con Word u otros programas. Cuneiform admite 23 idiomas, incluidos italiano y tiene algoritmos especiales para reconocer texto de impresoras, faxes y fotocopias. Reconoce automáticamente bloques de texto, tablas e imágenes sin dificultad de uso y conserva perfectamente el diseño de la página.
    Para usarlo, simplemente haga clic en el Asistente de reconocimiento y siga los pasos guiados para importar una imagen y convertirla rápidamente en un archivo de texto digital.

    Sitios web de conversión de OCR

    Si queremos utilizar un sitio para convertir hojas de papel y PDF en texto editable, podemos confiar en Documentos de Google, la suite ofimática gratuita ofrecida por Google y accesible en sitio oficial.

    Para aprovechar esta posibilidad, antes que nada levantémonos Google Drive, presione el ícono de ajustes en la parte superior derecha, abra el menú Configuraciones y, en la ventana que aparece, activa la voz Convierta los archivos cargados al formato del editor de Google Docs.
    Ahora basta con subir cualquier documento PDF o imagen a Google Docs para poder modificarlo con las herramientas que ofrece el sitio, con la conversión OCR que se realizará automáticamente, como también se ve en la guía. Extraiga texto de un PDF o una imagen con Google Docs.

    Otro servicio web válido para convertir hojas con OCR es onlineocr.net, accesible desde sitio oficial.

    Para utilizar este servicio cargamos los archivos de imagen haciendo clic en Seleccione Archivo, seleccione el idioma del texto, elija el formato del archivo de imagen final (Word o Excel) y finalmente presione la tecla Convertir, para poder descargar los documentos de texto editables creados a partir del OCR de las imágenes cargadas.

    Otro servicio web que le recomendamos que utilice para convertir hojas de papel y PDF en texto editable es Convertio, accesible desde sitio oficial.

    Utilizando este servicio tendremos 10 páginas que se pueden convertir gratis, lo único que tenemos que hacer es presionar el botón Elija el archivo (pero también podemos acceder a los archivos de imagen desde la nube), esperar a que se reconozca el texto y finalmente iniciar la descarga del documento, que se puede guardar en Word, PDF u otros formatos de texto conocidos.

    Otros sitios y programas para OCR

    Si bien los sitios y programas vistos anteriormente son capaces de cumplir con todo tipo de compromisos de OCR, siempre podemos encontrar nuevas herramientas, herramientas y sitios de OCR en Internet. Si estamos buscando alternativas válidas, echemos un vistazo a la siguiente información:

    • Transcribe texto en fotos con Google Keep es la forma más sencilla incluso si no funciona con archivos PDF.
    • SimpleOCR es un programa simple y básico capaz de hacer editable un texto escrito en papel y escaneado en una computadora, con reconocimiento óptico de caracteres. Con SimpleOCR es posible convertir cualquier documento en papel en texto electrónico editable para ser utilizado también con Word.
    • OCR de pantalla fácil es un programa gratuito para Windows 10 y Windows 7 que te permite extraer y capturar texto de cualquier imagen o captura de pantalla. La herramienta Easy Screen OCR (reconocimiento óptico de caracteres) es capaz de capturar y convertir capturas de pantalla en texto. Puede extraer texto de una imagen, video, sitio web, documentos. Desarrollado por Google OCR, que garantiza una alta precisión de reconocimiento, este programa gratuito admite más de 100 idiomas.
    • Convertidor Boxoft Free OCR es otro gran programa gratuito que te permite extraer texto de todo tipo de imágenes (incluidas las de hojas escaneadas), en varios idiomas, incluidos inglés, francés, alemán, italiano, holandés, español, portugués y más. Además de imágenes, también puede escanear copias impresas de documentos y convertirlas en texto editable.
    • NuevoOCR actualmente solo ofrece la extracción de texto de archivos de imágenes y fotos, pero admite algunas otras características que muchos sitios de OCR en línea no ofrecen, como configurar múltiples idiomas de reconocimiento, también útiles para obtener una traducción correcta del texto. Si la imagen está torcida, también puede rotarla dinámicamente.
    • Espacio OCR Definitivamente es una de las opciones más sólidas que hemos encontrado, una de las mejores herramientas de OCR que también admite el formato de archivo WEBP además de PNG, JPG y PDF. Además, no necesita cargar un archivo, puede usar la URL de una imagen en línea. Otras características son la rotación automática, el escaneo de recibos, el reconocimiento de la mesa y el cambio de tamaño automático. El texto extraído también se puede guardar en un PDF o como un archivo JSON.
    • Fine Reader en línea es un sitio web para convertir una imagen en un archivo de texto o un archivo pdf en un Word, siempre editable. Esta última función, la conversión de archivos de .pdf a .doc también se puede realizar con otro software específico editar archivos pdf. Cuando hablamos de una imagen convertida en un archivo de texto, en este caso, nos referimos a una página escaneada y guardada a través del programa de gestión de un escáner normal, en un archivo jpeg, gif, bmp o tiff. Para utilizar el sitio debe registrarse y se reconoce la conversión de archivos escritos en cualquier idioma, incluyendo el idioma italiano.
    • OCR a Word es un programa simple y poderoso capaz de extraer texto de un PDF o un documento escaneado. El texto extraído se puede editar en Word.
    • Capture2Text es un programa que puede copiar texto de imágenes con facilidad y con una interfaz muy simple de usar

    Antes de elegir, probémoslos todos, así será más fácil convertir las imágenes que tenemos en nuestro poder en documentos digitales perfectos.

    Conclusiones

    El rendimiento de estos programas depende mucho de la calidad de la imagen que se quiere que se reconozca y de la sensibilidad del escáner utilizado: se pasa de textos reproducidos de forma idéntica a casos en los que no se reconoce ni una palabra. Todos los programas y sitios web funcionan muy bien, pero el poder del OCR depende en gran medida de la calidad de la imagen que se alimenta a estas herramientas avanzadas.

    En otra guía hemos visto cómo Copie y pegue texto en fotos, imágenes y videos en Internet con Chrome.
    Si buscamos un programa válido para el escáner en una PC, podemos leer nuestra guía Los mejores programas para usar el escáner con Windows PC.

    ¡Haz clic para puntuar esta entrada!
    (Votos: 0 Promedio: 0)

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Subir

    Este sitio web utiliza cookies para asegurar que tengas una mejor experiencia al navegar por él. Leer más