Cómo OCR PDF y carteras PDF

08:13 13/09/2021 | 2 Lượt xem

Editor de PDF Foxit

Este artículo explicará cómo OCR PDF y carteras PDF con Foxit PDF Editor.

OCR PDF y PDF Portafolios

El reconocimiento óptico de caracteres, o OCR, es un proceso de software que permite traducir imágenes o texto impreso a texto legible por máquina. El OCR se usa más comúnmente al escanear documentos en papel para crear copias electrónicas, pero también se puede realizar en documentos electrónicos existentes (por ejemplo, PDF o Portafolio PDF).

Reconocer texto

Foxit Editor de PDF puede detectar si un archivo PDF está escaneado o basado en imágenes y hacer las sugerencias correspondientes para iniciar OCR al abrir un PDF escaneado o basado en imágenes. También puede ejecutar OCR en cualquier momento para reconocer texto basado en imágenes en un PDF.

Para reconocer texto escaneado o basado en imágenes en un archivo PDF, realice los siguientes pasos:

1. Haga clic en Para convertir > Reconocer texto > archivo actual, en el cuadro de diálogo Reconocer texto, especifique el rango de páginas que necesita.

2. Elija el idioma utilizado en su documento. También puede seleccionar varios idiomas.

3. En el tipo de salida, marque Imagen de texto con capacidad de búsqueda para hacer que el texto de la imagen se pueda seleccionar y buscar (o marcar Texto editable para permitir que el texto de la imagen se edite con Editor de PDF Foxit) Luego haga clic en OK para reconocer el texto.

· Imagen de texto con capacidad de búsqueda: Durante el proceso de OCR, Foxit PDF Editor analiza el texto de la imagen y reemplaza palabras / caracteres que se aproximan al texto de la imagen. Las palabras / caracteres sustitutos se colocarán en una capa de texto invisible en el PDF, lo que hace que el texto de la imagen se pueda seleccionar y buscar. Si el reemplazo es incierto, el texto se marcará como sospechosos de OCR que deben corregirse manualmente.

· Texto editable: Durante el proceso de OCR, Foxit PDF Editor compara la forma del texto de la imagen con las fuentes aproximadas instaladas en su sistema y transforma el texto de la imagen en texto editable.

Observación: Si se le solicita que descargue el componente OCR después de hacer clic en OK, Por favor haz click para descargarlo e instalarlo, o descárguelo más tarde desde el enlace provisto e instálelo haciendo clic en Instalar complemento en el cuadro de diálogo Acerca de los complementos de Foxit que aparece al hacer clic en Complementos de Foxit en el Ayudar pestaña. Para obtener la versión completa de Foxit PDF Editor, Contáctenos.

4. (Opcional) Si marca Encuentre todos los sospechosos (muestre todos los resultados de OCR que puedan necesitar ser cambiados)., a Sospechosos de OCR Aparece un cuadro de diálogo para que verifique y corrija el OCR sospechoso inmediatamente después de que se complete el reconocimiento. Para obtener información sobre cómo reparar los sospechosos de OCR, consulte las instrucciones en “Búsqueda y reparación de sospechosos de OCR”.

si usted elige Texto editable en el tipo de salida, con el Encuentre todos los sospechosos (muestre todos los resultados de OCR que puedan necesitar ser cambiados). opciones seleccionadas, el texto de OCR del que Foxit PDF Editor no está seguro se marcará como sospechoso de OCR y el texto de la imagen original se mantendrá hasta que maneje manualmente todos los sospechosos de OCR. También puede anular la selección de esta opción para convertir el texto de la imagen en texto editable sin sospecha de OCR después del reconocimiento. Y puede modificar el texto directamente usando los comandos en Para editar pestaña.

5. (Opcional) Si selecciona Texto editable en el paso 3, el Reconocer segmentos de línea como objetos de ruta en PDF la opción está disponible. Si el texto de la imagen en su documento contiene tablas, seleccionar esta opción le ayuda a reconocer mejor los segmentos de línea, pero puede llevar más tiempo completar el reconocimiento.

6. Aparecerá una barra de proceso de texto de reconocimiento para mostrar el progreso.

7. Realice la función de búsqueda, el texto de su imagen o documento escaneado se podrá buscar.

Propina: Foxit PDF Editor proporciona la Reconocimiento rápido comando bajo casa/Para convertir para reconocer todas las páginas de un PDF escaneado o basado en imágenes con la configuración predeterminada o anterior con un solo clic.

Para reconocer texto en varios archivos:

1. Haga clic en Para convertir > Reconocer texto > Varios archivos.

2. No Reconocer texto cuadro de diálogo, haga clic en agregar archivos para agregar archivos, carpetas o archivos abiertos actualmente. Usar Ascender, mover hacia abajo, y Retirar para ajustar el orden de los archivos.

3. Haga clic en Opciones de salida …. En el Opciones de salida cuadro de diálogo, seleccione la carpeta de destino, elija cómo nombrar el nuevo archivo y si desea reemplazar uno existente, y haga clic en OK.

4. Haga clic en OK. Después del reconocimiento, aparecerá un cuadro de mensaje para informarle que se ha completado el reconocimiento.

Observación:

1 Cuando utilice el motor CJK OCR por primera vez, el sistema le recordará que descargue e instale el motor del servidor Foxit.

dos Si se agregan archivos no admitidos, aparecerá el botón “Eliminar archivo (s) no admitidos” en el Reconocer texto caja de diálogo. Haga clic en el botón para eliminar archivos no compatibles y continuar. Aunque reconoce una cartera PDF, Foxit PDF Editor solo extraerá y reconocerá archivos PDF en la cartera.

Related Posts

Agregar fondos a archivos PDF

Este artículo explicará cómo agregar un fondo a un PDF con Foxit PDF Editor. Para agregar un nuevo fondo, haga lo siguiente: 1. Abra un documento al que desee agregar un fondo y elija...

lên đầu trang