Como extraer texto resaltado de PDF como archivo de texto sin formato

mac

Resaltar texto en un documento PDF es útil para marcar las áreas importantes a las que puede acceder más tarde rápidamente.

Puede usar Microsoft Edge para resaltar PDF o cualquier otro software que venga con la función de resaltado de PDF. A veces, es posible que también haya sentido la necesidad de tener solo el texto resaltado para que pueda tener el resumen del PDF que contiene todo el texto esencial. Si está buscando algunas formas de guardar solo el texto resaltado de un PDF como un archivo TXT, esta publicación puede ser útil.

Extraer texto resaltado de PDF

Hay un software gratuito y un servicio para extraer texto resaltado de un archivo PDF y guardarlo como un archivo de texto:

  • PDF Highlight Extractor
  • Foxit Reader
  • Sumnotes.net
  • DyAnnotationExtractor.

PDF Highlight Extractor

PDF Highlight Extractor es una de las opciones más fáciles de extraer el texto resaltado de un archivo PDF. Este extractor de texto resaltado en PDF de código abierto tiene dos características que llaman la atención. Puede obtener una vista previa del texto resaltado de PDF en la interfaz del software.

La segunda característica es que puede configurar la página inicial o final o el rango de páginas para extraer el texto . Entonces, en lugar de escanear todo el PDF, puede definir números de página para obtener el texto resaltado.

Otra buena característica es que tiene la opción de guardar texto como texto sin formato o archivo de Excel .

En su interfaz, agregue su archivo PDF usando la opción dada, y luego presione el botón Extraer . Desmarque la opción Todas las páginas si desea establecer el rango de página o dejarlo como está. Una vez que se obtiene el texto, puede obtener una vista previa. Finalmente, presione el botón Texto o Excel para guardar el texto resaltado.

Puede descargar este software desde aquí . También se necesita Java para usar este software. Por lo tanto, instale Java (si no lo está ya) y ejecute este software para usar.

Foxit Reader

Foxit Reader es uno de los mejores lectores de PDF gratuitos . Puede abrir varios archivos PDF en pestañas separadas, resaltar PDF, agregar una nota, exportar comentarios , agregar firmas y más. Entre la gran lista de características, también se puede extraer el texto resaltado de PDF. La mejor parte de esta función es que también guarda los números de página junto con el texto extraído .

Para recuperar texto resaltado de PDF, abra el archivo PDF en su interfaz y acceda a la pestaña Comentario . En esa pestaña, haga clic en la opción Exportar disponible en la sección Administrar comentarios . Verá la opción Texto resaltado . Use esa opción y luego puede guardar todo el texto resaltado como un archivo de texto.

Aquí está el enlace de descarga para este software. Durante la instalación, debe seleccionar una instalación personalizada para incluir solo los componentes necesarios de este software.

Sumnotes.net

Sumnotes.net es un servicio gratuito que le permite anotar PDF y extraer el texto resaltado. Todo el texto resaltado es visible por separado en la barra lateral izquierda. Usando esa barra lateral, también puede eliminar el texto resaltado que no necesita y luego descargar el resto del texto resaltado.

Antes de descargar el texto resaltado, también puede incluir números de página y excluir el texto resaltado de un color específico .

También tiene la opción de guardar el texto resaltado de PDF como archivo Excel o Word . Entonces, las características son buenas. Puede registrarse con un plan gratuito y luego extraer 50 destacados o anotaciones por descarga , que es suficiente en la mayoría de los casos.

Aquí está el enlace a su página de inicio. Para extraer texto resaltado de PDF, agregue un PDF desde PC o Google Drive . Cuando se carga el PDF, las anotaciones y el texto resaltado son visibles en el lado izquierdo. Use la opción Descargar anotaciones y luego puede guardar el texto resaltado en formato TXT , XLSX o DOC .

DyAnnotationExtractor

El software DyAnnotationExtractor puede ayudarlo a extraer texto resaltado y comentarios de un documento PDF. Es un software de línea de comandos , pero usarlo es muy simple. Solo un comando obtendrá el texto resaltado en el archivo PDF de entrada.

Puede obtener este software utilizando este enlace . Descargue su archivo ZIP y luego extráigalo. Para facilitar la ejecución del comando, también debe colocar el PDF en la misma carpeta donde extrajo este software. Después de eso, abra la ventana del símbolo del sistema en esa carpeta. Puede hacerlo escribiendo cmd en el cuadro de dirección de esa carpeta y luego presionando la tecla Intro .

Cuando se abre la ventana CMD, agregue el archivo BAT de este software, el comando de entrada que incluye la ruta de entrada del PDF, el comando de salida y el nombre del archivo de salida junto con la extensión '.txt'. El comando completo será-

DyAnnotationExtractor.bat - ruta de entrada de entrada PDF - nombre de archivo de salida de salida.txt

Ejecuta el comando. Espere unos segundos y el archivo de texto sin formato estará listo con todo el texto resaltado y los comentarios obtenidos de ese PDF. El archivo de salida se guarda en la misma carpeta de entrada.

Si esta pagina te ha sido util, compartela en las redes sociales, gracias

Compartir en Facebook Compartir en twitter

Semrush sigue a tu competencia

Fecha actualización el 2020-07-24. Fecha publicación el 2020-07-24. Categoría: mac Autor: Oscar olg Mapa del sitio Fuente: thewindowsclub Version movil