Cómo extraer datos en tablas de archivos PDF

Articulos tematica Microsoft

Suponga que ha aceptado un documento en formato PDF y desea extraer alguna información de él.

Al principio, el trabajo parece ser bastante fácil con solo copiar del documento de origen y pegarlo en su destino. Pero las cosas se vuelven complejas cuando se trata de una gran cantidad de datos, esto enorme e inmenso hará que su vida laboral sea caótica. En vista de esto, conviene utilizar herramientas dedicadas o marcos especializados para robotizar todo el trabajo. No solo mejorarán su productividad, sino que también le ahorrarán tiempo.

USO DE CONVERTIDORES EN LÍNEA

La forma más rápida es utilizar los convertidores de archivos en línea para cambiar el archivo PDF a cualquier otro formato de documento que desee. Varias herramientas en línea gratuitas convierten PDF a Excel para extraer datos tabulares. Algunos ejemplos populares son cometdocs y Smallpdf. Sin embargo, la mayoría de estas herramientas ofrecen solo capacidades de extracción básicas.

A continuación, se explica cómo extraer tablas de archivos PDF con Smallpdf:

Paso 1: visite el sitio web de Smallpdf.

Paso 2: seleccione la conversión a realizar.

Paso 3: Arrastre el archivo PDF para convertirlo en el convertidor de PDF.

Paso 4: Una vez que el archivo haya terminado de cargarse, haga clic en Convertir a Excel.

Paso 5: haga clic en Descargar para guardar el archivo PDF en su dispositivo.

Paso 6: Inicie el Excel descargado para confirmar si su tabla se ha convertido con precisión.

TABLAS DE EXTRACCIÓN CON MICROSOFT POWER BI

Microsoft BI es otra herramienta útil para extraer datos de tablas de archivos PDF. En particular, la función Power Query en Power BI facilita a los usuarios importar archivos PDF y extraer los datos de la tabla dentro del documento.

Sin embargo, esto solo funciona para aquellos con una suscripción a Office 365. Alternativamente, tendrá que comprar un paquete de Power BI por separado.

La función Power Query también está disponible en la versión de prueba gratuita de Power BI. A continuación, le indicamos cómo utilizarlo para extraer datos tabulares:

Paso 1: descargue, instale y ejecute Microsoft Power BI.

Paso 2: seleccione Obtener datos de la sección Inicio del escritorio de la aplicación.

Paso 3: Haga clic en Archivo y luego seleccione PDF.

Paso 4: Haga clic en Conectar para buscar la ubicación del archivo PDF en su computadora.

Paso 5: seleccione la ubicación del archivo PDF para importar a Power BI.

Paso 6: Una vez que el archivo se ha importado a Power BI, debería ver un navegador con números de tabla y números de página. Seleccione el Número de tabla para cargar.

Paso 7: seleccione Cargar para crear la tabla en Power BI.

USO DE MICROSOFT EXCEL

Microsoft Excel como Power BI tiene la función Power Query que se puede usar para cargar archivos PDF y extraer datos tabulares. Sin embargo, esta función solo está disponible en Excel 2016 o versiones más recientes. Así es como funciona:

Paso 1: inicie Microsoft Excel.

Paso 2: seleccione Datos en la cinta.

Paso 3: seleccione Obtener datos para iniciar el menú desplegable.

Paso 4: seleccione Desde archivo y Desde PDF.

Paso 5: seleccione la ubicación del archivo PDF para importar a Excel.

Paso 6: Una vez que el archivo se ha importado a Excel, debería ver un navegador con números de tabla, números de página o una vista previa de los datos dentro del PDF. Seleccione el Número de tabla para cargar.

Paso 7: seleccione Cargar para crear la tabla en Excel.

Fecha actualización el 2021-11-13. Fecha publicación el 2021-11-13. Categoria: computadoras Autor: Oscar olg Mapa del sitio Fuente: bollyinside