API de Extracción de Tablas PDF permite a los desarrolladores extraer de manera confiable datos tabulares estructurados de documentos PDF y convertirlos en formatos legibles por máquinas como JSON, Excel o CSV.
Esta API se centra exclusivamente en la extracción verdadera de tablas, no en el análisis de texto general de PDF. Detecta automáticamente estructuras tabulares basadas en rejillas dentro de los PDF e ignora el contenido no tabular como títulos, encabezados, pies de página y párrafos. Esto lo hace ideal para la automatización, tuberías ETL, flujos de trabajo de ingestión de datos y sistemas backend que requieren salida limpia y predecible.
Detecta y extrae una o múltiples tablas de un solo PDF
Soporta tablas que abarcan múltiples páginas
Devuelve resultados en JSON, Excel (.xlsx) o CSV
Múltiples tablas se devuelven como:
Un arreglo en JSON
Hojas de cálculo separadas en Excel
Archivos CSV separados empaquetados en un archivo ZIP
Salida determinista: la misma entrada siempre produce el mismo resultado
Puntuaciones de confianza opcionales por tabla
Diseñada para la automatización y casos de uso en backend
Identifica datos tabulares basados en el diseño y la estructura
Preserva la alineación de filas y columnas
Maneja tablas irregulares, celdas vacías y filas desiguales
Devuelve una salida estructurada adecuada para el procesamiento programático
No extrae texto libre fuera de las tablas
No realiza OCR en PDFs escaneados
No intenta interpretar semánticamente el contenido de la tabla
No modifica ni enriquece los valores de los datos
Extraer partidas de facturas de documentos PDF
Convertir informes financieros en conjuntos de datos estructurados
Ingestar datos tabulares de PDFs subidos por los clientes
Automatizar tuberías de datos desde fuentes PDF
Reemplazar flujos de trabajo manuales de copiar y pegar
JSON
Tablas devueltas como un arreglo
Cada tabla incluye filas, rango de páginas y puntuación de confianza
Excel (.xlsx)
Un libro de trabajo por solicitud
Cada tabla colocada en una hoja de cálculo separada
CSV
Cada tabla exportada como un archivo CSV separado
Todos los archivos CSV devueltos en un archivo ZIP
Sin estado y respetuosa con la privacidad
No se almacena ningún dato después del procesamiento
Comunicación segura solo por HTTPS
Adecuada para cargas de trabajo en producción
Aplican límites de tamaño máximo para PDF
Solo PDFs basados en texto (sin soporte de OCR)
Las tablas deben estar estructuradas visualmente (rejillas o filas alineadas)
Esta API está diseñada para desarrolladores que necesitan una extracción de tablas confiable, salida predecible e integración limpia en sistemas automatizados — sin la complejidad o el costo de grandes plataformas de documentos empresariales.
Si necesita datos estructurados de tablas PDF — no blobs de texto, no imágenes y no limpieza manual — esta API proporciona una solución rápida, determinista y amigable para los desarrolladores.
Extraer datos - Características del Endpoint
| Objeto | Descripción |
|---|---|
pages |
Opcional Pages to extract. Examples: "all", "1,3-5", or [1,3,4,5] |
fileBase64 |
Opcional Base64-encoded PDF (alternative to multipart upload) |
Cuerpo de la Solicitud |
[Requerido] Archivo Binario |
{"tables":[{"tableIndex":0,"pageRange":[1,1],"rows":[["Lorem ipsum","","","","","","","",""],["condimentum.","Vivamus","dapibus","sodales","ex,","vitae","malesuada","ipsum","cursus"],["convallis. Maecenas sed egestas nulla, ac condimentum orci.","Mauris diam felis,","","","","","","",""],["ac accumsan nunc vehicula vitae.","Nulla eget justo in felis tristique fringilla. Morbi sit amet","","","","","","",""],["","Maecenas non lorem quis tellus placerat varius.","","","","","","",""],["","Aenean congue fringilla justo ut aliquam.","","","","","","",""],["","Mauris id ex erat.","Nunc vulputate neque vitae justo facilisis, non condimentum ante","","","","","",""],["sagittis.","","","","","","","",""],["","Morbi viverra semper lorem nec molestie.","","","","","","",""],["","Maecenas tincidunt est efficitur ligula euismod, sit amet ornare est vulputate.","","","","","","",""],["12","","","","","","","",""],["10","","","","","","","",""],["8","","","","","","","",""],["Column 1","","","","","","","",""],["6","","","","","","","",""],["Column 2","","","","","","","",""],["4 Column 3","","","","","","","",""],["2","","","","","","","",""],["0","","","","","","","",""],["Row 1","Row 2","Row 3","Row 4","","","","",""]],"rowCount":20,"columnCount":9,"strategyUsed":"stream","warnings":[],"confidence":0.85},{"tableIndex":1,"pageRange":[2,2],"rows":[["velit.","Pellentesque","fermentum","nisl","vitae","fringilla","venenatis.","Etiam","id","mauris","vitae","orci"],["a.","","","","","","","","","","",""],["Lorem ipsum","Lorem ipsum","Lorem ipsum","","","","","","","","",""],["1","In eleifend velit vitae libero sollicitudin euismod.","Lorem","","","","","","","","",""],["2","Cras fringilla ipsum magna, in fringilla dui commodo Ipsum","","","","","","","","","",""],["a.","","","","","","","","","","",""],["3","Aliquam erat volutpat.","Lorem","","","","","","","","",""],["4","Fusce vitae vestibulum velit.","Lorem","","","","","","","","",""],["5","Etiam vehicula luctus fermentum.","Ipsum","","","","","","","","",""],["et","pulvinar","nunc.","Pellentesque","fringilla","mollis","efficitur.","Nullam","venenatis","commodo","",""]],"rowCount":10,"columnCount":12,"strategyUsed":"stream","warnings":[],"confidence":0.85},{"tableIndex":2,"pageRange":[3,3],"rows":[["elit.","","","","","","","","","","",""],["dictum tellus.","","","","","","","","","","",""],["Aliquam","erat","volutpat.","Vestibulum","in","egestas","velit.","Pellentesque","fermentum","nisl","vitae",""],["fringilla","venenatis.","Etiam","id","mauris","vitae","orci","maximus","ultricies.","Cras","fringilla","ipsum"],["et","pulvinar","nunc.","Pellentesque","fringilla","mollis","efficitur.","Nullam","venenatis","commodo","",""]],"rowCount":5,"columnCount":12,"strategyUsed":"stream","warnings":[],"confidence":0.85}],"summary":{"tableCount":3,"pageCount":4}}
curl --location 'https://zylalabs.com/api/11754/extracci%c3%b3n+de+tablas+pdf+api/22299/extraer+datos' \
--header 'Content-Type: application/json' \
--form 'image=@"FILE_PATH"'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
La API devuelve datos tabulares estructurados extraídos de documentos PDF Esto incluye múltiples tablas cada una representada como un arreglo en formato JSON con opciones para recibir los datos en formatos Excel (.xlsx) o CSV
La respuesta incluye campos clave como `tableIndex`, `pageRange`, `rows`, `rowCount`, `columnCount`, `strategyUsed` y `confidence`. Los datos de cada tabla están organizados para facilitar un procesamiento programático fácil
Los datos de respuesta están organizados en una sección de resumen que incluye el número total de tablas y páginas seguido de una matriz de tablas Cada tabla contiene sus filas rango de páginas y puntaje de confianza lo que facilita la navegación y utilización
El parámetro principal para el punto final es el archivo PDF en sí, que se puede subir directamente. Los parámetros adicionales pueden incluir opciones para el formato de salida (JSON, Excel, CSV) y configuraciones para la puntuación de confianza
La precisión de los datos se mantiene a través de una salida determinista lo que significa que la misma entrada produce consistentemente el mismo resultado La API también proporciona puntuaciones de confianza opcionales para cada tabla indicando la fiabilidad de la extracción
Los casos de uso típicos incluyen la extracción de líneas de facturas la conversión de informes financieros en conjuntos de datos estructurados la automatización de tuberías de datos y la ingestión de datos tabulares de PDFs subidos por los clientes optimizando los flujos de trabajo de procesamiento de datos
Los usuarios pueden aprovechar la salida estructurada para la integración en tuberías de datos procesos ETL o sistemas backend El formato organizado permite una fácil manipulación y análisis de las tablas extraídas en diversas aplicaciones
Los usuarios pueden esperar patrones de datos que reflejen la estructura original de la tabla, incluida la alineación de filas y columnas. La API maneja tablas irregulares y celdas vacías, asegurando que la salida se mantenga estructurada y utilizable para procesamiento adicional
La API puede extraer varios tipos de tablas estructuradas, incluidas aquellas con diseños irregulares, celdas vacías y filas desiguales. Detecta automáticamente tablas individuales o múltiples dentro de un PDF, asegurando que solo se procesen estructuras tabulares basadas en cuadrículas
La API admite tablas que abarcan varias páginas capturando con precisión toda la estructura de la tabla y devolviéndola en una única salida El rango de páginas de cada tabla se incluye en la respuesta para facilitar la referencia
Sí los usuarios pueden personalizar sus solicitudes de datos especificando el formato de salida deseado JSON Excel (.xlsx) o CSV Esta flexibilidad permite la integración en varias aplicaciones y flujos de trabajo
La API ofrece puntajes de confianza opcionales para cada tabla extraída que indican la fiabilidad de la extracción Esta función ayuda a los usuarios a evaluar la calidad de los datos devueltos
La API está diseñada para ser sin estado y amigable con la privacidad asegurando que no se almacene ningún dato después del procesamiento Utiliza una comunicación segura solo por HTTPS para proteger los datos del usuario durante la transmisión
Los usuarios pueden esperar que la API maneje las celdas vacías de manera adecuada, preservando la estructura general de la tabla. La salida reflejará el diseño original, lo que permitirá una manipulación de datos sencilla a pesar de los valores faltantes
Los puntajes de confianza varían de 0 a 1 indicando la probabilidad de que la tabla extraída sea precisa Un puntaje más alto sugiere una mayor confiabilidad ayudando a los usuarios a determinar qué tablas confiar para un procesamiento adicional
El campo `strategyUsed` indica el método empleado por la API para extraer los datos de la tabla Esta información puede ayudar a los usuarios a comprender el proceso de extracción y evaluar la idoneidad de la salida para sus necesidades específicas
Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.
Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]
Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.
La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.
Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]
Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.
Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.
Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.
Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.
Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.
Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.
El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.
Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.
Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]
Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.
Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.
Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.
Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.
Nivel de Servicio:
91%
Tiempo de Respuesta:
2.513ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.529ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.852ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.852ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
516ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
156ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.190ms
Nivel de Servicio:
97%
Tiempo de Respuesta:
616ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
289ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.136ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
492ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
489ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
482ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
413ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.337ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.852ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.911ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
453ms