Doc a Texto API

Desbloquea el poder de los datos con la API DocToText: tu solución definitiva para la conversión fluida de documentos. Desde DOC y PDF hasta imágenes y correos electrónicos, transforma sin esfuerzo diversos formatos en texto plano y HTML. Ya sea una tarea pequeña o un proyecto a gran escala, experimenta capacidades de OCR y análisis de correos electrónicos de primer nivel. Simplifica tu viaje de extracción de datos hoy.

Acerca de la API:  

 

Potencia tu viaje de datos con la API DocToText

La API DocToText se erige como la piedra angular de la extracción eficiente de datos, diseñada tanto para pequeñas tareas como para proyectos a gran escala. Esta herramienta versátil convierte sin esfuerzo una amplia gama de formatos, incluidos DOC, XLS, PPT, PDF, varios formatos de correo electrónico y imágenes, en texto plano y HTML.

Capacidades avanzadas de extracción de datos:

En el corazón de la API DocToText yace su tecnología OCR de vanguardia. Ya sea que se trate de documentos escaneados, imágenes o PDFs complejos, su OCR de alta calidad, programable y entrenable, garantiza una extracción de texto precisa y confiable. Esto se complementa con robustas capacidades de análisis de correos electrónicos, permitiendo el procesamiento sin inconvenientes de formatos de correo electrónico como EML, PST, OST y otros.

Amplio soporte de formatos:

La API DocToText admite una impresionante gama de formatos, desde archivos de oficina comunes como DOCX y XLSX hasta formatos especializados como iWork (PAGES, NUMBERS, KEYNOTE) y Outlook (PST, OST). Su flexibilidad se extiende a formatos de imagen como JPG, PNG y TIFF, lo que permite la extracción de diversas fuentes.

Integración sin fisuras para cada proyecto:

Ya sea que estés gestionando una aplicación empresarial intensiva en datos, realizando investigaciones o automatizando tareas de oficina rutinarias, la API DocToText se integra sin esfuerzo en tu flujo de trabajo. Su adaptabilidad permite una fácil incorporación en diversas plataformas, asegurando un procesamiento de datos fluido sin interrumpir tus sistemas existentes.

Personalizable y escalable:

Las capacidades de OCR programables y entrenables de la API DocToText permiten la personalización según requisitos específicos del proyecto. Se escala sin problemas, acomodando tanto tareas a pequeña escala como proyectos de extracción de datos de alto volumen. Su robustez garantiza precisión y consistencia, incluso en entornos exigentes.

Confiable y preparado para el futuro:

La API DocToText no solo satisface tus necesidades actuales, sino que también está preparada para el futuro, acomodando formatos y tecnologías emergentes. Sus actualizaciones y mejoras continuas garantizan que siempre estés equipado con las últimas herramientas para una extracción eficiente de datos, convirtiéndola en un activo indispensable para empresas y desarrolladores por igual. Simplifica tus desafíos de extracción de datos con la API DocToText, tu clave para soluciones de extracción de texto precisas, confiables y escalables.

 

¿Qué recibe esta API y qué proporciona tu API (entrada/salida)?

Pasa cualquier documento de tu elección y recibe el texto reconocido. 

Formatos: DOC, XLS, XLSB, PPT, RTF, ODF (ODT, ODS, ODP), OOXML (DOCX, XLSX, PPTX), iWork (PAGES, NUMBERS, KEYNOTE), ODFXML (FODP, FODS, FODT), PDF, EML, HTML, Outlook (PST, OST), Imagen (JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP)

 

¿Cuáles son los casos de uso más comunes de esta API?

  1. Archivado digital y gestión de documentos: Las empresas y organizaciones pueden utilizar la API DocToText para convertir grandes volúmenes de documentos, incluidas imágenes escaneadas y PDFs, en texto editable y buscable. Esto facilita un archivado digital y gestión de documentos eficientes, permitiendo la recuperación y edición de información de manera sencilla. Bibliotecas, sociedades históricas y organizaciones gubernamentales pueden digitalizar documentos históricos para fines de preservación e investigación.

  2. Inteligencia empresarial y análisis de datos: Las empresas pueden emplear la API DocToText para extraer datos textuales de diversos informes, facturas y documentos financieros. Al convertir estos datos en formatos estructurados, como CSV o JSON, las empresas pueden realizar un análisis de datos en profundidad. Este caso de uso es particularmente valioso para instituciones financieras, empresas de investigación de mercado y plataformas de comercio electrónico, ayudándoles a obtener información valiosa de datos textuales.

  3. Agregación y análisis de contenido: Las empresas de monitoreo de medios, agencias de noticias y agregadores de contenido pueden utilizar la API DocToText para extraer texto de artículos, blogs y publicaciones en redes sociales. Al convertir estos datos no estructurados en texto legible, estas organizaciones pueden automatizar el proceso de agregación de contenido. Los algoritmos de Procesamiento de Lenguaje Natural (NLP) pueden luego aplicarse para análisis de sentimientos, modelado de temas y otras formas de análisis de contenido.

  4. Soporte y servicio al cliente automatizados: Las empresas con grandes volúmenes de interacciones con clientes, como correos electrónicos y tickets de soporte, pueden beneficiarse de la API DocToText. Al convertir consultas y comentarios de clientes en texto plano, las empresas pueden emplear chatbots y sistemas automatizados para proporcionar respuestas rápidas y precisas. Esto no solo mejora la satisfacción del cliente al proporcionar un soporte oportuno, sino que también reduce la carga de trabajo de los agentes de soporte al cliente humanos.

  5. Enriquecimiento de datos para modelos de aprendizaje automático: Los desarrolladores de aprendizaje automático y los científicos de datos pueden utilizar la API DocToText para preprocesar datos textuales para el entrenamiento de modelos de aprendizaje automático. Al convertir documentos en texto plano, esta API asegura que los datos estén en un formato consistente, listos para la extracción de características y entrenamiento de modelos. Este caso de uso es crucial en diversas aplicaciones, incluido el análisis de sentimientos, la traducción de idiomas y la resumen de textos.

 

¿Hay alguna limitación en tus planes?

Además del número de llamadas a la API disponibles para el plan, no hay otras limitaciones.

Documentación de la API

Endpoints


Enviar archivo para extracción

Los formatos incluyen:

DOC, XLS, XLSB, PPT, RTF, ODF (ODT, ODS, ODP),
OOXML (DOCX, XLSX, PPTX), iWork (PAGES, NUMBERS, KEYNOTE),
ODFXML (FODP, FODS, FODT), PDF, EML, HTML, Outlook (PST, OST),
Imagen (JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP)



                                                                            
POST https://zylalabs.com/api/2677/doc+a+texto+api/2781/extraer+texto.
                                                                            
                                                                        

Extraer texto. - Características del Endpoint

Objeto Descripción
Cuerpo de la Solicitud [Requerido] Archivo Binario
Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                            

IP Address Classes Range:

Class                           IP Address Range (Theoretical)  Application / Used for        
A                               0.0.0.0 to 127.255.255.255      Very large networks           
B                               128.0.0.0 to 191.255.255.255    Medium networks               
C                               192.0.0.0 to 223.255.255.255    Small networks                
D                               224.0.0.0 to 239.255.255.255    Multicast                     



                                                                                                                                                                                                                    
                                                                                                    

Extraer texto. - CÓDIGOS DE EJEMPLO


    curl --location 'https://zylalabs.com/api/2677/doc+a+texto+api/2781/extraer+texto.' \
    --header 'Content-Type: application/json' \ 
    --form 'image=@"FILE_PATH"'


Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el Doc a Texto API simplemente incluye tu token de portador en el encabezado de Autorización.
Encabezados
Encabezado Descripción
Autorización [Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en
$ 10.000/Año


  • Volumen Personalizado
  • Límite de solicitudes personalizado
  • Soporte al Cliente Especializado
  • Monitoreo de API en Tiempo Real

Funciones favoritas de los clientes

  • ✔︎ Paga Solo por Solicitudes Exitosas
  • ✔︎ Prueba Gratuita de 7 Días
  • ✔︎ Soporte Multilenguaje
  • ✔︎ Una Clave API, Todas las APIs.
  • ✔︎ Panel de Control Intuitivo
  • ✔︎ Manejo de Errores Integral
  • ✔︎ Documentación Amigable para Desarrolladores
  • ✔︎ Integración con Postman
  • ✔︎ Conexiones HTTPS Seguras
  • ✔︎ Tiempo de Actividad Fiable

Doc a Texto API FAQs

The DocToText API is a data extraction tool that converts a variety of document formats, including DOC, PDF, images, and emails, into plain text and HTML. It utilizes advanced OCR and email parsing capabilities to extract text from scanned documents and emails, making the content easily accessible for further processing.

The DocToText API supports a wide range of formats, including DOC, XLS, PPT, PDF, various email formats (EML, PST, OST), and image formats (JPG, PNG, TIFF). It also handles specialized formats like iWork (PAGES, NUMBERS, KEYNOTE) and Outlook (PST, OST), ensuring compatibility with diverse data sources.

The OCR technology integrated into the DocToText API is of high-grade quality. It is designed to accurately recognize text from scanned documents, images, and PDFs, ensuring reliable extraction even from complex or low-quality input sources.

Yes, the DocToText API is well-suited for both small tasks and large-scale data extraction projects. Its scalability allows it to efficiently process high volumes of documents, making it ideal for applications requiring extensive data extraction.

The primary functionality of the DocToText API is to extract plain text and HTML from documents. While it focuses on textual content, it may not retain intricate formatting or images during the conversion process.

The DocToText API returns extracted text in plain text and HTML formats. This includes recognized text from various document types, such as DOC, PDF, and images, allowing users to easily access and manipulate the content.

The response data primarily includes the extracted text content. Depending on the document type, it may also contain metadata such as the original file name, format, and any relevant processing information.

The response data is structured in a JSON format, typically containing fields for the extracted text, file metadata, and any error messages if applicable. This organization allows for easy parsing and integration into applications.

The endpoint accepts parameters such as the document file (in supported formats), and optional settings for OCR customization, such as language selection or specific extraction options to enhance accuracy.

Users can customize requests by specifying parameters like the desired output format (plain text or HTML) and selecting OCR settings, such as language or extraction preferences, to tailor the results to their needs.

The API provides access to textual data extracted from documents, including scanned images, emails, and various file formats. This enables users to retrieve information for digital archiving, data analysis, and content aggregation.

Data accuracy is maintained through advanced OCR technology that is scriptable and trainable. Continuous updates and enhancements ensure the API adapts to new formats and improves extraction reliability over time.

Typical use cases include digital archiving of documents, data analysis for business intelligence, content aggregation for media monitoring, and preprocessing text for machine learning applications, enhancing data accessibility and usability.

General FAQs

Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.

Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]


Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.

La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.

Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]

Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.

Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.

Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.

Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.

Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.

Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.

El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.

Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.

Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]

Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.

Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.

Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.

Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.

 Nivel de Servicio
100%
 Tiempo de Respuesta
0ms

Categoría:


APIs Relacionadas