Web Content Extractor API

Web Content Extractor API provides fast and easy extraction of clean text and structured data from news and blog articles. Get rid of ads, links, and other unwanted content and focus on the article's main content, making it ideal for NLP and data analysis.

About the API: 

The Web Content Extractor API is a powerful tool for extracting clean text and other structured data from news and blog articles. With this API, you can quickly and easily get rid of ads, links, and other unwanted content, and focus on the main content of the article.

The API uses advanced natural language processing (NLP) techniques to extract relevant information from articles, including the text of the article itself, authors, dates, and other metadata. This information is then returned in a structured format, making it easy to use for data analysis and NLP applications.

The API is designed to be user-friendly and easy to integrate, so you can start using it right away. Whether you're a data analyst looking to perform sentiment analysis on news articles, or a developer looking to build a custom news aggregator, the Web Content Extractor API has everything you need.

With its fast and efficient extraction process, you can quickly process large amounts of articles and extract the information you need. So why wait? Sign up for the Web Content Extractor API today and start getting the most out of your news and blog articles. From clean text to structured data, this API has you covered.

 

What this API receives and what your API provides (input/output)?

Pass the URL of the article from where you want to extract its content. 

 

What are the most common uses cases of this API?

  1. News Aggregation: The API can be used to extract the main text and structured data from news articles to build custom news aggregators.

  2. Sentiment Analysis: The API can extract clean text from articles to perform sentiment analysis and determine the overall sentiment expressed in news articles.

  3. Content Recommendation: The API can extract article text and metadata to create content-based recommendation systems for users.

  4. Data Analysis: The API can extract structured data from articles, such as authors, dates, and keywords, to perform data analysis on news and blog articles.

  5. Text Summarization: The API can extract the main text from articles to create text summaries, making it easier for users to quickly understand the content of articles.



Are there any limitations to your plans?

Besides the number of API calls, there are no other limitations

Documentación de la API

Endpoints


Article Extraction Endpoint

 


                                                                            
GET https://zylalabs.com/api/4570/web+content+extractor+api/5623/text+extractor
                                                                            
                                                                        

Text Extractor - Características del Endpoint

Objeto Descripción
url [Requerido] The URL of the article.
Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                            {"error":0,"message":"Article extraction success","data":{"url":"https://www.drmax.sk/beautyclub/neustale-bojujete-s-chutou-na-sladke-dovodov-moze-byt-viacero","title":"Neustále bojujete s chuťou na sladké? Dôvodov môže byť viacero","description":"Ak sa snažíte žiť zdravo, sledujete obsah svojho jedálnička, dobre spíte a pravidelne sa hýbete, no napriek tomu všetkému sa neviete zbaviť „mlsného“ jazýčka, možno vám chce vaše telo niečo naznačiť.\nNeodolateľná túžba po sladkostiach, sladených nápojoch, ale aj chlebe, cestovinách či tučných syroch môže maskovať jeho snahu čo najrýchlejšie doplniť stratené zásoby energie.\nV prípade, že chcete predchádzať záchvatom vlčieho hladu, mali by ste sa zamyslieť, čo by mohlo byť jeho ozajstnou príčinou....","links":["https://www.drmax.sk/beautyclub/neustale-bojujete-s-chutou-na-sladke-dovodov-moze-byt-viacero"],"image":"https://backend.drmax.sk/media/amasty/blog/zena_s_cukr_kmi.jpg","content":"<div><p class=\"text\">Ak sa sna&#382;&#237;te &#382;i&#357; zdravo, sledujete obsah svojho jed&#225;lni&#269;ka, dobre sp&#237;te a&#160;pravidelne sa h&#253;bete, no napriek tomu v&#353;etk&#233;mu sa neviete zbavi&#357; &#8222;mlsn&#233;ho&#8220; jaz&#253;&#269;ka, mo&#382;no v&#225;m chce va&#353;e telo nie&#269;o nazna&#269;i&#357;. Neodolate&#318;n&#225; t&#250;&#382;ba po sladkostiach, sladen&#253;ch n&#225;pojoch, ale aj chlebe, cestovin&#225;ch &#269;i tu&#269;n&#253;ch syroch m&#244;&#382;e maskova&#357; jeho snahu &#269;o najr&#253;chlej&#353;ie doplni&#357; straten&#233; z&#225;soby energie. V&#160;pr&#237;pade, &#382;e chcete predch&#225;dza&#357; z&#225;chvatom vl&#269;ieho hladu, mali by ste sa zamyslie&#357;, &#269;o by mohlo by&#357; jeho ozajstnou pr&#237;&#269;inou.</p></div>","author":"Redakcia Beautyclub Dr.Max, Mgr. Daniela Tomčíková, O Autorovi, Čítať Viac Od Autora","favicon":"/favicon.ico","source":"www.drmax.sk","published":"Unknown Date","ttr":0.36,"plain_text":"Ak sa snažíte žiť zdravo, sledujete obsah svojho jedálnička, dobre spíte a pravidelne sa hýbete, no napriek tomu všetkému sa neviete zbaviť „mlsného“ jazýčka, možno vám chce vaše telo niečo naznačiť. Neodolateľná túžba po sladkostiach, sladených nápojoch, ale aj chlebe, cestovinách či tučných syroch môže maskovať jeho snahu čo najrýchlejšie doplniť stratené zásoby energie. V prípade, že chcete predchádzať záchvatom vlčieho hladu, mali by ste sa zamyslieť, čo by mohlo byť jeho ozajstnou príčinou.","ttr_disclaimer":"Assuming 200 wpm reading speed"}}
                                                                                                                                                                                                                    
                                                                                                    

Text Extractor - CÓDIGOS DE EJEMPLO


curl --location --request GET 'https://zylalabs.com/api/4570/web+content+extractor+api/5623/text+extractor?url=https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el Web Content Extractor API simplemente incluye tu token de portador en el encabezado de Autorización.
Encabezados
Encabezado Descripción
Autorización [Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en
$ 10.000/Año


  • Volumen Personalizado
  • Límite de solicitudes personalizado
  • Soporte al Cliente Especializado
  • Monitoreo de API en Tiempo Real

Funciones favoritas de los clientes

  • ✔︎ Paga Solo por Solicitudes Exitosas
  • ✔︎ Prueba Gratuita de 7 Días
  • ✔︎ Soporte Multilenguaje
  • ✔︎ Una Clave API, Todas las APIs.
  • ✔︎ Panel de Control Intuitivo
  • ✔︎ Manejo de Errores Integral
  • ✔︎ Documentación Amigable para Desarrolladores
  • ✔︎ Integración con Postman
  • ✔︎ Conexiones HTTPS Seguras
  • ✔︎ Tiempo de Actividad Fiable

Web Content Extractor API FAQs

The Web Content Extractor API is a tool that allows users to extract textual content from web pages. It is designed to retrieve and process the main body of text from articles, blogs, and other web content, filtering out irrelevant elements like advertisements, navigation menus, and sidebars.

The Web Content Extractor API accepts URLs as input in JSON format and returns the extracted content in JSON format. The output typically includes the main text, title, author, publication date, and other relevant metadata.

Access to the Web Content Extractor API is authenticated using API keys. You need to sign up for an API key through our developer portal. Once you have your key, include it in the header of your HTTP requests using the Authorization parameter.

The Web Content Extractor API supports multiple languages and can process web pages with various character encodings. The API automatically detects the language and encoding of the input web page and returns the extracted content in UTF-8 format.

The Web Content Extractor API employs advanced algorithms and machine learning techniques to accurately extract the main text from web pages. While it achieves high accuracy, the extraction quality can vary depending on the complexity and structure of the web page.

The Web Content Extractor API returns structured data including the main article text, title, description, author, publication date, and associated links. This data is formatted in JSON, making it easy to integrate into applications.

The key fields in the response data include "url" (the source URL), "title" (the article title), "description" (the main content), "links" (related URLs), and "image" (associated media). These fields provide comprehensive information about the extracted article.

The response data is organized in a JSON structure with a top-level object containing an "error" code, a "message," and a "data" object. The "data" object includes all extracted fields, allowing for straightforward access to the content.

The API provides information such as the article's main text, title, author, publication date, and links to related content. This makes it suitable for various applications, including sentiment analysis and content recommendation.

Users can customize their data requests by specifying the URL of the article they wish to extract. The API processes this input to return tailored content based on the provided URL, ensuring relevant data extraction.

Typical use cases include news aggregation, sentiment analysis, content recommendation systems, data analysis, and text summarization. The API's ability to extract clean text and structured data supports diverse applications in NLP and data science.

Data accuracy is maintained through advanced algorithms and machine learning techniques that analyze web page structures. Continuous updates and improvements to the extraction process help ensure high-quality results across various content types.

The API employs quality checks by validating the extracted data against known patterns and structures of web content. This helps to minimize errors and ensures that the returned data is relevant and reliable for users.

General FAQs

Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.

Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]


Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.

La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.

Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]

Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.

Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.

Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.

Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.

Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.

Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.

El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.

Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.

Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]

Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.

Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.

Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.

Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.


APIs Relacionadas


También te puede interesar