Smart Web Scraper es una API rápida y fiable para extraer contenido estructurado de cualquier página web pública
Envía una URL y recibe datos limpios:
Diseñado para generación de leads, análisis SEO, agregación de contenido, flujos de trabajo de IA y herramientas de investigación Maneja la detección de codificación, la sanitización de HTML y la extracción de contenido automáticamente
Raspar Página Web - Características del Endpoint
| Objeto | Descripción |
|---|---|
url |
[Requerido] The full URL of the web page to scrape |
{"title":"Facebook","body":"Explore the things you love.","meta":{},"favicon":"https://static.xx.fbcdn.net/rsrc.php/y1/r/ay1hV6OlegS.ico","canonicalUrl":"https://www.facebook.com/","isAmp":false,"hasSchemaOrg":false,"hasJsonLd":false,"lang":"en","url":"https://www.facebook.com"}
curl --location --request GET 'https://zylalabs.com/api/12311/web+scraper+api/23127/scrape+web+page?url=https://www.facebook.com' --header 'Authorization: Bearer YOUR_API_KEY'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
The Web Scraper API can extract structured content including the title, body text, metadata (such as description and keywords), Open Graph tags, favicons, canonical URLs, language detection, and support for AMP pages.
The API returns the extracted data in a clean, structured format that includes fields for title, body text, meta tags, Open Graph data, favicons, and more, allowing for easy integration into applications.
The Web Scraper API is ideal for lead generation, SEO analysis, content aggregation, AI pipelines, and research tools, enabling users to gather and analyze web content efficiently.
The API uses Mozilla Readability to extract article-quality content, ensuring that the title and body text are clean and relevant, while also handling HTML sanitization and encoding detection automatically.
Yes, the Web Scraper API can detect and extract structured data formats including Schema.org and JSON-LD, providing users with additional context and information from web pages.
La API de Web Scraper devuelve datos estructurados que incluyen el título, el texto del cuerpo, los metadatos (como la descripción y las palabras clave), las etiquetas de Open Graph, el favicon, la URL canónica, el idioma y la detección de datos estructurados (Schema.org y JSON-LD)
Los campos clave en la respuesta incluyen "título" "cuerpo" "meta" (para metadatos) "favicon" "canonicalUrl" "lang" (idioma) "isAmp" (soporte AMP) "hasSchemaOrg" y "hasJsonLd" proporcionando detalles completos del contenido
Los datos de respuesta están organizados en un formato JSON con cada clave representando una pieza específica de información sobre la página web extraída lo que facilita su análisis e integración en aplicaciones
El parámetro principal para el punto final es la URL de la página web que se va a raspar Los usuarios pueden personalizar sus solicitudes especificando diferentes URLs para extraer datos de varias páginas web
Los usuarios pueden utilizar los datos devueltos para diversas aplicaciones como mostrar resúmenes de artículos analizar el rendimiento de SEO agregar contenido para investigación o alimentar datos a modelos de IA para un procesamiento posterior
Los datos se extraen de páginas web accesibles públicamente en internet, asegurando una amplia gama de contenido disponible para el scraping, siempre que las páginas cumplan con las políticas de scraping web
La precisión de los datos se mantiene mediante el uso de técnicas de extracción confiables incluyendo Mozilla Readability para la extracción de contenido y la sanitización automática de HTML para garantizar datos limpios y relevantes
Los casos de uso típicos incluyen la generación de leads para marketing el análisis de SEO para la optimización de sitios web la agregación de contenido para plataformas de noticias o investigación y la alimentación de datos estructurados en flujos de trabajo de IA para obtener información mejorada
Nivel de Servicio:
100%
Tiempo de Respuesta:
878ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.158ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.507ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.697ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
8.219ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
10.154ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.107ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
11.307ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.434ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
171ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
50ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
799ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
811ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
744ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.229ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
14.541ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
143ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
159ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
252ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
749ms