Smart Web Scraper é uma API rápida e confiável para extrair conteúdo estruturado de qualquer página da web pública
Envie uma URL e receba dados limpos:
Construído para geração de leads, análise de SEO, agregação de conteúdo, pipelines de IA e ferramentas de pesquisa Lida com detecção de codificação, saneamento de HTML e extração de conteúdo automaticamente
Extrai uma página da web e retorna conteúdo estruturado incluindo título, texto do corpo, metadados, tags Open Graph, favicon, URL canônica, idioma e detecção de dados estruturados
Extrair Página da Web - Recursos do endpoint
| Objeto | Descrição |
|---|---|
url |
[Obrigatório] The full URL of the web page to scrape |
{"title":"Facebook","body":"Explore the things you love.","meta":{},"favicon":"https://static.xx.fbcdn.net/rsrc.php/y1/r/ay1hV6OlegS.ico","canonicalUrl":"https://www.facebook.com/","isAmp":false,"hasSchemaOrg":false,"hasJsonLd":false,"lang":"en","url":"https://www.facebook.com"}
curl --location --request GET 'https://zylalabs.com/api/12311/web+scraper+api/23127/scrape+web+page?url=https://www.facebook.com' --header 'Authorization: Bearer YOUR_API_KEY'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
The Web Scraper API can extract structured content including the title, body text, metadata (such as description and keywords), Open Graph tags, favicons, canonical URLs, language detection, and support for AMP pages.
The API returns the extracted data in a clean, structured format that includes fields for title, body text, meta tags, Open Graph data, favicons, and more, allowing for easy integration into applications.
The Web Scraper API is ideal for lead generation, SEO analysis, content aggregation, AI pipelines, and research tools, enabling users to gather and analyze web content efficiently.
The API uses Mozilla Readability to extract article-quality content, ensuring that the title and body text are clean and relevant, while also handling HTML sanitization and encoding detection automatically.
Yes, the Web Scraper API can detect and extract structured data formats including Schema.org and JSON-LD, providing users with additional context and information from web pages.
A API Web Scraper retorna dados estruturados incluindo o título, texto do corpo, metadados (como descrição e palavras-chave), tags Open Graph, favicon, URL canônica, idioma e detecção de dados estruturados (Schema.org e JSON-LD)
Os campos principais na resposta incluem "título", "corpo", "meta" (para metadados), "favicon", "canonicalUrl", "lang" (idioma), "isAmp" (suporte AMP), "hasSchemaOrg" e "hasJsonLd", fornecendo detalhes abrangentes sobre o conteúdo
Os dados da resposta estão organizados em um formato JSON, com cada chave representando uma informação específica sobre a página da web raspada, facilitando a análise e a integração em aplicações
O parâmetro principal para o endpoint é a URL da página da web a ser raspada Os usuários podem personalizar suas solicitações especificando diferentes URLs para extrair dados de várias páginas da web
Os usuários podem utilizar os dados retornados para várias aplicações como exibir resumos de artigos analisar o desempenho de SEO agregar conteúdo para pesquisa ou alimentar dados em modelos de IA para processamento adicional
Os dados são extraídos de páginas da web acessíveis ao público em toda a internet, garantindo uma ampla variedade de conteúdo disponível para raspagem, desde que as páginas estejam em conformidade com as políticas de raspagem da web
A precisão dos dados é mantida através do uso de técnicas de extração confiáveis incluindo o Mozilla Readability para extração de conteúdo e sanitização automatizada de HTML para garantir dados limpos e relevantes
Casos de uso típicos incluem geração de leads para marketing análise de SEO para otimização de sites agregação de conteúdo para plataformas de notícias ou pesquisa e alimentação de dados estruturados em pipelines de IA para insights aprimorados
Nível de serviço:
100%
Tempo de resposta:
878ms
Nível de serviço:
100%
Tempo de resposta:
3.158ms
Nível de serviço:
100%
Tempo de resposta:
2.507ms
Nível de serviço:
100%
Tempo de resposta:
10.154ms
Nível de serviço:
100%
Tempo de resposta:
11.307ms
Nível de serviço:
100%
Tempo de resposta:
8.219ms
Nível de serviço:
100%
Tempo de resposta:
2.697ms
Nível de serviço:
100%
Tempo de resposta:
3.107ms
Nível de serviço:
100%
Tempo de resposta:
1.434ms
Nível de serviço:
100%
Tempo de resposta:
5.368ms