Raspador de Página HTML API

API de HTML para Extração de Páginas: Otimize a extração de dados com facilidade. Capacite aplicações com conjuntos de dados estruturados e ricos
Use esta API do seu agente de IA via MCP
Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.
Docs e configuração
Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Sobre a API:  

No cenário digital em constante evolução, extrair dados valiosos de sites se tornou uma tarefa crucial para os usuários. À medida que a demanda por recuperação de dados eficiente e automatizada aumenta, a Page Scraper HTML API surge como uma solução poderosa que oferece uma maneira simples e versátil de coletar dados estruturados da vasta extensão da World Wide Web.

A Page Scraper HTML API é uma ferramenta sofisticada projetada para simplificar o processo de web scraping, uma técnica utilizada para extrair dados de sites. Esta API funciona enviando solicitações para páginas da web, recuperando o código HTML subjacente e, em seguida, analisando e extraindo as informações desejadas. Esta solução inovadora fornece uma interface estruturada para os usuários integrarem funções de web scraping em suas aplicações, permitindo que eles coletem, organizem e utilizem dados de uma variedade de fontes online com facilidade.

Os usuários consideram a Page Scraper HTML API muito acessível e fácil de integrar, graças à sua interface bem documentada e design simples. Independentemente de seu nível de experiência, os usuários podem incorporar de forma contínua a funcionalidade de web scraping em suas aplicações com a ajuda da documentação abrangente e dos exemplos de código fornecidos pela API.

Consciente da natureza dinâmica da Web, a Page Scraper HTML API incorpora mecanismos robustos de tratamento de erros. Ela pode lidar graciosamente com mudanças na estrutura do site, adaptar-se ao conteúdo em evolução e fornecer mensagens de erro informativas para facilitar a solução rápida de problemas. Isso garante uma experiência de web scraping confiável e resiliente, permitindo que os usuários se concentrem em extrair informações valiosas em vez de resolver problemas imprevistos.

Em conclusão, a Page Scraper HTML API se destaca como uma poderosa aliada para os usuários que buscam aproveitar a vasta quantidade de dados disponíveis na Internet. Com seu design fácil de usar e recursos robustos, esta API oferece uma solução completa para web scraping eficiente e preciso, abrindo caminho para aplicações inovadoras em diversas indústrias. À medida que o cenário digital continua a evoluir, a Page Scraper HTML API se afirma como um habilitador chave para aqueles que buscam se manter à frente na era orientada por dados.

 

O que esta API recebe e o que sua API fornece (entrada/saída)?

Ela receberá parâmetros e fornecerá um JSON.

 

Quais são os casos de uso mais comuns desta API?

  1. Monitoramento de Concorrentes: Analisar os sites dos concorrentes para acompanhar preços de produtos, promoções e mudanças em suas estratégias.

    Pesquisa de Mercado: Coletar dados sobre tendências do setor, preferências dos clientes e dinâmicas de mercado de várias fontes online.

    Agregação de Conteúdo: Coletar e organizar automaticamente artigos, posts de blogs e notícias de diversos sites para curadoria de conteúdo.

    Comparação de Preços: Monitorar e comparar preços de produtos em várias plataformas de e-commerce para informar estratégias de preços.

    Análise de Dados Financeiros: Extrair dados financeiros de diferentes fontes para análise abrangente e decisões de investimento informadas.

 

Existem limitações nos seus planos?

Além do número de chamadas da API, não há outra limitação.

Documentação da API

Endpoints


Para usar este endpoint você deve indicar a URL de um site no parâmetro



                                                                            
GET https://zylalabs.com/api/3310/page+scraper+html+api/3562/extract+html
                                                                            
                                                                        

Extrair HTML - Recursos do endpoint

Objeto Descrição
url [Obrigatório] Enter a URL
Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"url":"https:\/\/beaute-pacifique.com\/","extractions":[],"h1":"","h2":"","h3":"","h4":"","title":"Beaut\u00e9 Pacifique \u2013 Main site","tags":{"li":{"0":"Frontpage","1":"Magazine","2":"Profile","3":"In store","4":"Contact","6":"Login"},"div":{"0":"Basket logo","1":"Frontpage Magazine Profile In store Contact","2":"Follow Beaut\u00e9 Pacifique on our social medias and automatically receive all our latest news, directly in your news feed. facebookIcon instagramIcon","3":"Contact Contact Login","4":"\u00a9 2024 Beaut\u00e9 Pacifique - Expect more from your skincare","5":"Basket","8":"logo","13":"Select your country Australia Baltic States Belgium Canada Chile Czech Republic Denmark Germany International Japan Netherlands Norway Slovakia South Africa Sweden United Kingdom USA Remember","16":"Select your country","17":"Australia Baltic States Belgium Canada Chile Czech Republic Denmark Germany International Japan Netherlands Norway Slovakia South Africa Sweden United Kingdom USA Remember","18":"Remember","22":"Contact","24":"Contact Login"},"script":["{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Organization\",\"@id\":\"https:\/\/beaute-pacifique.com\/#organization\",\"name\":\"Beaut\\u00e9 Pacifique\",\"url\":\"https:\/\/beaute-pacifique.com\",\"logo\":{\"@type\":\"ImageObject\",\"@id\":\"https:\/\/beaute-pacifique.com\/#logo\",\"url\":\"https:\/\/beaute-pacifique.com\/wp-content\/uploads\/2018\/01\/logo.png\",\"contentUrl\":\"https:\/\/beaute-pacifique.com\/wp-content\/uploads\/2018\/01\/logo.png\",\"caption\":\"Beaut\\u00e9 Pacifique\",\"inLanguage\":\"en-GB\",\"width\":\"280\",\"height\":\"59\"}},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/beaute-pacifique.com\/#website\",\"url\":\"https:\/\/beaute-pacifique.com\",\"name\":\"Beaut\\u00e9 Pacifique\",\"publisher\":{\"@id\":\"https:\/\/beaute-pacifique.com\/#organization\"},\"inLanguage\":\"en-GB\",\"potentialAction\":{\"@type\":\"SearchAction\",\"target\":\"https:\/\/beaute-pacifique.com\/?s={search_term_string}\",\"query-input\":\"required name=search_term_string\"}},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/beaute-pacifique.com\/#webpage\",\"url\":\"https:\/\/beaute-pacifique.com\/\",\"name\":\"Frontpage - Beaut\\u00e9 Pacifique - Main site\",\"datePublished\":\"2017-11-10T13:28:03+01:00\",\"dateModified\":\"2023-11-30T14:22:34+01:00\",\"about\":{\"@id\":\"https:\/\/beaute-pacifique.com\/#organization\"},\"isPartOf\":{\"@id\":\"https:\/\/beaute-pacifique.com\/#website\"},\"inLanguage\":\"en-GB\"}]}"],"header":["Basket logo Frontpage Magazine Profile In store Contact"],"nav":["Frontpage Magazine Profile In store Contact","Contact Login"],"section":["Select your country Australia Baltic States Belgium Canada Chile Czech Republic Denmark Germany International Japan Netherlands Norway Slovakia South Africa Sweden United Kingdom USA Remember","Follow Beaut\u00e9 Pacifique on our social medias and automatically receive all our latest news, directly in your news feed. facebookIcon instagramIcon Contact Contact Login \u00a9 2024 Beaut\u00e9 Pacifique - Expect more from your skincare"],"a":[{"href":"https:\/\/www.facebook.com\/BeautePacifiqueDanmark\/","txt":"facebookIcon"},{"href":"https:\/\/www.instagram.com\/beautepacifique_official\/","txt":"instagramIcon"}]},"all_classes":{"0":"menu-item","1":"menu-item-type-post_type","2":"menu-item-object-page","3":"newContainer","5":"search-container","6":"rank-math-schema","7":"new-header","8":"header-top","9":"basket_top","10":"icon","11":"text","12":"mobile-mid-header","13":"mobile-mid-items-container","14":"header-middle","15":"logo","16":"quick-menu","17":"mobileNavWrapper","18":"fa","19":"fa-bars","20":"nav-wrapper","21":"header-bottom","22":"newNavContainer","23":"menu-mainmenu-container","24":"menu-item-home","25":"current-menu-item","26":"page_item","27":"page-item-15","28":"current_page_item","29":"menu-item-51","30":"menu-item-77","31":"menu-item-74","32":"menu-item-461","33":"menu-item-449","34":"countryPicker","35":"smallContainer","36":"fixedCountryPicker","37":"countryPickerContainer","38":"countryPickerHeading","39":"countryList","40":"remember_container","41":"footer","42":"footerSocials","43":"facebook","44":"instagram","45":"youtube","46":"newFooterContainer","47":"bigFooterNagivation","48":"footer_information","49":"footer_header","50":"footer_menu","51":"menu-footer-container","52":"menu-item-2195","53":"menu-item-type-custom","54":"menu-item-object-custom","55":"menu-item-2196","56":"footerNav"}}
                                                                                                                                                                                                                    
                                                                                                    

Extrair HTML - TRECHOS DE CÓDIGO


curl --location --request GET 'https://zylalabs.com/api/3310/page+scraper+html+api/3562/extract+html?url=https://wikipedia.org' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a Raspador de Página HTML API basta incluir seu token Bearer no cabeçalho Authorization.
Cabeçalhos
Cabeçalho Descrição
Authorization [Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

🚀 Empresarial

A partir de
$ 10.000/Ano


  • Volume personalizado
  • Limite de taxa personalizado
  • Suporte ao cliente especializado
  • Monitoramento de API em tempo real

Recursos favoritos dos clientes

  • ✔︎ Pague apenas por requisições bem-sucedidas
  • ✔︎ Teste 7 dias gratis
  • ✔︎ Suporte multilíngue
  • ✔︎ Uma chave de API, todas as APIs.
  • ✔︎ Painel intuitivo
  • ✔︎ Tratamento de erros abrangente
  • ✔︎ Documentação amigável para desenvolvedores
  • ✔︎ Integração com Postman
  • ✔︎ Conexões HTTPS seguras
  • ✔︎ Alta disponibilidade

Raspador de Página HTML API FAQs

Para usar esta API os usuários devem inserir a URL de um site para obter seu HTML

A API de HTML Page Scraper é uma ferramenta poderosa projetada para que os usuários extraiam dados estruturados de sites de forma integrada

Existem diferentes planos para atender a todos os gostos incluindo um teste gratuito para um pequeno número de solicitações mas sua taxa é limitada para evitar abusos do serviço

Zyla oferece uma ampla gama de métodos de integração para quase todas as linguagens de programação Você pode usar esses códigos para integrar com seu projeto conforme necessário

O endpoint Extract HTML retorna dados estruturados da URL especificada, incluindo tags HTML, cabeçalhos (h1, h2, h3, h4) e um título. Ele fornece uma resposta JSON que organiza essas informações para fácil acesso

Os campos principais na resposta incluem "url" (a URL solicitada), "extractions" (dados analisados), "h1", "h2", "h3", "h4" (tags de cabeçalho), "title" (título da página) e "tags" (uma análise dos elementos HTML)

Os dados de resposta estão organizados em um formato JSON, com chaves de nível superior para a URL, extrações, cabeçalhos, título e tags. Cada tipo de tag (como "li" e "div") contém um array de conteúdo, facilitando a navegação

O endpoint Extrair HTML fornece informações como títulos de página, cabeçalhos e conteúdo estruturado de vários elementos HTML permitindo que os usuários coletem dados abrangentes de páginas da web

Os usuários podem personalizar suas solicitações especificando diferentes URLs na chamada da API A API então extrairá e retornará dados específicos da página da web fornecida permitindo a recuperação de dados personalizada

Na resposta "url" indica a página de origem "title" fornece o título da página "h1" a "h4" representam diferentes níveis de cabeçalho e "tags" categorizam os elementos HTML extraídos facilitando a organização dos dados

A precisão dos dados é mantida por meio de robustos mecanismos de tratamento de erros que se adaptam a mudanças nas estruturas dos sites A API fornece mensagens de erro informativas para ajudar os usuários a solucionar problemas de forma eficaz

Casos de uso típicos incluem monitoramento de concorrentes, pesquisa de mercado, agregação de conteúdo, comparação de preços e análise de dados financeiros permitindo que os usuários aproveitem dados estruturados para tomar decisões informadas

Perguntas Frequentes Gerais

O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.

Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]


Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.

A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.

Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]

Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.

As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.

O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.

Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.

Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.

Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.

O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.

Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.

Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]

Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.

Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.

Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.

As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.


APIs relacionadas


Você também pode gostar