Content Scraper API

A API de Content Scraper fornece extração rápida e fácil de texto limpo e dados estruturados de artigos de notícias e blogs Elimine anúncios links e outros conteúdos indesejados e concentre-se no conteúdo principal do artigo tornando-o ideal para NLP e análise de dados
Use esta API do seu agente de IA via MCP
Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.
Docs e configuração
Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Sobre a API: 

A API Content Scraper é uma ferramenta poderosa para extrair texto limpo e outros dados estruturados de artigos de notícias e blogs. Com esta API, você pode rapidamente se livrar de anúncios, links e outros conteúdos indesejados, e focar no conteúdo principal do artigo.

A API utiliza técnicas avançadas de processamento de linguagem natural (NLP) para extrair informações relevantes de artigos, incluindo o texto do próprio artigo, autores, datas e outros metadados. Essas informações são então retornadas em um formato estruturado, facilitando seu uso para análise de dados e aplicações de NLP.

A API foi projetada para ser amigável ao usuário e fácil de integrar, para que você possa começar a usá-la imediatamente. Seja você um analista de dados buscando realizar análise de sentimentos em artigos de notícias, ou um desenvolvedor buscando construir um agregador de notícias personalizado, a API Content Scraper tem tudo o que você precisa.

Com seu processo de extração rápido e eficiente, você pode processar grandes quantidades de artigos e extrair as informações de que precisa rapidamente. Então, por que esperar? Inscreva-se na API Content Scraper hoje e comece a aproveitar ao máximo seus artigos de notícias e blogs. Desde texto limpo até dados estruturados, esta API tem o que você precisa.

 

O que esta API recebe e o que sua API fornece (entrada/saída)?

Forneça a URL do artigo de onde você deseja extrair seu conteúdo. 

 

Quais são os casos de uso mais comuns desta API?

  1. Agregação de Notícias: A API pode ser usada para extrair o texto principal e dados estruturados de artigos de notícias para construir agregadores de notícias personalizados.

  2. Análise de Sentimentos: A API pode extrair texto limpo de artigos para realizar análise de sentimentos e determinar o sentimento geral expresso em artigos de notícias.

  3. Recomendação de Conteúdo: A API pode extrair texto de artigos e metadados para criar sistemas de recomendação baseados em conteúdo para os usuários.

  4. Análise de Dados: A API pode extrair dados estruturados de artigos, como autores, datas e palavras-chave, para realizar análise de dados em artigos de notícias e blogs.

  5. Sumarização de Texto: A API pode extrair o texto principal de artigos para criar resumos de texto, facilitando a compreensão rápida do conteúdo dos artigos pelos usuários.



Há alguma limitação em seus planos?

Além do número de chamadas da API, não há outras limitações

Documentação da API

Endpoints


Ponto de Extração de Artigos

 


                                                                            
GET https://zylalabs.com/api/4557/content+scraper+api/5610/extrator+de+texto
                                                                            
                                                                        

Extrator de Texto - Recursos do endpoint

Objeto Descrição
url [Obrigatório] The URL of the article.
Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"error":0,"message":"Article extraction success","data":{"url":"https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/","title":"Use This Data Extractor API To Get Article Data From Mathrubhumi","description":"Use This Data Extractor API To Get Article Data From MathrubhumiDo you want to get article data from Mathrubhumi?\nBusinesses and individuals who want to use the vast amount of publicly available web data to improve their decisions frequently use data gathering.\nTo retrieve data from Mathrubhumi, you must utilize an API, such as Article Data Extractor API.\nFollowing API requests, this produces replies that seem as follows:Why Article Data Extractor API?\nAmong the most useful APIs for obtaining all data sets is the Article Data Extractor API....","links":["https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/"],"image":"https://www.thestartupfounder.com/wp-content/uploads/2022/11/mathrubhumi_scr_480.jpg","content":"<div><p class=\"post-header\">\n\t\t\t<h1 class=\"post-title\">Use This Data Extractor API To Get Article Data From Mathrubhumi</h1>\n\t\t\t \t\t</p><p>Do you want to get article data from Mathrubhumi? You can use this data extractor API to do so!</p>\n\n\n\n<p>Data analysis is the automated gathering of structured web content. Some of the key uses of this technique are pricing tracking, price information, news checking, lead generation, and market analysis.</p>\n\n\n\n \n\n\n\n<p>Businesses and individuals who want to use the vast amount of publicly available web data to improve their decisions frequently use data gathering. This makes it possible to gather, analyze, and classify the millions of objects that are generated every day on the globe. You will be capable of quickly distinguishing between factual and false information as well as information that best serves different views.</p>\n\n\n\n<p>You have already accomplished what a web scraper does if you have ever directly transcribed material from a website. Instead of the tedious and difficult process of manually gathering information, web content management leverages sophisticated automation to harvest hundreds, thousands, or even billions of data sets from the unlimited expanse of the Web.</p>\n\n\n\n<p>Data gathering is commonly employed. Furthermore, it shouldn&#8217;t be a shock because it provides structured web data from any publicly available page, something no other company can. The fundamental value of data mining lies in its ability to invent and fuel a number of the most innovative commercial apps ever developed. It is not merely a contemporary convenience.</p>\n\n\n\n<p>The adjective &#8220;inspiring&#8221; isn&#8217;t an exaggeration when used to characterize how certain companies are using data obtained from the internet to improve their efficiency, impacting everything from SEO selections to how each customer is served.</p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>How Can Data Extraction Be Used?</strong></h2>\n\n\n\n<p>Data extraction from the internet, often known as data scraping, has a wide range of uses. Using a data extraction tool will enable you to quickly and accurately automate the process of getting information from other sites. Furthermore, it may guarantee that the information you&#8217;ve obtained is correctly organized, making it simple to assess and use for subsequent jobs.</p>\n\n\n\n<p>A wide range of fields, such as media, risk management, real estate, scientific work, SEO tracking, opportunity assessment, data-driven advertising, and lead generation, heavily rely on web and data mining technology.</p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Apply An API</strong></h2>\n\n\n\n<p>The term &#8220;API&#8221; refers to a modern programming interface in the digital era. This artificial intelligence method allows you to automate various processes, which helps to increase productivity. </p>\n\n\n\n<p>Being capable of depending on APIs will save you from wasting too much time seeking material in an age where content is created every moment. To retrieve data from Mathrubhumi, you must utilize an API, such as <a href=\"https://www.zylalabs.com/api-marketplace/data/article+data+extractor+api/35?utm_source=TSF&amp;utm_medium=Post&amp;utm_campaign=29124&amp;utm_term=11\">Article Data Extractor API</a>. Following API requests, this produces replies that seem as follows:</p>\n\n\n\n \n\n\n\n \n\n\n\n<h2 class=\"wp-block-heading\"><strong>Why Article Data Extractor API?</strong></h2>\n\n\n\n<p>Among the most useful APIs for obtaining all data sets is the<a href=\"https://www.zylalabs.com/api-marketplace/data/article+data+extractor+api/35?utm_source=TSF&amp;utm_medium=Post&amp;utm_campaign=29124&amp;utm_term=11\"> Article Data Extractor API</a>. Your selection of programming language will be returned along with the title, text, and images when you just use a URL to contact the API. By gathering a significant quantity of data in a short period for analysis and classification, you may create high-quality journalism.</p>\n<h3 class=\"sd-title\">Share this:</h3><ul><li class=\"share-print\"><a rel=\"nofollow noopener noreferrer\" class=\"share-print sd-button share-icon\" href=\"https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/#print\" target=\"_blank\" title=\"Click to print\"><p>Print</p></a></li><li class=\"share-email\"><a rel=\"nofollow noopener noreferrer\" class=\"share-email sd-button share-icon\" href=\"/cdn-cgi/l/email-protection#77480402151d1214034a524235241f1605121352454727180403524233524547220412524547231f1e0452454733160316524547320f0305161403180552454736273e52454723185245473012035245473605031e141b12524547331603165245473105181a5245473a16031f0502151f021a1e511518130e4a1f0303070452443652453152453100000059031f1204031605030207111802191312055914181a5245310204125a031f1e045a131603165a120f030516140318055a16071e5a03185a1012035a1605031e141b125a131603165a1105181a5a1a16031f0502151f021a1e52453151041f1605124a121a161e1b\" target=\"_blank\" title=\"Click to email a link to a friend\"><p>Email</p></a></li><li class=\"share-twitter\"><a rel=\"nofollow noopener noreferrer\" class=\"share-twitter sd-button share-icon\" href=\"https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/?share=twitter\" target=\"_blank\" title=\"Click to share on Twitter\"><p>Twitter</p></a></li><li class=\"share-reddit\"><a rel=\"nofollow noopener noreferrer\" class=\"share-reddit sd-button share-icon\" href=\"https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/?share=reddit\" target=\"_blank\" title=\"Click to share on Reddit\"><p>Reddit</p></a></li><li class=\"share-jetpack-whatsapp\"><a rel=\"nofollow noopener noreferrer\" class=\"share-jetpack-whatsapp sd-button share-icon\" href=\"https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/?share=jetpack-whatsapp\" target=\"_blank\" title=\"Click to share on WhatsApp\"><p>WhatsApp</p></a></li><li class=\"share-facebook\"><a rel=\"nofollow noopener noreferrer\" class=\"share-facebook sd-button share-icon\" href=\"https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/?share=facebook\" target=\"_blank\" title=\"Click to share on Facebook\"><p>Facebook</p></a></li><li class=\"share-linkedin\"><a rel=\"nofollow noopener noreferrer\" class=\"share-linkedin sd-button share-icon\" href=\"https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/?share=linkedin\" target=\"_blank\" title=\"Click to share on LinkedIn\"><p>LinkedIn</p></a></li><li class=\"share-end\"></ul><h3 class=\"sd-title\">Like this:</h3><p class=\"likes-widget-placeholder post-likes-widget-placeholder\"><p class=\"button\"><p>Like</p></p> <p class=\"loading\">Loading...</p></p><p class=\"sd-text-color\"></p><a class=\"sd-link-color\"></a></div>","author":"Alejandro Brega","favicon":"https://i0.wp.com/www.thestartupfounder.com/wp-content/uploads/2022/07/cropped-Screen-Shot-2022-07-18-at-19.11.23.png?fit=32%2C32&ssl=1","source":"www.thestartupfounder.com","published":"2022-11-11T15:54:58+00:00","ttr":2.51},"_note":"Response truncated for documentation purposes"}
                                                                                                                                                                                                                    
                                                                                                    

Extrator de Texto - TRECHOS DE CÓDIGO


curl --location --request GET 'https://zylalabs.com/api/4557/content+scraper+api/5610/extrator+de+texto?url=https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a Content Scraper API basta incluir seu token Bearer no cabeçalho Authorization.
Cabeçalhos
Cabeçalho Descrição
Authorization [Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

🚀 Empresarial

A partir de
$ 10.000/Ano


  • Volume personalizado
  • Limite de taxa personalizado
  • Suporte ao cliente especializado
  • Monitoramento de API em tempo real

Recursos favoritos dos clientes

  • ✔︎ Pague apenas por requisições bem-sucedidas
  • ✔︎ Teste 7 dias gratis
  • ✔︎ Suporte multilíngue
  • ✔︎ Uma chave de API, todas as APIs.
  • ✔︎ Painel intuitivo
  • ✔︎ Tratamento de erros abrangente
  • ✔︎ Documentação amigável para desenvolvedores
  • ✔︎ Integração com Postman
  • ✔︎ Conexões HTTPS seguras
  • ✔︎ Alta disponibilidade

Content Scraper API FAQs

A API Content Scraper é uma ferramenta que permite aos usuários extrair conteúdo textual de páginas da web Ela é projetada para recuperar e processar o corpo principal do texto de artigos blogs e outro conteúdo da web filtrando elementos irrelevantes como anúncios menus de navegação e barras laterais

A API Content Scraper aceita URLs como entrada em formato JSON e retorna o conteúdo extraído em formato JSON A saída geralmente inclui o texto principal o título o autor a data de publicação e outros metadados relevantes

O acesso à API do Content Scraper é autenticado usando chaves de API Você precisa se inscrever para uma chave de API através do nosso portal de desenvolvedores Assim que você tiver sua chave inclua-a no cabeçalho de suas solicitações HTTP usando o parâmetro de Autorização

A API de Content Scraper suporta múltiplos idiomas e pode processar páginas da web com várias codificações de caracteres A API detecta automaticamente o idioma e a codificação da página da web de entrada e retorna o conteúdo extraído no formato UTF-8

A API Content Scraper utiliza algoritmos avançados e técnicas de aprendizado de máquina para extrair com precisão o texto principal de páginas da web Embora atinja alta precisão a qualidade da extração pode variar dependendo da complexidade e estrutura da página da web

A API Content Scraper retorna dados estruturados incluindo o texto principal do artigo título descrição autor data de publicação links e imagens Esses dados são formatados em JSON facilitando a integração em aplicações

Os campos-chave na resposta incluem "url" (o link do artigo), "título" (o título do artigo), "descrição" (o conteúdo principal), "links" (quaisquer links associados) e "imagem" (a imagem em destaque do artigo). Cada campo fornece informações essenciais para análise

Os dados da resposta estão organizados em uma estrutura JSON Inclui um campo "erro" indicando sucesso ou falha um campo "mensagem" para atualizações de status e um objeto "dados" contendo o conteúdo extraído e os metadados

A API fornece informações como o texto principal do artigo, título, autor, data de publicação e links associados Esse conjunto de dados abrangente é útil para várias aplicações incluindo análise de sentimentos e recomendação de conteúdo

Os usuários podem personalizar suas solicitações especificando a URL do artigo que desejam extrair A API processa a URL fornecida para retornar conteúdo relevante permitindo a extração de dados direcionada com base nas necessidades do usuário

Os casos de uso típicos incluem agregação de notícias análise de sentimento sistemas de recomendação de conteúdo análise de dados e resumo de texto A saída estruturada da API suporta diversas aplicações em projetos orientados por dados

A precisão dos dados é mantida por meio de algoritmos avançados e técnicas de aprendizado de máquina que analisam as estruturas de páginas da web Atualizações e melhorias contínuas nos algoritmos de extração ajudam a garantir uma saída de alta qualidade

Se os usuários receberem resultados parciais ou vazios, eles devem verificar a URL fornecida quanto à acessibilidade e disponibilidade de conteúdo Além disso, os usuários podem tentar diferentes URLs ou garantir que os artigos estejam estruturados adequadamente para melhores resultados de extração

Perguntas Frequentes Gerais

O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.

Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]


Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.

A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.

Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]

Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.

As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.

O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.

Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.

Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.

Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.

O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.

Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.

Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]

Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.

Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.

Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.

As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.


APIs relacionadas