A API Web Content Extractor é uma ferramenta poderosa para extrair texto limpo e outros dados estruturados de artigos de notícias e blogs. Com esta API, você pode rapidamente e facilmente se livrar de anúncios, links e outros conteúdos indesejados, e focar no conteúdo principal do artigo.
A API utiliza técnicas avançadas de processamento de linguagem natural (NLP) para extrair informações relevantes de artigos, incluindo o texto do próprio artigo, autores, datas e outras metadados. Essas informações são então retornadas em um formato estruturado, facilitando o uso para análise de dados e aplicações de NLP.
A API foi projetada para ser amigável e fácil de integrar, para que você possa começar a usá-la imediatamente. Seja você um analista de dados procurando realizar análise de sentimento em artigos de notícias, ou um desenvolvedor buscando construir um agregador de notícias personalizado, a API Web Content Extractor tem tudo o que você precisa.
Com seu processo de extração rápido e eficiente, você pode processar rapidamente grandes quantidades de artigos e extrair as informações necessárias. Então por que esperar? Inscreva-se na API Web Content Extractor hoje mesmo e comece a aproveitar ao máximo seus artigos de notícias e blogs. De texto limpo a dados estruturados, esta API tem tudo para você.
Envie a URL do artigo de onde você deseja extrair seu conteúdo.
Agragação de Notícias: A API pode ser usada para extrair o texto principal e dados estruturados de artigos de notícias para construir agregadores de notícias personalizados.
Análise de Sentimento: A API pode extrair texto limpo de artigos para realizar análise de sentimento e determinar o sentimento geral expresso em artigos de notícias.
Recomendação de Conteúdo: A API pode extrair texto de artigos e metadados para criar sistemas de recomendação baseados em conteúdo para os usuários.
Análise de Dados: A API pode extrair dados estruturados de artigos, como autores, datas e palavras-chave, para realizar análises de dados em artigos de notícias e blogs.
Sumarização de Texto: A API pode extrair o texto principal de artigos para criar resumos de texto, facilitando a compreensão rápida do conteúdo dos artigos pelos usuários.
Além do número de chamadas da API, não há outras limitações
Ponto de Extração de Artigos
Extrator de Texto - Recursos do endpoint
| Objeto | Descrição |
|---|---|
url |
[Obrigatório] The URL of the article. |
{"error":0,"message":"Article extraction success","data":{"url":"https://www.drmax.sk/beautyclub/neustale-bojujete-s-chutou-na-sladke-dovodov-moze-byt-viacero","title":"Neustále bojujete s chuťou na sladké? Dôvodov môže byť viacero","description":"Ak sa snažíte žiť zdravo, sledujete obsah svojho jedálnička, dobre spíte a pravidelne sa hýbete, no napriek tomu všetkému sa neviete zbaviť „mlsného“ jazýčka, možno vám chce vaše telo niečo naznačiť.\nNeodolateľná túžba po sladkostiach, sladených nápojoch, ale aj chlebe, cestovinách či tučných syroch môže maskovať jeho snahu čo najrýchlejšie doplniť stratené zásoby energie.\nV prípade, že chcete predchádzať záchvatom vlčieho hladu, mali by ste sa zamyslieť, čo by mohlo byť jeho ozajstnou príčinou....","links":["https://www.drmax.sk/beautyclub/neustale-bojujete-s-chutou-na-sladke-dovodov-moze-byt-viacero"],"image":"https://backend.drmax.sk/media/amasty/blog/zena_s_cukr_kmi.jpg","content":"<div><p class=\"text\">Ak sa snažíte žiť zdravo, sledujete obsah svojho jedálnička, dobre spíte a pravidelne sa hýbete, no napriek tomu všetkému sa neviete zbaviť „mlsného“ jazýčka, možno vám chce vaše telo niečo naznačiť. Neodolateľná túžba po sladkostiach, sladených nápojoch, ale aj chlebe, cestovinách či tučných syroch môže maskovať jeho snahu čo najrýchlejšie doplniť stratené zásoby energie. V prípade, že chcete predchádzať záchvatom vlčieho hladu, mali by ste sa zamyslieť, čo by mohlo byť jeho ozajstnou príčinou.</p></div>","author":"Redakcia Beautyclub Dr.Max, Mgr. Daniela Tomčíková, O Autorovi, Čítať Viac Od Autora","favicon":"/favicon.ico","source":"www.drmax.sk","published":"Unknown Date","ttr":0.36,"plain_text":"Ak sa snažíte žiť zdravo, sledujete obsah svojho jedálnička, dobre spíte a pravidelne sa hýbete, no napriek tomu všetkému sa neviete zbaviť „mlsného“ jazýčka, možno vám chce vaše telo niečo naznačiť. Neodolateľná túžba po sladkostiach, sladených nápojoch, ale aj chlebe, cestovinách či tučných syroch môže maskovať jeho snahu čo najrýchlejšie doplniť stratené zásoby energie. V prípade, že chcete predchádzať záchvatom vlčieho hladu, mali by ste sa zamyslieť, čo by mohlo byť jeho ozajstnou príčinou.","ttr_disclaimer":"Assuming 200 wpm reading speed"}}
curl --location --request GET 'https://zylalabs.com/api/4570/web+content+extractor+api/5623/text+extractor?url=https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/' --header 'Authorization: Bearer YOUR_API_KEY'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
A API de Extração de Conteúdo da Web é uma ferramenta que permite aos usuários extrair conteúdo textual de páginas da web. Ela é projetada para recuperar e processar o corpo principal do texto de artigos, blogs e outros conteúdos da web, filtrando elementos irrelevantes como anúncios, menus de navegação e barras laterais
A API Web Content Extractor aceita URLs como entrada em formato JSON e retorna o conteúdo extraído em formato JSON A saída geralmente inclui o texto principal título autor data de publicação e outros metadados relevantes
O acesso à API Web Content Extractor é autenticado usando chaves de API. Você precisa se inscrever para uma chave de API através do nosso portal de desenvolvedores. Assim que você tiver sua chave, inclua-a no cabeçalho de suas requisições HTTP usando o parâmetro Authorization
A API de Extração de Conteúdo da Web suporta múltiplas línguas e pode processar páginas da web com vários encodings de caracteres A API detecta automaticamente a língua e o encoding da página web de entrada e retorna o conteúdo extraído no formato UTF-8
A API de Extração de Conteúdo da Web utiliza algoritmos avançados e técnicas de aprendizado de máquina para extrair com precisão o texto principal de páginas da web Embora alcance alta precisão a qualidade da extração pode variar dependendo da complexidade e estrutura da página da web
A API Web Content Extractor retorna dados estruturados incluindo o texto principal do artigo título descrição autor data de publicação e links associados Esses dados são formatados em JSON facilitando a integração em aplicações
Os campos-chave nos dados de resposta incluem "url" (a URL de origem) "title" (o título do artigo) "description" (o conteúdo principal) "links" (URLs relacionadas) e "image" (mídia associada) Estes campos fornecem informações abrangentes sobre o artigo extraído
Os dados da resposta estão organizados em uma estrutura JSON com um objeto de nível superior contendo um código de "erro", uma "mensagem" e um objeto "dados". O objeto "dados" inclui todos os campos extraídos, permitindo um acesso direto ao conteúdo
A API fornece informações como o texto principal do artigo, título, autor, data de publicação e links para conteúdo relacionado Isso a torna adequada para várias aplicações, incluindo análise de sentimentos e recomendação de conteúdo
Os usuários podem personalizar seus pedidos de dados especificando a URL do artigo que desejam extrair A API processa essa entrada para retornar conteúdo personalizado com base na URL fornecida garantindo a extração de dados relevantes
Casos de uso típicos incluem agregação de notícias análise de sentimento sistemas de recomendação de conteúdos análise de dados e sumarização de texto A capacidade da API de extrair texto limpo e dados estruturados apoia aplicações diversas em PLN e ciência de dados
A precisão dos dados é mantida por meio de algoritmos avançados e técnicas de aprendizado de máquina que analisam estruturas de páginas da web Atualizações e melhorias contínuas no processo de extração ajudam a garantir resultados de alta qualidade em vários tipos de conteúdo
A API emprega verificações de qualidade validando os dados extraídos em relação a padrões e estruturas conhecidos de conteúdo da web Isso ajuda a minimizar erros e garante que os dados retornados sejam relevantes e confiáveis para os usuários
O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.
Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]
Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.
A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.
Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]
Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.
As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.
O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.
Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.
Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.
Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.
O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.
Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.
Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]
Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.
Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.
Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.
As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.
Nível de serviço:
100%
Tempo de resposta:
2.381ms
Nível de serviço:
100%
Tempo de resposta:
1.883ms
Nível de serviço:
100%
Tempo de resposta:
10.154ms
Nível de serviço:
100%
Tempo de resposta:
1.583ms
Nível de serviço:
100%
Tempo de resposta:
859ms
Nível de serviço:
100%
Tempo de resposta:
8.257ms
Nível de serviço:
100%
Tempo de resposta:
876ms
Nível de serviço:
100%
Tempo de resposta:
2.710ms
Nível de serviço:
100%
Tempo de resposta:
1.434ms
Nível de serviço:
100%
Tempo de resposta:
7.660ms
Nível de serviço:
100%
Tempo de resposta:
784ms
Nível de serviço:
100%
Tempo de resposta:
2.734ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
242ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
2.008ms
Nível de serviço:
100%
Tempo de resposta:
496ms
Nível de serviço:
100%
Tempo de resposta:
315ms
Nível de serviço:
100%
Tempo de resposta:
2.430ms
Nível de serviço:
100%
Tempo de resposta:
316ms