网页内容提取器 API API ID: 4570

网页内容提取API提供快速简便的从新闻和博客文章中提取干净文本和结构化数据去除广告链接和其他不必要的内容专注于文章的主要内容非常适合自然语言处理和数据分析

通过 MCP 从您的 AI 代理使用此 API

支持 OpenClaw、Claude Code/Desktop、Cursor、Windsurf、Cline 以及任何兼容 MCP 的 AI 客户端。

文档和设置

通过封装此 MCP 创建技能： https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

关于API：

Web内容提取API是一种强大的工具，用于从新闻和博客文章中提取干净的文本和其他结构化数据。通过这个API，您可以快速轻松地去除广告、链接和其他不需要的内容，专注于文章的主要内容。

该API使用先进的自然语言处理（NLP）技术，从文章中提取相关信息，包括文章本身的文本、作者、日期和其他元数据。这些信息随后以结构化格式返回，使其易于用于数据分析和NLP应用。

该API旨在用户友好且易于集成，因此您可以立即开始使用它。无论您是希望对新闻文章进行情感分析的数据分析师，还是希望构建自定义新闻聚合器的开发者，Web内容提取API都能满足您的所有需求。

凭借其快速高效的提取过程，您可以快速处理大量文章并提取所需信息。那么，还等什么呢？立即注册Web内容提取API，开始充分利用您的新闻和博客文章。从干净的文本到结构化的数据，这个API都能满足您的需求。

这个API接收什么以及您的API提供什么（输入/输出）？

传递您希望提取内容的文章的URL.

这个API的最常见使用案例是什么？

新闻聚合：该API可用于从新闻文章中提取主要文本和结构化数据，以构建自定义新闻聚合器。
情感分析：该API可以从文章中提取干净的文本，以进行情感分析并确定新闻文章中表达的总体情感。
内容推荐：该API可以提取文章文本和元数据，以为用户创建基于内容的推荐系统。
数据分析：该API可以从文章中提取结构化数据，例如作者、日期和关键字，以对新闻和博客文章进行数据分析。
文本摘要：该API可以从文章中提取主要文本，以创建文本摘要，使用户更容易快速理解文章内容。

您的计划有什么限制？

除了API调用次数外，没有其他限制

API 文档

端点

文本提取器 Endpoint ID: 5623

文章提取端点

                                                                            
GET https://zylalabs.com/api/4570/web+content+extractor+api/5623/text+extractor

文本提取器 - 端点功能

对象	描述
`url`	[必需] The URL of the article.

测试端点

API 示例响应

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"error":0,"message":"Article extraction success","data":{"url":"https://www.drmax.sk/beautyclub/neustale-bojujete-s-chutou-na-sladke-dovodov-moze-byt-viacero","title":"Neustále bojujete s chuťou na sladké? Dôvodov môže byť viacero","description":"Ak sa snažíte žiť zdravo, sledujete obsah svojho jedálnička, dobre spíte a pravidelne sa hýbete, no napriek tomu všetkému sa neviete zbaviť „mlsného“ jazýčka, možno vám chce vaše telo niečo naznačiť.\nNeodolateľná túžba po sladkostiach, sladených nápojoch, ale aj chlebe, cestovinách či tučných syroch môže maskovať jeho snahu čo najrýchlejšie doplniť stratené zásoby energie.\nV prípade, že chcete predchádzať záchvatom vlčieho hladu, mali by ste sa zamyslieť, čo by mohlo byť jeho ozajstnou príčinou....","links":["https://www.drmax.sk/beautyclub/neustale-bojujete-s-chutou-na-sladke-dovodov-moze-byt-viacero"],"image":"https://backend.drmax.sk/media/amasty/blog/zena_s_cukr_kmi.jpg","content":"<div><p class=\"text\">Ak sa sna&#382;&#237;te &#382;i&#357; zdravo, sledujete obsah svojho jed&#225;lni&#269;ka, dobre sp&#237;te a&#160;pravidelne sa h&#253;bete, no napriek tomu v&#353;etk&#233;mu sa neviete zbavi&#357; &#8222;mlsn&#233;ho&#8220; jaz&#253;&#269;ka, mo&#382;no v&#225;m chce va&#353;e telo nie&#269;o nazna&#269;i&#357;. Neodolate&#318;n&#225; t&#250;&#382;ba po sladkostiach, sladen&#253;ch n&#225;pojoch, ale aj chlebe, cestovin&#225;ch &#269;i tu&#269;n&#253;ch syroch m&#244;&#382;e maskova&#357; jeho snahu &#269;o najr&#253;chlej&#353;ie doplni&#357; straten&#233; z&#225;soby energie. V&#160;pr&#237;pade, &#382;e chcete predch&#225;dza&#357; z&#225;chvatom vl&#269;ieho hladu, mali by ste sa zamyslie&#357;, &#269;o by mohlo by&#357; jeho ozajstnou pr&#237;&#269;inou.</p></div>","author":"Redakcia Beautyclub Dr.Max, Mgr. Daniela Tomčíková, O Autorovi, Čítať Viac Od Autora","favicon":"/favicon.ico","source":"www.drmax.sk","published":"Unknown Date","ttr":0.36,"plain_text":"Ak sa snažíte žiť zdravo, sledujete obsah svojho jedálnička, dobre spíte a pravidelne sa hýbete, no napriek tomu všetkému sa neviete zbaviť „mlsného“ jazýčka, možno vám chce vaše telo niečo naznačiť. Neodolateľná túžba po sladkostiach, sladených nápojoch, ale aj chlebe, cestovinách či tučných syroch môže maskovať jeho snahu čo najrýchlejšie doplniť stratené zásoby energie. V prípade, že chcete predchádzať záchvatom vlčieho hladu, mali by ste sa zamyslieť, čo by mohlo byť jeho ozajstnou príčinou.","ttr_disclaimer":"Assuming 200 wpm reading speed"}}

文本提取器 - 代码片段


curl --location --request GET 'https://zylalabs.com/api/4570/web+content+extractor+api/5623/text+extractor?url=https://www.thestartupfounder.com/use-this-data-extractor-api-to-get-article-data-from-mathrubhumi/' --header 'Authorization: Bearer YOUR_API_KEY'

API 访问密钥和身份验证

注册后，每个开发者都会被分配一个个人 API 访问密钥，这是一个唯一的字母和数字组合，用于访问我们的 API 端点。要使用网页内容提取器 API 进行身份验证，只需在 Authorization 标头中包含您的 bearer token。

标头

标头	描述
`授权`	[必需] 应为 `Bearer access_key`. 订阅后，请查看上方的"您的 API 访问密钥"。

问题

简单透明的定价

无长期承诺。随时升级、降级或取消。免费试用包括最多 50 个请求。

月度年度

(年度计费可节省 2 个月 🎉)

💫Basic

$49.99/月

25,000 请求 / 月
然后 $0.0025995 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

Popular

⚡Pro

$99.99/月

150,000 请求 / 月
然后 $0.0025995 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🔥Pro Plus

$499.99/月

900,000 请求 / 月
然后 $0.0025995 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

💫Basic

$41.66/月

25,000 请求 / 月
然后 $0.0025995 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

Popular

⚡Pro

$83.33/月

150,000 请求 / 月
然后 $0.0025995 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🔥Pro Plus

$416.66/月

900,000 请求 / 月
然后 $0.0025995 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🚀 企业版

起价
$ 10,000/年

自定义数量
自定义速率限制
专业客户支持
实时 API 监控

预约通话

客户喜爱的功能

✔︎ 仅支付成功请求
✔︎ 7 天免费试用
✔︎ 多语言支持
✔︎ 一个 API 密钥，所有 API。
✔︎ 直观的仪表板

✔︎ 全面的错误处理
✔︎ 开发者友好的文档
✔︎ Postman 集成
✔︎ 安全的 HTTPS 连接
✔︎ 可靠的正常运行时间

网页内容提取器 API FAQs

网络内容提取器API是什么以及它有什么功能

网页内容提取API是一个允许用户从网页中提取文本内容的工具。它旨在从文章、博客和其他网页内容中检索和处理主要文本内容，过滤掉广告、导航菜单和侧边栏等无关元素

Web内容提取器API支持哪些数据格式作为输入和输出

Web内容提取器API接受以JSON格式输入的URL，并以JSON格式返回提取的内容。输出通常包括主要文本、标题、作者、发布日期和其他相关元数据

我如何验证并访问网络内容提取器API

请通过我们的开发者门户注册获取API密钥，以验证对Web内容提取器API的访问。一旦您获得了密钥，请在HTTP请求的头部中使用Authorization参数包含它

Web内容提取器API如何处理不同语言和字符编码

Web内容提取API支持多种语言，并可以处理具有各种字符编码的网页。该API自动检测输入网页的语言和编码，并以UTF-8格式返回提取的内容

内容提取过程的准确性如何

网页内容提取器API采用先进的算法和机器学习技术从网页中准确提取主要文本虽然它可以达到高准确率但提取质量可能会根据网页的复杂性和结构而有所不同

Web内容提取器API返回什么类型的数据

Web内容提取器API返回结构化数据，包括主要文章文本、标题、描述、作者、出版日期和相关链接. 这些数据以JSON格式呈现，便于集成到应用程序中

响应数据中有哪些关键字段

响应数据中的关键字段包括“url”（源 URL）“title”（文章标题）“description”（主要内容）“links”（相关 URL）和“image”（关联媒体）这些字段提供了关于提取文章的全面信息

响应数据是如何组织的

响应数据以JSON结构组织，顶层对象包含一个“错误”代码，一个“消息”，以及一个“数据”对象。“数据”对象包括所有提取的字段，便于直接访问内容

通过API可以获取哪些类型的信息

API提供的信息包括文章的主要内容、标题、作者、出版日期以及相关内容的链接这使得它适用于各种应用，包括情感分析和内容推荐

用户如何自定义他们的数据请求

用户可以通过指定他们希望提取的文章的URL来自定义数据请求 API处理该输入以返回基于提供的URL的定制内容确保相关数据提取

这些数据的典型用例是什么

典型的用例包括新闻聚合情感分析内容推荐系统数据分析和文本摘要该API提取干净文本和结构化数据的能力支持NLP和数据科学中的各种应用

数据准确性是如何维持的

数据准确性通过先进的算法和机器学习技术维持，这些技术分析网页结构。对提取过程的持续更新和改进有助于确保各种内容类型的高质量结果

提取内容有哪些质量检查措施

该API通过将提取的数据与已知的网页内容模式和结构进行验证来进行质量检查。这有助于最小化错误，并确保返回的数据对用户相关且可靠

一般常见问题

什么是 Zyla API Hub？

Zyla API Hub 就像一个大型 API 商店，您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后，您可以选择要使用的 API。请记住，每个 API 都需要自己的订阅。但如果您订阅多个 API，您将为所有这些 API 使用相同的密钥，使事情变得更简单。

价格以 USD（美元）、EUR（欧元）、CAD（加元）、AUD（澳元）和 GBP（英镑）列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术，由 Stripe 提供支持，Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题，请通过 [email protected]

此外，如果您已经以这些货币中的任何一种（USD、EUR、CAD、AUD、GBP）拥有有效订阅，该货币将保留用于后续订阅。只要您没有任何有效订阅，您可以随时更改货币。

如果我在定价页面上看到本地货币，为什么不能用它付款？

定价页面上显示的本地货币基于您 IP 地址的国家/地区，仅供参考。实际价格以 USD（美元）为单位。当您付款时，即使您在我们的网站上看到以本地货币显示的等值金额，您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。

我的付款被拒绝，我该怎么办？

有时，银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行，检查他们是否阻止了我们的收费。此外，您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助，请通过 [email protected]

我的 API 订阅将如何收费？

价格由月度或年度订阅决定，具体取决于所选计划。

我的 API 调用将如何从我的计划中扣除？

API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用（由状态 200 响应指示）才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。

您的计费周期如何工作？

Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始，并在下个月的同一日期续订。因此，如果您想避免未来的费用，请提前取消订阅。

如何升级我当前的 API 订阅计划？

要升级您当前的订阅计划，只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效，让您立即享受新计划的功能。请注意，您之前计划中的任何剩余调用都不会转移到新计划，因此在升级时请注意这一点。您将被收取新计划的全部金额。

如何查看本月我可以进行的剩余 API 调用次数？

要检查您本月剩余多少 API 调用，请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如，如果您的计划允许每月 1,000 个请求，而您已使用 100 个，则响应标头中的此字段将显示 900 个剩余调用。

如何找出我的订阅计划允许的最大 API 请求数？

要查看您的计划允许的最大 API 请求数，请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如，如果您的计划包括每月 1,000 个请求，此标头将显示 1,000。

如何知道我的速率限制何时重置？

"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如，如果它显示 3,600，则意味着还有 3,600 秒直到限制重置。

我可以随时取消吗？

是的，您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意，升级、降级和取消会立即生效。此外，取消后，您将不再有权访问该服务，即使您的配额中还有剩余调用。

7 天免费试用如何工作？

为了让您有机会在没有任何承诺的情况下体验我们的 API，我们提供 7 天免费试用，允许您免费进行最多 50 次 API 调用。此试用只能使用一次，因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用，但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束，以先发生者为准。如果您在试用期间达到 50 次请求限制，您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者，如果您在第 7 天之前不取消订阅，您的免费试用将结束，您的计划将自动计费，授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。