页面抓取器 API

页面抓取API提取并返回网页的完整HTML内容,使得分析和提取网站数据变得简单
通过 MCP 从您的 AI 代理使用此 API
支持 OpenClaw、Claude Code/Desktop、Cursor、Windsurf、Cline 以及任何兼容 MCP 的 AI 客户端。
文档和设置
通过封装此 MCP 创建技能: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

关于API:  

页面抓取API是一个先进的工具,旨在通过检索网页的完整HTML内容来便捷地提取和分析数据。此API对需要访问网站中包含的信息的用户非常有用,适用于市场研究、竞争监控或网页应用开发等多种目的。

主要特性:


完整HTML代码检索:HTML提取器API的主要功能是捕获特定网页的完整HTML代码。这包括页面的所有结构内容,如标签、属性和嵌入元素。通过获得完整的HTML,用户可以访问页面上的所有可见和隐藏信息,从而进行全面的内容分析。

支持不同类型的网页:该API功能多样,支持从静态页面到使用JavaScript生成内容的动态网站的广泛选择。处理不同类型内容的能力使得该API适用于多种应用,如新闻数据收集、社交网络监控和复杂网页结构分析。

特定数据提取:虽然API提供完整的HTML,但也可以用于提取特定页面数据。用户可以将API与HTML解析技术结合使用,如正则表达式或HTML处理库,以提取特定信息,如产品价格、联系详情或任何其他相关数据。

总之,页面抓取API是一个强大而灵活的工具,用于从网页中提取HTML内容。它为那些需要全面访问网页内容进行分析、研究或开发的人提供了有效的解决方案。它能够处理多种页面类型,并且易于集成,使其成为网页数据管理和分析中众多用例的宝贵选项。

 

该API接收什么,您的API提供什么 (输入/输出)?

API接收网页的URL,并提供该页面的完整HTML内容进行分析和数据提取。

 

该API最常见的用例是什么?

  1. 竞争对手研究:收集竞争对手网站的内容,以分析价格、产品、促销和市场策略。

    新闻监测:从新闻网站提取内容,以实时跟进最新事件和更新。

    学术研究的数据收集:从多个网站获取和分析内容,用于学术研究或案例研究。

    网页应用开发:在开发和测试过程中,使用API从网页应用本身提取和解析HTML。

    SEO分析:从网页中提取HTML,以分析重要的SEO元素,如元标签、标题和链接结构。

     

您的计划有何限制吗?

除了每月允许的API调用次数外,没有其他限制。

API 文档

端点


要使用此端点,请发送一个包含所需页面URL的HTTP请求,并接收该页面的完整HTML内容



                                                                            
GET https://zylalabs.com/api/5080/page+grabber+api/6471/content+url
                                                                            
                                                                        

内容网址 - 端点功能

对象 描述
urlSupplier [必需] String
forceCache [必需] boolean
测试端点

API 示例响应

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"method":"GET","urlSupplier":"https:\/\/beaute-pacifique.com\/","redirectedUrlSupplier":null,"_note":"Response truncated for documentation purposes"}
                                                                                                                                                                                                                    
                                                                                                    

内容网址 - 代码片段


curl --location --request GET 'https://zylalabs.com/api/5080/page+grabber+api/6471/content+url?urlSupplier=https://www.reuters.com/article/us-usa-economy-idUSKBN2A40BO&forceCache=True' --header 'Authorization: Bearer YOUR_API_KEY' 


    

API 访问密钥和身份验证

注册后,每个开发者都会被分配一个个人 API 访问密钥,这是一个唯一的字母和数字组合,用于访问我们的 API 端点。要使用 页面抓取器 API 进行身份验证,只需在 Authorization 标头中包含您的 bearer token。
标头
标头 描述
授权 [必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。

简单透明的定价

无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。

🚀 企业版

起价
$ 10,000/年


  • 自定义数量
  • 自定义速率限制
  • 专业客户支持
  • 实时 API 监控

客户喜爱的功能

  • ✔︎ 仅支付成功请求
  • ✔︎ 7 天免费试用
  • ✔︎ 多语言支持
  • ✔︎ 一个 API 密钥,所有 API。
  • ✔︎ 直观的仪表板
  • ✔︎ 全面的错误处理
  • ✔︎ 开发者友好的文档
  • ✔︎ Postman 集成
  • ✔︎ 安全的 HTTPS 连接
  • ✔︎ 可靠的正常运行时间

页面抓取器 API FAQs

要使用此API,您发送带有网页URL的请求并接收完整的HTML内容以进行解析和提取

页面抓取API从网页获取完整的HTML代码,便于解析和提取内容中的数据

有不同的套餐适合每个人,包括少量请求的免费试用,但其速率有限制以防止滥用服务

Zyla提供了几乎所有编程语言的广泛集成方法您可以根据需要使用这些代码与项目集成

API返回有关域名年龄和历史的详细信息,包括自创建以来的年数、月数和天数,以及到期和更新时间。

页面抓取API返回指定网页的完整HTML内容,包括所有结构元素如标签、属性和嵌入脚本。这使用户能够访问页面上可见和隐藏的信息

响应中的关键字段包括“method”(使用的HTTP方法)“urlSupplier”(请求的原始URL)“redirectedUrlSupplier”(如适用)和“pageSource”(页面的完整HTML内容)

响应数据采用 JSON 格式结构,包含键值对,提供 HTTP 方法、请求的 URL、任何重定向的 URL 和完整的 HTML 源代码。这种组织方式便于解析和提取相关信息

用户可以从HTML中提取各种类型的信息,包括文本内容、图像、链接和元数据。这在竞争对手分析、搜索引擎优化审计和研究数据收集等任务中非常有用

用户可以通过指定不同的URL来自定义他们的请求,以从各种网页中检索HTML内容。此外,他们可以在检索后应用HTML解析技术以提取感兴趣的特定数据点

典型的用例包括竞争对手研究 新闻监测 学术数据收集 网络应用开发 和SEO分析 该API的多功能性使其适用于各种数据提取需求

通过直接从指定的URL检索实时HTML内容来保持数据的准确性。这确保用户接收到网页的最新版本,反映网站所有者所做的任何更新或更改

如果您收到部分或空的结果,请检查请求的 URL 是否正确,确保页面可以访问,并验证内容是否不是通过 JavaScript 动态加载的。根据需要调整您的提取方法以处理此类情况

一般常见问题

Zyla API Hub 就像一个大型 API 商店,您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后,您可以选择要使用的 API。请记住,每个 API 都需要自己的订阅。但如果您订阅多个 API,您将为所有这些 API 使用相同的密钥,使事情变得更简单。

价格以 USD(美元)、EUR(欧元)、CAD(加元)、AUD(澳元)和 GBP(英镑)列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术,由 Stripe 提供支持,Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题,请通过 [email protected]


此外,如果您已经以这些货币中的任何一种(USD、EUR、CAD、AUD、GBP)拥有有效订阅,该货币将保留用于后续订阅。只要您没有任何有效订阅,您可以随时更改货币。

定价页面上显示的本地货币基于您 IP 地址的国家/地区,仅供参考。实际价格以 USD(美元)为单位。当您付款时,即使您在我们的网站上看到以本地货币显示的等值金额,您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。

有时,银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行,检查他们是否阻止了我们的收费。此外,您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助,请通过 [email protected]

价格由月度或年度订阅决定,具体取决于所选计划。

API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用(由状态 200 响应指示)才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。

Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始,并在下个月的同一日期续订。因此,如果您想避免未来的费用,请提前取消订阅。

要升级您当前的订阅计划,只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效,让您立即享受新计划的功能。请注意,您之前计划中的任何剩余调用都不会转移到新计划,因此在升级时请注意这一点。您将被收取新计划的全部金额。

要检查您本月剩余多少 API 调用,请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如,如果您的计划允许每月 1,000 个请求,而您已使用 100 个,则响应标头中的此字段将显示 900 个剩余调用。

要查看您的计划允许的最大 API 请求数,请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如,如果您的计划包括每月 1,000 个请求,此标头将显示 1,000。

"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如,如果它显示 3,600,则意味着还有 3,600 秒直到限制重置。

是的,您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意,升级、降级和取消会立即生效。此外,取消后,您将不再有权访问该服务,即使您的配额中还有剩余调用。

您可以通过我们的聊天渠道联系我们以获得即时帮助。我们始终在线,时间为上午 8 点至下午 5 点(EST)。如果您在该时间之后联系我们,我们将尽快回复您。此外,您可以通过 [email protected]

为了让您有机会在没有任何承诺的情况下体验我们的 API,我们提供 7 天免费试用,允许您免费进行最多 50 次 API 调用。此试用只能使用一次,因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用,但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束,以先发生者为准。如果您在试用期间达到 50 次请求限制,您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者,如果您在第 7 天之前不取消订阅,您的免费试用将结束,您的计划将自动计费,授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。

7 天后,您将被收取试用期间订阅的计划的全额费用。因此,在试用期结束前取消很重要。因忘记及时取消而提出的退款请求不被接受。

当您订阅 API 免费试用时,您可以进行最多 50 次 API 调用。如果您希望超出此限制进行额外的 API 调用,API 将提示您执行"开始您的付费计划"。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。

付款订单在每月 20 日至 30 日之间处理。如果您在 20 日之前提交请求,您的付款将在此时间范围内处理。


相关 API