通过简单的REST API访问谷歌强大的27亿参数语言模型
多轮聊天完成用于对话和交互式AI应用程序。使用128K令牌上下文窗口,您可以在一次请求中发送整本书、长文档或广泛的对话历史。
简单对话
{
"messages": [
{
"role": "user",
"content": "法国的首都是什么?"
}
],
"temperature": 0.7,
"max_tokens": 100
}多轮对话
{
"messages": [
{
"role": "system",
"content": "您是一个有帮助的旅行助手。"
},
{
"role": "user",
"content": "去日本的最佳时机是什么时候?"
},
{
"role": "assistant",
"content": "春季(3月到5月)和秋季(9月到11月)是访问日本的最佳时机,气候宜人,樱花或秋叶美丽。"
},
{
"role": "user",
"content": "那里的食物怎么样?"
}
],
"temperature": 0.8,
"max_tokens": 150
}编程帮助
{
"messages": [
{
"role": "system",
"content": "您是一个专家级JavaScript程序员。"
},
{
"role": "user",
"content": "我如何在JavaScript中反转一个字符串?"
}
],
"temperature": 0.5,
"max_tokens": 200
}聊天完成 - 端点功能
| 对象 | 描述 |
|---|---|
请求体 |
[必需] Json |
{"id":"chatcmpl-1775011951099","object":"chat.completion","created":1775011951,"model":"gemma-3-27b-it","choices":[{"index":0,"message":{"role":"assistant","content":"The capital of France is **Paris**. \n\nIt's known for iconic landmarks like the Eiffel Tower, the Louvre Museum, and the Arc de Triomphe, as well as its fashion, cuisine, and culture.\n\n\n\n"},"finish_reason":"stop"}],"usage":{"prompt_tokens":15,"completion_tokens":47,"total_tokens":62}}
curl --location --request POST 'https://zylalabs.com/api/12286/gemma+3+api/23070/chat+completions' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"messages": [
{
"role": "user",
"content": "What is the capital of France?"
}
],
"temperature": 0.7,
"max_tokens": 100
}'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
聊天完成端点返回一个包含助手对用户查询的响应的JSON对象 这包括助手的消息 消息的角色(用户或助手)以及元数据如完成ID和令牌使用情况
响应中的关键字段包括"id"(唯一标识符)"object"(响应类型)"created"(时间戳)"model"(使用的模型)"choices"(响应数组)和"usage"(提示、完成和总的令牌计数)
响应数据结构为JSON对象。它包含一个“选择”数组,每个选择包括助手的消息及其角色。“使用”字段提供有关令牌消耗的详细信息,帮助用户理解请求的复杂性
用户可以通过参数自定义请求,例如“温度”(控制随机性)、“最大标记数”(限制响应长度)和“top_p”(核采样)这些参数允许根据用户需求提供定制化的响应
该端点提供有关广泛主题的信息,包括一般知识 编程协助 创意写作等 它支持多轮对话 允许上下文感知的互动
用户可以从“choices”数组中提取助手的消息,以在应用程序中显示响应。“usage”字段有助于监控令牌消耗,这对于优化请求和管理数据流非常有用
典型的用例包括构建客户支持的人工智能聊天机器人 为博客生成内容 提供编码帮助 以及创建教育工具 该API的多功能性支持各行业的各种应用
数据准确性通过对基础语言模型在多样数据集上进行持续训练来维持 定期更新和质量检查确保模型在各个主题上提供相关和准确的信息
聊天完成端点可以生成各种信息,包括事实问题的答案 创意写作作品 编程帮助 和教育内容 它支持多轮对话 允许进行上下文感知的交互以增强用户参与感
用户可以通过调整参数来定制请求,例如“温度”用于响应随机性,“max_tokens”限制响应长度,以及“top_p”用于核心采样。这些设置允许用户根据自己的特定需求和偏好来调整输出
返回的数据被结构化为一个JSON对象 它包含一个“choices”数组 每个元素都包含助手的消息及其角色 此外 “usage”字段提供了令牌计数 帮助用户理解他们请求的复杂性
用户应检查响应中的“choices”数组。如果它为空,这可能表明模型无法生成响应。在应用程序中实施错误处理可以帮助管理这种情况,必要时提示用户重新措辞他们的查询
关键字段包括“id”,唯一标识响应;“object”,指示响应的类型;“created”,显示时间戳;以及“choices”,其中包含助手生成的消息。理解这些字段有助于用户有效利用数据
数据准确性通过对语言模型在多样化数据集上的持续训练得以保持 定期更新和评估确保模型提供相关和准确的信息 提高生成响应的可靠性
用户可以期待回复采用对话格式,助手提供连贯且与上下文相关的答复。结构通常包括清晰的答案或解释,通常经过排版以便于阅读,尤其是在创意或教育背景中
这些数据涵盖了广泛的主题,包括技术、文化、科学等。这种多样性使用户能够探索各种类别,适合用于教育、内容创作、客户支持等应用
接受的参数值包括“温度”(通常在0到1之间),“最大令牌数”(定义响应长度的正整数)和“top_p”(用于核采样的0到1之间的浮动值)这些值有助于控制生成响应的创造性和长度
响应数据的结构是一个包含“选择”数组的JSON对象。每个选择包含助理的消息及其角色(用户或助理)。“使用”字段提供了令牌计数,帮助用户理解他们请求的复杂性和效率
典型的用例包括为客户支持开发AI聊天机器人生成营销内容提供编码辅助和创建教育工具它的多功能性使其可以在各个行业中应用增强用户参与和生产力
数据来源于广泛的来源,包括书籍、文章和网站,这些都是基础语言模型的训练材料。这种多样化的训练有助于确保模型能够在各种主题上提供相关和准确的信息
Zyla API Hub 就像一个大型 API 商店,您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后,您可以选择要使用的 API。请记住,每个 API 都需要自己的订阅。但如果您订阅多个 API,您将为所有这些 API 使用相同的密钥,使事情变得更简单。
价格以 USD(美元)、EUR(欧元)、CAD(加元)、AUD(澳元)和 GBP(英镑)列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术,由 Stripe 提供支持,Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题,请通过 [email protected]
此外,如果您已经以这些货币中的任何一种(USD、EUR、CAD、AUD、GBP)拥有有效订阅,该货币将保留用于后续订阅。只要您没有任何有效订阅,您可以随时更改货币。
定价页面上显示的本地货币基于您 IP 地址的国家/地区,仅供参考。实际价格以 USD(美元)为单位。当您付款时,即使您在我们的网站上看到以本地货币显示的等值金额,您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。
有时,银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行,检查他们是否阻止了我们的收费。此外,您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助,请通过 [email protected]
价格由月度或年度订阅决定,具体取决于所选计划。
API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用(由状态 200 响应指示)才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。
Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始,并在下个月的同一日期续订。因此,如果您想避免未来的费用,请提前取消订阅。
要升级您当前的订阅计划,只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效,让您立即享受新计划的功能。请注意,您之前计划中的任何剩余调用都不会转移到新计划,因此在升级时请注意这一点。您将被收取新计划的全部金额。
要检查您本月剩余多少 API 调用,请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如,如果您的计划允许每月 1,000 个请求,而您已使用 100 个,则响应标头中的此字段将显示 900 个剩余调用。
要查看您的计划允许的最大 API 请求数,请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如,如果您的计划包括每月 1,000 个请求,此标头将显示 1,000。
"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如,如果它显示 3,600,则意味着还有 3,600 秒直到限制重置。
是的,您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意,升级、降级和取消会立即生效。此外,取消后,您将不再有权访问该服务,即使您的配额中还有剩余调用。
您可以通过我们的聊天渠道联系我们以获得即时帮助。我们始终在线,时间为上午 8 点至下午 5 点(EST)。如果您在该时间之后联系我们,我们将尽快回复您。此外,您可以通过 [email protected]
为了让您有机会在没有任何承诺的情况下体验我们的 API,我们提供 7 天免费试用,允许您免费进行最多 50 次 API 调用。此试用只能使用一次,因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用,但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束,以先发生者为准。如果您在试用期间达到 50 次请求限制,您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者,如果您在第 7 天之前不取消订阅,您的免费试用将结束,您的计划将自动计费,授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。
7 天后,您将被收取试用期间订阅的计划的全额费用。因此,在试用期结束前取消很重要。因忘记及时取消而提出的退款请求不被接受。
当您订阅 API 免费试用时,您可以进行最多 50 次 API 调用。如果您希望超出此限制进行额外的 API 调用,API 将提示您执行"开始您的付费计划"。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。
付款订单在每月 20 日至 30 日之间处理。如果您在 20 日之前提交请求,您的付款将在此时间范围内处理。
服务级别:
100%
响应时间:
937ms
服务级别:
100%
响应时间:
421ms
服务级别:
99%
响应时间:
3,177ms
服务级别:
100%
响应时间:
2,840ms
服务级别:
99%
响应时间:
3,156ms
服务级别:
100%
响应时间:
666ms
服务级别:
100%
响应时间:
4,239ms
服务级别:
100%
响应时间:
4,942ms
服务级别:
100%
响应时间:
451ms
服务级别:
100%
响应时间:
4,745ms
服务级别:
100%
响应时间:
77ms
服务级别:
100%
响应时间:
474ms
服务级别:
100%
响应时间:
524ms
服务级别:
100%
响应时间:
61ms
服务级别:
100%
响应时间:
784ms
服务级别:
100%
响应时间:
60ms
服务级别:
100%
响应时间:
1,434ms
服务级别:
100%
响应时间:
2,239ms
服务级别:
100%
响应时间:
206ms
服务级别:
100%
响应时间:
274ms