语音识别API是一个强大且精确的工具,旨在将口语转换为有序文本。利用先进的语音识别和人工智能技术,它为各种行业和应用提供高质量的转录。无论是处理实时语音还是录制好的音频文件,该API都能保证可靠和准确的转换,错误率极低。
该API的一个关键亮点是其多语言支持,使用户能够以卓越的准确性转录多种语言的音频。这一功能使其成为需要多语言转录的用户的基本工具。
要使用此端点,您必须在参数中指明音频的URL
音频转文本 - 端点功能
| 对象 | 描述 |
|---|---|
url |
[必需] Indicates a URL |
{"success":true,"audio_file":"https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request POST 'https://zylalabs.com/api/6370/voice+recognition+api/9135/audio+to+text?url=https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
语音识别API从提供的音频文件返回转录文本。输出包括转换为结构化文本格式的识别语音,使用户能够轻松访问和利用口语内容
响应数据通常包括诸如“转录”(转换后的文本)、“语言”(音频的检测语言)和“置信度”(表示转录准确性的分数)等字段
用户可以指定参数,例如“audio_url”(音频文件的 URL)和“language”(以指示音频的语言)。这些参数有助于定制转录过程以提高准确性
响应数据采用JSON格式组织,键值对表示转录结果。此结构便于解析和集成到应用程序中,促进进一步处理或显示
典型的使用案例包括记录会议转录 为视频生成字幕 创建采访的书面记录 以及在应用程序中启用语音命令 此API的多语言支持增强了其在各种行业中的实用性
通过先进的语音识别算法和对多样化数据集的持续训练,确保数据准确性。定期更新和质量检查确保API适应不同的口音和语音模式
用户可以通过将转录文本集成到他们的应用程序中来利用返回的数据,以实现可搜索性、分析或展示。结构化的格式便于操作,例如突出显示关键字或生成摘要
标准数据模式包括连贯的句子、标点符号和根据口语内容的适当格式。用户可以根据音频质量和语音清晰度预期长度和复杂性的变化
服务级别:
100%
响应时间:
197ms
服务级别:
100%
响应时间:
444ms
服务级别:
100%
响应时间:
1,164ms
服务级别:
100%
响应时间:
728ms
服务级别:
100%
响应时间:
308ms
服务级别:
100%
响应时间:
418ms
服务级别:
100%
响应时间:
1,658ms
服务级别:
100%
响应时间:
1,320ms
服务级别:
100%
响应时间:
6,450ms
服务级别:
100%
响应时间:
134ms
服务级别:
100%
响应时间:
148ms
服务级别:
100%
响应时间:
15,384ms
服务级别:
100%
响应时间:
45ms
服务级别:
100%
响应时间:
524ms
服务级别:
100%
响应时间:
541ms
服务级别:
100%
响应时间:
1,434ms
服务级别:
100%
响应时间:
358ms
服务级别:
100%
响应时间:
396ms
服务级别:
100%
响应时间:
743ms
服务级别:
100%
响应时间:
407ms