音频转文本API是一种强大而精确的工具,旨在将口语语言转换为结构化文本。利用先进的语音识别和人工智能,它提供高质量的转录,适合各种行业和应用。无论是处理直播音频还是预录文件,该API都能确保准确可靠的文本转换,错误最小化。 该API的一个关键优势是其多语言能力,使用户能够以卓越的准确性转录多种语言的音频。这使其成为那些需要跨不同语言转录的人的宝贵资源。
转换 - 端点功能
| 对象 | 描述 |
|---|---|
url |
[必需] Indicates a URL |
{"success":true,"audio_file":"https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6372/audio+to+text+converter+api/9137/conversion?url=https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
转换端点返回来自音频输入的结构化文本输出。这包括转录的文本以及检测到的语言、置信度分数和任何适用的时间戳等元数据
响应数据中的关键字段通常包括“转录”(转换后的文本)、“语言”(音频的检测语言)、“置信度”(准确度分数)和“时间戳”(如果启用,指示单词被说出时的时间)
转换端点主要需要"audio_url"参数,该参数指定要转录的音频文件的URL 其他可选参数可能包括"language",用于指定所需的转录语言
响应数据以JSON格式组织,键值对表示转录和相关元数据。这种结构便于解析和集成到应用程序中
典型的使用案例包括转录会议、为视频生成字幕、创建访谈的书面记录以及将播客转换为文本以便于无障碍访问和搜索引擎优化
数据准确性是通过先进的语音识别算法和对多样音频数据集的持续训练来维持的 定期更新和质量检查确保各种语言和口音的高转录可靠性
用户可以通过指定可选参数,如“语言”,来自定义他们的请求,以便针对特定语言进行抄录,从而提高多语言音频内容的准确性
标准数据模式包括对口语内容的清晰转录,基于音频质量和复杂性可能存在长度和结构的变化。用户应该期待与口语内容密切匹配的连贯文本
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
4,790ms
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
0ms
服务级别:
100%
响应时间:
11,049ms
服务级别:
100%
响应时间:
84ms
服务级别:
100%
响应时间:
13,953ms
服务级别:
100%
响应时间:
62ms
服务级别:
100%
响应时间:
1,277ms
服务级别:
96%
响应时间:
735ms