ऑडियो से टेक्स्ट कनवर्टर एपीआई एक शक्तिशाली और सटीक उपकरण है जिसे बोली गई भाषा को संरचित टेक्स्ट में बदलने के लिए डिज़ाइन किया गया है अत्याधुनिक स्पीच पहचान और कृत्रिम बुद्धिमत्ता का उपयोग करते हुए यह विभिन्न उद्योगों और अनुप्रयोगों के लिए उच्च गुणवत्ता वाले प्रतिलेख प्रदान करता है चाहे वह लाइव ऑडियो हो या प्री-रिकॉर्डेड फ़ाइलें यह एपीआई न्यूनतम त्रुटियों के साथ सटीक और विश्वसनीय टेक्स्ट रूपांतरण सुनिश्चित करता है इस एपीआई का एक प्रमुख लाभ इसकी बहुभाषी क्षमता है जो उपयोगकर्ताओं को बहुविविध भाषाओं में ऑडियो को अत्यधिक सटीकता के साथ ट्रांसक्राइब करने की अनुमति देती है यह विभिन्न भाषाओं में ट्रांसक्रिप्शन की आवश्यकता रखने वालों के लिए एक अमूल्य संसाधन बनाता है
परिवर्तन - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6372/audio+to+text+converter+api/9137/conversion?url=https://s21.aconvert.com/convert/p3r68-cdx67/wma8s-k9scl.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
संक्रमण अंतिम बिंदु ऑडियो इनपुट से प्राप्त एक संरचित पाठ आउटपुट लौटाता है इसमें ट्रांसक्राइब किया गया पाठ और मैटाडेटा शामिल है जैसे पहचान की गई भाषा आत्मविश्वास स्कोर और यदि लागू हो तो किसी भी टाइमस्टैम्प
प्रतिक्रिया डेटा में मुख्य क्षेत्र आमतौर पर "ट्रांसक्रिप्शन" (परिवर्तित पाठ) "भाषा" (ऑडियो की पहचानी गई भाषा) "कॉन्फिडेंस" (सटीकता स्कोर) और "टाइमस्टैम्प" (यदि सक्षम किया गया हो तो, यह बताता है कि कब शब्द बोला गया) शामिल होते हैं
रूपांतरण एंडपॉइंट मुख्य रूप से "ऑडियो_यूआरएल" पैरामीटर की आवश्यकता होती है जो ट्रांसक्रिप्शन के लिए ऑडियो फ़ाइल का यूआरएल निर्दिष्ट करता है अन्य वैकल्पिक पैरामीटर में "भाषा" शामिल हो सकती है जो ट्रांसक्रिप्शन के लिए वांछित भाषा निर्दिष्ट करता है
प्रतिक्रिया डेटा JSON प्रारूप में संगठित है जिसमें कुंजी-मूल्य जोड़े ट्रांसक्रिप्शन और संबंधित मेटाडेटा का प्रतिनिधित्व करते हैं यह संरचना आसानी से पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देती है
विशिष्ट उपयोग के मामलों में बैठकों का लिप्यांतरण करना वीडियो के लिए उपशीर्षक उत्पन्न करना साक्षात्कारों के लिखित रिकॉर्ड बनाना और पॉडकास्ट को पाठ में परिवर्तित करना शामिल है ताकि इसे सुलभता और एसईओ उद्देश्यों के लिए उपयोग किया जा सके
डेटा सटीकता को उन्नत भाषाई मान्यता एल्गोरिदम और विविध ऑडियो डेटा सेट पर निरंतर प्रशिक्षण के माध्यम से बनाए रखा जाता है नियमित अपडेट और गुणवत्ता जांच विभिन्न भाषाओं और उच्चारणों में उच्च रूपांतरण विश्वसनीयता सुनिश्चित करते हैं
उपयोगकर्ता वैकल्पिक पैरामीटर जैसे "भाषा" निर्दिष्ट करके अपनी अनुरोधों को अनुकूलित कर सकते हैं ताकि ट्रांसक्रिप्शन के लिए विशिष्ट भाषाओं को लक्षित किया जा सके जिससे बहुभाषी ऑडियो सामग्री के लिए सटीकता बढ़ सकती है
मानक डेटा पैटर्न में बोले गए सामग्री का स्पष्ट लिप्यांतरण शामिल है जिसकी लंबाई और संरचना ऑडियो गुणवत्ता और जटिलता के आधार पर भिन्न हो सकती है उपयोगकर्ताओं को उम्मीद करनी चाहिए कि पाठ सुसंगत हो जो बोले गए शब्दों से निकटता से मेल खाता हो
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,434ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
16ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,807ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
365ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
9,827ms
सर्विस लेवल:
99%
रिस्पॉन्स टाइम:
461ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
835ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,281ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,904ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,944ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
7,847ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
118ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
110ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
307ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,373ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
68ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
854ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
124ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
596ms