वॉइस रिकॉग्निशन एपीआई एक शक्तिशाली और सटीक उपकरण है जिसे बोले गए शब्दों को व्यवस्थित पाठ में बदलने के लिए डिज़ाइन किया गया है। उन्नत भाषण पहचान और एआई तकनीक का उपयोग करते हुए, यह विभिन्न उद्योगों और अनुप्रयोगों के लिए उच्च गुणवत्ता वाले ट्रांसक्रिप्शन प्रदान करता है। लाइव भाषण या पूर्व-रिकॉर्डेड ऑडियो फ़ाइलों को संसाधित करते समय, यह एपीआई न्यूनतम त्रुटियों के साथ विश्वसनीय और सटीक रूपांतरण की गारंटी देता है।
इस एपीआई की एक प्रमुख विशेषता इसकी बहुभाषी समर्थन है, जो उपयोगकर्ताओं को कई भाषाओं में ऑडियो का ट्रांसक्रिप्शन करने की अनुमति देती है अत्यधिक सटीकता के साथ। यह सुविधा विभिन्न भाषाओं में ट्रांसक्रिप्शन की आवश्यकता रखने वालों के लिए इसे एक अनिवार्य उपकरण बनाती है।
ऑडियो से टेक्स्ट - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request POST 'https://zylalabs.com/api/6370/voice+recognition+api/9135/audio+to+text?url=https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
वॉयस मान्यता एपीआई प्रदान किए गए ऑडियो फ़ाइल से लिप्यांकीत पाठ लौटाता है आउटपुट में मान्यता प्राप्त भाषण शामिल होता है जिसे संरचित पाठ प्रारूप में परिवर्तित किया जाता है जिससे उपयोगकर्ता बोले गए सामग्री को आसानी से एक्सेस और उपयोग कर सकें
प्रतिक्रिया डेटा में आमतौर पर "ट्रांसक्रिप्शन" (परिवर्तित पाठ), "भाषा" (ऑडियो की पहचान की गई भाषा), और "विश्वास" (ट्रांसक्रिप्शन की सटीकता को दर्शाने वाला स्कोर) जैसे फ़ील्ड शामिल होते हैं
उपयोगकर्ता "audio_url" (ऑडियो फ़ाइल का यूआरएल) और "language" (ऑडियो की भाषा को दर्शाने के लिए) जैसे पैरामीटर निर्दिष्ट कर सकते हैं इन पैरामीटर्स से ट्रांसक्रिप्शन प्रक्रिया को बेहतर सटीकता के लिए अनुकूलित करने में मदद मिलती है
उत्तर डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़ होते हैं जो अनुलेखन परिणामों का प्रतिनिधित्व करते हैं यह संरचना आसान पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देती है जिससे आगे की प्रसंस्करण या प्रदर्शन सुगम होता है
परंपरागत उपयोग के मामले में बैठकें लिखना वीडियो के लिए उपशीर्षक उत्पन्न करना साक्षात्कारों का लिखित रिकॉर्ड बनाना और अनुप्रयोगों में.voice कमांड सक्षम करना शामिल है API की बहुभाषी समर्थन इसकी विभिन्न उद्योगों में उपयोगिता को बढ़ाता है
डेटा की सटीकता उन्नत भाषण मान्यता एल्गोरिदम और विविध डेटा सेटों पर लगातार प्रशिक्षण के माध्यम से बनाए रखी जाती है नियमित अपडेट और गुणवत्ता जांच सुनिश्चित करती हैं कि एपीआई विभिन्न लहजों और भाषण पैटर्न के साथ अनुकूलित होता है
उपयोगकर्ता खोजने की क्षमता, विश्लेषण या प्रदर्शन के लिए ट्रांसक्राइब किए गए पाठ को अपने अनुप्रयोगों में एकीकृत करके लौटाए गए डेटा का उपयोग कर सकते हैं संरचित प्रारूप आसान हेरफेर की अनुमति देता है जैसे कि कीवर्ड को उजागर करना या सारांश उत्पन्न करना
मानक डेटा पैटर्न में संगत वाक्य, विराम चिह्न और बोले गए सामग्री के आधार पर सही प्रारूपण शामिल होते हैं उपयोगकर्ता ऑडियो की गुणवत्ता और भाषण की स्पष्टता के आधार पर लंबाई और जटिलता में भिन्नताएँ अनुभव कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,503ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
422ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
883ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
558ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
148ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,494ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13,713ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
319ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
57ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
10,199ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,441ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,462ms
सर्विस लेवल:
94%
रिस्पॉन्स टाइम:
659ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,465ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
918ms
सर्विस लेवल:
44%
रिस्पॉन्स टाइम:
496ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,881ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,595ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,494ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
272ms