वॉइस रिकॉग्निशन एपीआई एक शक्तिशाली और सटीक उपकरण है जिसे बोले गए शब्दों को व्यवस्थित पाठ में बदलने के लिए डिज़ाइन किया गया है। उन्नत भाषण पहचान और एआई तकनीक का उपयोग करते हुए, यह विभिन्न उद्योगों और अनुप्रयोगों के लिए उच्च गुणवत्ता वाले ट्रांसक्रिप्शन प्रदान करता है। लाइव भाषण या पूर्व-रिकॉर्डेड ऑडियो फ़ाइलों को संसाधित करते समय, यह एपीआई न्यूनतम त्रुटियों के साथ विश्वसनीय और सटीक रूपांतरण की गारंटी देता है।
इस एपीआई की एक प्रमुख विशेषता इसकी बहुभाषी समर्थन है, जो उपयोगकर्ताओं को कई भाषाओं में ऑडियो का ट्रांसक्रिप्शन करने की अनुमति देती है अत्यधिक सटीकता के साथ। यह सुविधा विभिन्न भाषाओं में ट्रांसक्रिप्शन की आवश्यकता रखने वालों के लिए इसे एक अनिवार्य उपकरण बनाती है।
{"success":true,"audio_file":"https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request POST 'https://zylalabs.com/api/6370/voice+recognition+api/9135/audio+to+text?url=https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
वॉयस मान्यता एपीआई प्रदान किए गए ऑडियो फ़ाइल से लिप्यांकीत पाठ लौटाता है आउटपुट में मान्यता प्राप्त भाषण शामिल होता है जिसे संरचित पाठ प्रारूप में परिवर्तित किया जाता है जिससे उपयोगकर्ता बोले गए सामग्री को आसानी से एक्सेस और उपयोग कर सकें
प्रतिक्रिया डेटा में आमतौर पर "ट्रांसक्रिप्शन" (परिवर्तित पाठ), "भाषा" (ऑडियो की पहचान की गई भाषा), और "विश्वास" (ट्रांसक्रिप्शन की सटीकता को दर्शाने वाला स्कोर) जैसे फ़ील्ड शामिल होते हैं
उपयोगकर्ता "audio_url" (ऑडियो फ़ाइल का यूआरएल) और "language" (ऑडियो की भाषा को दर्शाने के लिए) जैसे पैरामीटर निर्दिष्ट कर सकते हैं इन पैरामीटर्स से ट्रांसक्रिप्शन प्रक्रिया को बेहतर सटीकता के लिए अनुकूलित करने में मदद मिलती है
उत्तर डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़ होते हैं जो अनुलेखन परिणामों का प्रतिनिधित्व करते हैं यह संरचना आसान पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देती है जिससे आगे की प्रसंस्करण या प्रदर्शन सुगम होता है
परंपरागत उपयोग के मामले में बैठकें लिखना वीडियो के लिए उपशीर्षक उत्पन्न करना साक्षात्कारों का लिखित रिकॉर्ड बनाना और अनुप्रयोगों में.voice कमांड सक्षम करना शामिल है API की बहुभाषी समर्थन इसकी विभिन्न उद्योगों में उपयोगिता को बढ़ाता है
डेटा की सटीकता उन्नत भाषण मान्यता एल्गोरिदम और विविध डेटा सेटों पर लगातार प्रशिक्षण के माध्यम से बनाए रखी जाती है नियमित अपडेट और गुणवत्ता जांच सुनिश्चित करती हैं कि एपीआई विभिन्न लहजों और भाषण पैटर्न के साथ अनुकूलित होता है
उपयोगकर्ता खोजने की क्षमता, विश्लेषण या प्रदर्शन के लिए ट्रांसक्राइब किए गए पाठ को अपने अनुप्रयोगों में एकीकृत करके लौटाए गए डेटा का उपयोग कर सकते हैं संरचित प्रारूप आसान हेरफेर की अनुमति देता है जैसे कि कीवर्ड को उजागर करना या सारांश उत्पन्न करना
मानक डेटा पैटर्न में संगत वाक्य, विराम चिह्न और बोले गए सामग्री के आधार पर सही प्रारूपण शामिल होते हैं उपयोगकर्ता ऑडियो की गुणवत्ता और भाषण की स्पष्टता के आधार पर लंबाई और जटिलता में भिन्नताएँ अनुभव कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,503ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
426ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
883ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
558ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
992ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,494ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13,713ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
816ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
148ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
319ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
686ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,976ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
10,867ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,065ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
620ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,127ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,192ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,610ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,082ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,043ms