वॉइस ट्रांसक्रिप्शन एपीआई बोले गए शब्दों को संरचित पाठ में परिवर्तित करने के लिए एक उन्नत और विश्वसनीय समाधान है। अत्याधुनिक स्पीच रिकॉग्निशन और आर्टिफिशियल इंटेलिजेंस का लाभ उठाते हुए यह विभिन्न उद्योगों और अनुप्रयोगों के लिए अनुकूलित सटीक ट्रांसक्रिप्शन प्रदान करता है। चाहे यह वास्तविक समय की बोली का प्रोसेसिंग हो या रिकॉर्डेड ऑडियो, यह एपीआई न्यूनतम गलतियों के साथ सटीक और कुशल टेक्स्ट रूपांतरण की गारंटी देता है
इसके प्रमुख फीचर्स में से एक बहुभाषी समर्थन है जो उपयोगकर्ताओं को विभिन्न भाषाओं में ऑडियो कोRemarkable precision के साथ ट्रांसक्रिप्ट करने की अनुमति देता है। यह उन लोगों के लिए एक आवश्यक उपकरण बनाता है जिन्हें विभिन्न भाषाई परिप्रेक्ष्य में उच्च गुणवत्ता वाले ट्रांसक्रिप्शन की आवश्यकता है
प्रतिलेखन - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] Indicates a URL |
{"success":true,"audio_file":"https://s31.aconvert.com/convert/p3r68-cdx67/s49sb-3bftf.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request GET 'https://zylalabs.com/api/6376/voice+transcription+api/9143/transcription?url=https://imgv3.fotor.com/images/blog-richtext-image/make-a-watermark-for-a-landscape-image.jpg' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
स्पीच एनालिसिस एपीआई ऑडियो इनपुट से ट्रांसक्राइब किए गए टेक्स्ट को वापस करता है आउटपुट में टेक्स्ट प्रारूप में पहचानी गई स्पीच शामिल होती है जिसे उपशीर्षक दस्तावेज़ीकरण या विश्लेषण जैसे विभिन्न अनुप्रयोगों के लिए उपयोग किया जा सकता है
प्रतिक्रिया डेटा में मुख्य क्षेत्र आमतौर पर "ट्रांसक्रिप्शन" के लिए रूपांतरित पाठ "भाषा" के लिए जो पहचानी गई भाषा को इंगित करता है और "विश्वास" जो ट्रांसक्रिप्शन की सटीकता को दर्शाता है
पीओएसटी ऑब्टेन टेक्स्ट एंडपॉइंट के लिए प्राथमिक पैरामीटर "ऑडियो_यूआरएल" है जो ट्रांस्क्राइब किए जाने वाले ऑडियो फ़ाइल के यूआरएल को निर्दिष्ट करता है अतिरिक्त पैरामीटर में "भाषा" शामिल हो सकती है जो ट्रांस्क्रिप्शन के लिए इच्छित भाषा को निर्दिष्ट करती है
प्रतिक्रिया डेटा एक JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य युग्म होते हैं मुख्य संरचना में ट्रांस्क्रिप्शन भाषा और आत्मविश्वास स्कोर के लिए क्षेत्र शामिल हैं जिससे एप्लिकेशन में आसान पार्सिंग और एकीकरण संभव है
प्रमुख उपयोग मामलों में वीडियो के लिए सबटाइटल बनाना मीटिंग या इंटरव्यू के लिए ट्रांसक्रिप्ट तैयार करना सुनने में असमर्थ उपयोगकर्ताओं के लिए पहुंच को बेहतर बनाना और विभिन्न उद्योगों में अंतर्दृष्टि के लिए बोले गए सामग्री का विश्लेषण करना शामिल है
डेटा सटीकता को उन्नत भाषण पहचान एल्गोरिदम और विविध डेटा सेट पर निरंतर प्रशिक्षण के माध्यम से बनाए रखा जाता है एपीआई गुणवत्ता जांच का भी उपयोग करता है ताकि त्रुटियों को कम किया जा सके और ट्रांसक्रिप्शन की विश्वसनीयता में सुधार हो सके
उपयोगकर्ता अपनी अनुरोधों को अनुकूलित कर सकते हैं "भाषा" पैरामीटर को निर्दिष्ट करके विशिष्ट भाषाओं के लिए ट्रांसक्रिप्शन को लक्षित करने के लिए यह ऑडियो सामग्री की भाषाई संदर्भ के आधार पर अनुकूलित आउटपुट की अनुमति देता है
मानक डेटा पैटर्न में उचित विराम चिह्न और पूंजीकरण के साथ स्पष्ट वाक्य शामिल होते हैं उपयोगकर्ता ऑडियो गुणवत्ता वक्ता के उच्चारण और बैकग्राउंड शोर स्तरों के आधार पर सटीकता में भिन्नताएँ उम्मीद कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
11,869ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,452ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,228ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
320ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,761ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
10,033ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,497ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
286ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
920ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,845ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
912ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,246ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
25ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
63ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
26ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
63ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
86ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
32ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
22ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
42ms