यह एपीआई एक ओसीआर (ऑप्टिकल कैरेक्टर रिकॉग्निशन) टूल है। आप जो भी चित्र इसे देंगे, उसका विश्लेषण किया जाएगा और उसमें हर शब्द निकाला जाएगा।
आपको अपनी पसंद की छवि का यूआरएल पास करना होगा। और आपको वह पाठ सामग्री मिल जाएगी जिसमें यह है। यह एक बहुत ही सहज इपीआई है और आप परिणामों से आश्चर्यचकित होंगे
यह एपीआई उन कंपनियों के लिए आदर्श है जिन्होंने बहुत सारी छवियाँ संग्रहीत की हैं और जो उनमें मौजूद पाठ को पुनः प्राप्त करना चाहते हैं। इससे आपको यह पहचानने में मदद मिलेगी कि आपकी ब्रांड की छवियों में बिना अनुमति के उपयोग हो रहा है या नहीं
इसके अलावा, यह एपीआई उन छवियों को पाठ के साथ वर्गीकृत करने में मदद करेगी। अक्षर पहचान के लिए धन्यवाद, आपको पूरा शब्द प्रदान किया जाएगा और आप केवल उसके पाठ को पढ़कर छवि की श्रेणी का पता लगा सकेंगे
प्रति माह एपीआई कॉल की सीमाओं के अलावा, सभी योजनाएँ समान रूप से कार्य करती हैं!
इस एंडपॉइंट के साथ, आप जिस छवि को पास करेंगे उसमें पाठ प्राप्त कर सकेंगे
केवल छवि यूआरएल के साथ, आप सभी पाठ को JSON प्रारूप में निकाल सकेंगे
छवि एक सामान्य JPEG या PNG छवि होनी चाहिए (स्वच्छता के साथ या बिना)। सामान्यतः, ऐसी छवियों के एक्सटेंशन होते हैं: .jpg, .jpeg, .png। सेवा इनपुट फ़ाइलों की MIME प्रकार द्वारा जांच करती है और निम्नलिखित प्रकारों को स्वीकार करती है:
image/jpegimage/pngछवि फ़ाइल का आकार 16Mb से कम होना चाहिए
छवि विश्लेषण - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] The URL of the image you want to extract the text from. Remember that only JPG, JPEG and PNG are supported. |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://file.io/GiqYoEWsoy9i","md5":"d4438cf64b5544dc22854b6585d8c398","width":2160,"height":3840,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.11990740740740741,0.019010416666666665,0.8467592592592592,0.89453125],"entities":[{"kind":"text","name":"text","text":"تحديات تؤثر على خدمة الذكاء الاصطناعى للغة العربية - التشكيل\nC\n00\nه استخدام القرآن الكريم\nيعتبر القرآن الكريم أكبر\nمصدر للغة العربية ولكن\nيصعب في بعض الأحيان\nاستخدامه في تدريب نماذج\nالذكاء الاصطناعي لتجنب\nتحريف المعنى. هناك بعض\nالنماذج التي تم تدريبها\nعلى القرآن الكريم، ولكن لم\nتزل هناك حاجة للمزيد من\nالجهود في هذا المجال.\nقه الكتابة من اليمين إلى اليسار\nتكتب اللغة العربية من اليمين إلى اليسار، وهذا يشكل تحديا في تطوير\nنماذج الذكاء الاصطناعي القادرة على الفهم والتعامل مع هذا النوع\nمن اللغات، مع أن هناك بعض النماذج التى تم تدريبها على الكتابة\nمن اليمين إلى اليسار، ولكن لم تزل هناك تحسينات مطلوبة لجعلها\nأكثر قبولاً وفعالية.\nوم الأرقام العربية\n09\nولّدت الأرقام العربية على أنها أرقام إنجليزية، فالرقم . (صفر) من\nالصعب توليده في الذكاء الاصطناعي، إذ يعتقد أنه عبارة عن نقطة."}]}]}]}]}
curl --location --request POST 'https://zylalabs.com/api/37/optical+character+recognition+api/108/image+analysis?url=https://storage.googleapis.com/api4ai-static/samples/ocr-1.png' --header 'Authorization: Bearer YOUR_API_KEY'
इस एंडपॉइंट का उपयोग करने के लिए चित्र को एक सामान्य JPEG या PNG चित्र होना चाहिए (पारदर्शिता के साथ या बिना)। सामान्यतः इन चित्रों के विस्तार होते हैं: .jpg, .jpeg, .png। सेवा इनपुट फ़ाइल को MIME प्रकार द्वारा जांचती है और निम्नलिखित प्रकारों को स्वीकार करती है:
image/jpeg
image/png
चित्र फ़ाइल का आकार 16 Mb से कम होना चाहिए
छवि विश्लेषण फाइल के साथ - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
रिक्वेस्ट बॉडी |
[आवश्यक] फाइल बाइनरी |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://gopostr.s3.amazonaws.com/binary_file_test_1679/tEMRXL7fQiIgoCXMcQ7UUWHcyqtYa4IeTb1NoAyt.jpg","md5":"f556d7e2b92037ea8b6af4d731597f1d","width":464,"height":479,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.4547413793103448,0.6868475991649269,0.44396551724137934,0.16075156576200417],"entities":[{"kind":"text","name":"text","text":"10\nAFA\nSAVE THE\nPLONET"}]}]}]}]}
curl --location 'https://zylalabs.com/api/37/optical+character+recognition+api/1679/image+analysis+with+file' \
--header 'Content-Type: application/x-www-form-urlencoded' \
--form 'image=@"FILE_PATH"'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
प्रत्येक एंडपॉइंट प्रदान की गई छवि से निकालित पाठ को JSON प्रारूप में लौटाता है प्रतिक्रिया में अनुरोध की स्थिति छवि URL आयाम और पहचाने गए पाठ के साथ इसके बाउंडिंग बॉक्स के निर्देशांक जैसे विवरण शामिल होते हैं
प्रतिक्रिया में प्रमुख क्षेत्र "स्थिति" (सफलता या विफलता को दर्शाता है) "नाम" (इमेज URL) "चौड़ाई" और "ऊँचाई" (आयाम) और "संवेदनाएँ" (जिसमें पहचाना गया पाठ और इसकी छवि में स्थिति शामिल है) हैं
प्रतिक्रिया डेटा को एक JSON ऑब्जेक्ट के रूप में संरचित किया गया है जिसमें एक "परिणाम" ऐरे शामिल है प्रत्येक परिणाम में छवि के बारे में मेटाडेटा और एक "इकाइयाँ" ऐरे शामिल है जो पहचाने गए पाठ और इसके बाउंडिंग बॉक्स के समन्वय का विवरण देती है
प्रत्येक एंडपॉइंट छवियों से निकाले गए पाठ के बारे में जानकारी प्रदान करता है जिसमें पहचाने गए शब्द उनके स्थान और छवि के समग्र आयाम शामिल हैं यह पाठ विश्लेषण और श्रेणीकरण के लिए उपयोगी हो सकता है
विशिष्ट उपयोग के मामलों में मुद्रित दस्तावेजों का डिजिटलीकरण करना छवियों में ब्रांड के उपयोग की निगरानी करना और छवियों को उनके द्वारा शामिल किए गए पाठ के आधार पर वर्गीकृत करना शामिल है व्यवसाय इस डेटा का लाभ सामग्री प्रबंधन और अनुपालन के लिए उठा सकते हैं
उपयोगकर्ता लौटाए गए डेटा का उपयोग JSON प्रतिक्रिया को पार्स करके पहचाने गए पाठ और इसके निर्देशांक को निकालने के लिए कर सकते हैं यह जानकारी आगे विश्लेषण इंडेक्सिंग या बेहतर कार्यक्षमता के लिए अनुप्रयोगों में एकीकृत करने के लिए उपयोग की जा सकती है
एंडपॉइंट एकल पैरामीटर को स्वीकार करते हैं: छवि यूआरएल या छवि फ़ाइल स्वयं छवि को JPEG या PNG प्रारूप में होना चाहिए और आकार में 16 MB से कम होना चाहिए MIME प्रकार को सफल प्रसंस्करण के लिए स्वीकृत प्रारूपों से मेल खाना चाहिए
डेटा सटीकता को उन्नत ओसीआर एल्गोरिदम के उपयोग के माध्यम से बनाए रखा जाता है जो छवि सामग्री का विश्लेषण करते हैं एपीआई को विभिन्न पाठ शैलियों और प्रारूपों को संभालने के लिए डिज़ाइन किया गया है जो विविध चित्र स्रोतों से विश्वसनीय पाठ निष्कर्षण सुनिश्चित करता है
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
343ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
91ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
5,385ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,195ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,724ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,934ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
297ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,819ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,462ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
841ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,703ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,183ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
9,245ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
5,854ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
10,498ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
15ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
97ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,138ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,235ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,685ms