यह API ऐसे एल्गोरिदम का उपयोग करती है जो स्ट्रिंग समानता की तुलना के लिए उपयोग किया जा सकता है जैसे लेवेंस्ट्राइन, जारो-विंकलर और डाइस। ये एल्गोरिदम दो स्ट्रिंग्स में वर्णों या शब्दों की तुलना करते हैं और उनके समानता के आधार पर एक स्कोर तय करते हैं। उदाहरण के लिए, लेवेंस्ट्राइन दूरी एल्गोरिदम न्यूनतम संख्या की सम्मिलन, विलोपन या प्रतिस्थापन की गणना करता है जो एक स्ट्रिंग को दूसरी में बदलने के लिए आवश्यक है। जारो-विंकलर दूरी एल्गोरिदम मिलते-जुलते वर्णों की संख्या और एक स्ट्रिंग को दूसरी में बदलने के लिए आवश्यक प्रसरण की संख्या के आधार पर एक समानता स्कोर की गणना करता है।
एक टेक्स्ट समानता API का उपयोग विभिन्न उद्देश्यों के लिए किया जा सकता है, जैसे डेटा डीडुप्लीकेशन, रिकॉर्ड लिंकिंग और फजी मिलान। उदाहरण के लिए, डेटा डीडुप्लीकेशन में, एक API का उपयोग एक डेटाबेस में दो रिकॉर्ड की तुलना करने के लिए किया जा सकता है यह निर्धारित करने के लिए कि क्या वे एक ही इकाई को दर्शाते हैं, जैसे कि एक ग्राहक या एक उत्पाद। रिकॉर्ड लिंकिंग में, एक API का उपयोग विभिन्न डेटा स्रोतों से रिकॉर्ड को लिंक करने के लिए किया जा सकता है जो एक ही इकाई को दर्शाते हैं। फजी मिलान में, एक API का उपयोग उन टेक्स्ट स्ट्रिंग्स का मिलान करने के लिए किया जा सकता है जिनमें गलत वर्तनी, टाइपिंग गलतियाँ, या फॉर्मेटिंग भिन्नताएँ हो सकती हैं।
टेक्स्ट समानता API का उपयोग करने का एक मुख्य लाभ यह है कि यह स्ट्रिंग मिलान के लिए उच्च सटीकता प्रदान करता है। इसके अतिरिक्त, APIs का उपयोग शब्दों की त्वरित और प्रभावी तुलना करने के लिए किया जा सकता है जिससे डेटा या डेटा स्ट्रीम को वास्तविक समय में प्रोसेस करना आसान हो जाता है। API सटीकता के साथ शक्तिशाली कार्यक्षमता प्रदान करता है। यह आपके उपयोगकर्ताओं के लिए आपके स्ट्रिंग्स में पाए गए समान पाठ के प्रतिशत का पता लगाना और सटीक माप खोजना आसान बनाता है। यह आपको अपनी विशिष्ट आवश्यकताओं के अनुसार खोज परिणामों को अनुकूलित करने की अनुमति देता है, जिससे यह API आपके अनुप्रयोगों या स्ट्रिंग-संबंधित सेवाओं के लिए एक लचीला और बहुपरकारी उपकरण बन जाता है।
संक्षेप में, टेक्स्ट समानता API टेक्स्ट स्ट्रिंग्स की तुलना करने और उनकी समानता निर्धारित करने के लिए एक उपयोगी उपकरण है। API का उपयोग करके, डेवलपर्स ऐसे अनुप्रयोग बना सकते हैं जो स्ट्रिंग समानता की तुलना पर निर्भर करते हैं, जैसे डेटा डीडुप्लीकेशन, लॉगिंग, आदि।
यह पैरामीटर्स प्राप्त करेगा और आपको एक JSON प्रदान करेगा।
डेटा डीडुप्लीकेशन: इसे डेटाबेस में डुप्लिकेट रिकॉर्ड की पहचान करने के लिए उपयोग किया जा सकता है जैसे डुप्लिकेट ग्राहक प्रविष्टियाँ या डुप्लिकेट उत्पाद सूची।
फजी मिलान: इसका उपयोग समान टेक्स्ट स्ट्रिंग्स का मिलान करने के लिए किया जा सकता है जैसे नाम या पते, भले ही उनमें गलत वर्तनी या भिन्नताएँ हों।
रिकॉर्ड लिंकिंग: यह API अलग-अलग डेटा स्रोतों से रिकॉर्ड को भिन्न करने के लिए उपयोग किया जा सकता है जो एक समान इकाई का प्रतिनिधित्व करते हैं जैसे ग्राहक या रोगी।
सर्च इंजन ऑप्टिमाइजेशन: इसका उपयोग एक वेब साइट पर डुप्लिकेट सामग्री की पहचान करने के लिए किया जा सकता है, जो सर्च इंजन रैंकिंग को नकारात्मक रूप से प्रभावित कर सकता है।
धोखाधड़ी का पता लगाना: इसका उपयोग धोखाधड़ी गतिविधियों की पहचान के लिए किया जा सकता है जैसे समान उपयोगकर्ता खातों या लेन-देन के पैटर्न का पता लगाना।
फ्री प्लान में 1 अनुरोध प्रति सेकंड।
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request GET 'https://zylalabs.com/api/1961/text+similarity+api/1711/get+text+comparison?string1=twitter&string2=twitte' --header 'Authorization: Bearer YOUR_API_KEY'
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request POST 'https://zylalabs.com/api/1961/text+similarity+api/1712/get+comparison' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"string1": "twitter",
"string2": "twitte"
}'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
प्रत्येक एंडपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें इनपुट स्ट्रिंग्स और एक परिणाम ऑब्जेक्ट होता है जिसमें विभिन्न एल्गोरिदम जैसे जारो-विंक्लर, लेवेनस्टीन और डाइस का उपयोग करके समानता स्कोर की गणना की गई होती है।
प्रतिक्रिया डेटा में महत्वपूर्ण क्षेत्र "string1," "string2," और एक "results" वस्तु शामिल है जिसमें प्रयोग किए गए प्रत्येक एल्गोरिदम के लिए समानता स्कोर होते हैं जैसे "jaro-winkler," "levenshtein-inverse," और "dice"
एंडपॉइंट्स को दो पैरामीटर की आवश्यकता होती है: "string1" और "string2" जो कि उन टेक्स्ट स्ट्रिंग्स हैं जिन्हें तुलना की जानी है उपयोगकर्ता तुलना के लिए विभिन्न टेक्स्ट इनपुट प्रदान करके अपने अनुरोधों को अनुकूलित कर सकते हैं
प्रतिक्रिया डेटा को JSON प्रारूप में व्यवस्थित किया गया है जिसमें इनपुट स्ट्रिंग्स शीर्ष स्तर पर हैं और एक नेस्टेड "परिणाम" वस्तु है जो प्रत्येक एल्गोरिदम के लिए समानता स्कोर को शामिल करती है जिससे इसे एक्सेस करना और समझना आसान है
सामान्य उपयोग के मामलों में डाटा डीडुप्लिकेशन शामिल है ताकि डुप्लीकेट रिकॉर्ड की पहचान की जा सके फजी मैचिंग गलत स्पेलिंग को सही करने के लिए डेटा स्रोतों के बीच रिकॉर्ड लिंकिंग और समान लेनदेन पैटर्न का विश्लेषण करके धोखाधड़ी का पता लगाने के लिए
डेटा की सटीकता मान्यता प्राप्त एल्गोरिदम जैसे लेवेन्स्टीन और जारो-विंकलर के उपयोग के माध्यम से बनाए रखी जाती है जो वर्ण और शब्द की तुलना के आधार पर विश्वसनीय समानता स्कोर प्रदान करने के लिए डिज़ाइन किए गए हैं
उपयोगकर्ता प्रत्येक एल्गोरिदम के लिए 0 (कोई समानता नहीं) से 1 (समान स्ट्रिंग्स) के बीच समानता स्कोर की अपेक्षा कर सकते हैं स्कोर इनपुट स्ट्रिंग्स की प्रकृति जैसे लंबाई और वर्ण भिन्नताओं के आधार पर भिन्न हो सकते हैं
उपयोगकर्ता लौटाए गए डेटा का उपयोग समानता स्कोर का विश्लेषण करके कर सकते हैं यह निर्धारित करने के लिए कि इनपुट स्ट्रिंग्स कितनी निकटता से संबंधित हैं जिससे डीडुप्लिकेशन रिकॉर्ड लिंकिंग और खोज कार्यक्षमताओं को बढ़ाने जैसी एप्लिकेशनों को सक्षम किया जा सके
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
816ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
7,340ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
290ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,641ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
454ms
सर्विस लेवल:
90%
रिस्पॉन्स टाइम:
721ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,160ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
678ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,565ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
11,282ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,706ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,260ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,773ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
300ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,420ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,673ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
816ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,728ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,597ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
2,759ms