Esta API utiliza algoritmos que podem ser usados para comparação de similaridade de strings, como Levenshtein, Jaro-Winkler e Dice. Esses algoritmos comparam os caracteres ou palavras em duas strings e atribuem uma pontuação com base em sua similaridade. Por exemplo, o algoritmo de distância de Levenshtein calcula o número mínimo de inserções, exclusões ou substituições necessárias para transformar uma string em outra. O algoritmo de distância Jaro-Winkler calcula uma pontuação de similaridade com base no número de caracteres correspondentes e no número de transposições necessárias para transformar uma string em outra.
Uma API de Similaridade de Texto pode ser usada para uma variedade de propósitos, como deduplicação de dados, vinculação de registros e correspondência difusa. Por exemplo, na deduplicação de dados, uma API pode ser usada para comparar dois registros em um banco de dados para determinar se representam a mesma entidade, como um cliente ou um produto. Na vinculação de registros, uma API pode ser usada para vincular registros de diferentes fontes de dados que representam a mesma entidade. Na correspondência difusa, uma API pode ser usada para fazer corresponder strings de texto que podem conter erros de ortografia, digitação ou variações de formatação.
Uma das principais vantagens de usar uma API de Similaridade de Texto é que ela fornece alta precisão na correspondência de strings. Além disso, as APIs podem ser usadas para comparar palavras de forma rápida e eficiente, facilitando o processamento de dados ou fluxos de dados em tempo real. A API oferece funcionalidades poderosas com precisão. Isso facilita para seus usuários encontrarem medidas exatas e descobrirem a porcentagem de texto similar encontrado em suas strings. Isso permite que você personalize os resultados da pesquisa para suas necessidades específicas, tornando esta API uma ferramenta flexível e versátil para suas aplicações ou serviços relacionados a strings.
Em resumo, a API de Similaridade de Texto é uma ferramenta útil para comparar strings de texto e determinar sua similaridade. Ao usar uma API, os desenvolvedores podem criar aplicativos que dependem da comparação de similaridade de strings, como deduplicação de dados, registro, e assim por diante.
Ela receberá parâmetros e fornecerá um JSON.
Deduplicação de Dados: Pode ser usada para identificar registros duplicados em um banco de dados, como entradas duplicadas de clientes ou listagens duplicadas de produtos.
Correspondência difusa: Pode ser usada para corresponder strings de texto similares, como nomes ou endereços, mesmo que contenham erros de ortografia ou variações.
Vinculação de registros: Esta API pode ser usada para diferenciar registros de diferentes fontes de dados que representam uma entidade similar, como um cliente ou paciente.
Otimização para motores de busca: Isso pode ser usado para identificar conteúdo duplicado em um site, o que pode afetar negativamente as classificações em motores de busca.
Detecção de fraudes: Pode ser usada para identificar atividades fraudulentas, como detectar contas de usuários semelhantes ou padrões de transações.
1 solicitação por segundo no plano gratuito
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request GET 'https://zylalabs.com/api/1961/text+similarity+api/1711/get+text+comparison?string1=twitter&string2=twitte' --header 'Authorization: Bearer YOUR_API_KEY'
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request POST 'https://zylalabs.com/api/1961/text+similarity+api/1712/get+comparison' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"string1": "twitter",
"string2": "twitte"
}'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
Cada ponto final retorna um objeto JSON contendo as strings de entrada e um objeto de resultados com as pontuações de similaridade calculadas usando vários algoritmos, como Jaro-Winkler, Levenshtein e Dice
Os campos principais nos dados de resposta incluem "string1," "string2" e um objeto "results" que contém pontuações de similaridade para cada algoritmo utilizado, como "jaro-winkler," "levenshtein-inverso" e "dice"
Os endpoints exigem dois parâmetros: "string1" e "string2", que são as strings de texto a serem comparadas. Os usuários podem personalizar suas solicitações fornecendo diferentes entradas de texto para comparação
Os dados da resposta estão organizados em um formato JSON, com as strings de entrada no nível superior e um objeto "resultados" aninhado que contém os scores de similaridade para cada algoritmo, facilitando o acesso e a interpretação
Os casos de uso típicos incluem deduplicação de dados para identificar registros duplicados correspondência difusa para corrigir erros de ortografia vinculação de registros entre fontes de dados e detecção de fraudes ao analisar padrões de transações semelhantes
A precisão dos dados é mantida através do uso de algoritmos estabelecidos como Levenshtein e Jaro-Winkler que foram projetados para fornecer pontuações de similaridade confiáveis com base em comparações de caracteres e palavras
Os usuários podem esperar pontuações de similaridade variando de 0 (sem similaridade) a 1 (strings idênticas) para cada algoritmo As pontuações podem variar com base na natureza das strings de entrada, como comprimento e diferenças de caracteres
Os usuários podem utilizar os dados retornados analisando as pontuações de similaridade para determinar quão intimamente relacionadas estão as strings de entrada permitindo aplicações como deduplicação vinculação de registros e aprimoramento das funcionalidades de busca
Nível de serviço:
100%
Tempo de resposta:
388ms
Nível de serviço:
100%
Tempo de resposta:
449ms
Nível de serviço:
100%
Tempo de resposta:
127ms
Nível de serviço:
100%
Tempo de resposta:
393ms
Nível de serviço:
100%
Tempo de resposta:
542ms
Nível de serviço:
100%
Tempo de resposta:
250ms
Nível de serviço:
100%
Tempo de resposta:
393ms
Nível de serviço:
100%
Tempo de resposta:
381ms
Nível de serviço:
100%
Tempo de resposta:
308ms
Nível de serviço:
100%
Tempo de resposta:
162ms