Pasar dos cadenas de texto y recibir el porcentaje de similitud entre ellas.
Detección de Plagio: Las instituciones educativas y los editores de contenido pueden utilizar la API para comparar las presentaciones de los estudiantes o artículos publicados con documentos existentes. Al detectar puntuaciones de similitud altas, puede identificar casos potenciales de plagio o contenido duplicado.
Recomendación de Contenido: Las plataformas de comercio electrónico, servicios de transmisión y sitios web de noticias pueden mejorar la experiencia del usuario recomendando productos, películas o artículos similares. La API puede analizar las preferencias del usuario y sugerir artículos con altas puntuaciones de similitud a sus selecciones anteriores.
Chatbots de Atención al Cliente: Los sistemas de soporte al cliente pueden utilizar la API para mejorar las respuestas de los chatbots. Al analizar la similitud entre las consultas de los clientes y una base de datos de preguntas frecuentes o interacciones pasadas, el chatbot puede proporcionar respuestas más precisas y relevantes.
Agrupamiento y Organización de Documentos: Las organizaciones que manejan grandes volúmenes de documentos, como bufetes de abogados o instituciones de investigación, pueden utilizar la API para agrupar y categorizar documentos en función de su similitud de contenido. Esto ayuda en la gestión y recuperación eficiente de documentos.
Mejora de Motores de Búsqueda: Los motores de búsqueda pueden aprovechar la API para mejorar los resultados de búsqueda. Al comparar la similitud entre las consultas de los usuarios y las páginas indexadas, la API puede clasificar y mostrar los resultados más relevantes, mejorando la experiencia general de búsqueda para los usuarios.
Además del número de llamadas a la API, no hay ninguna otra limitación.
Devuelve un puntaje de similitud entre 0 y 1 (1 es similar y 0 es disímil) de dos textos dados.
text_1 (requerido) - primer texto de entrada. Máximo 5000 caracteres.
text_2 (requerido) - segundo texto de entrada. Máximo 5000 caracteres.
Comprobar similitud - Características del Endpoint
| Objeto | Descripción |
|---|---|
Cuerpo de la Solicitud |
[Requerido] Json |
{"similarity": 0.8126154541969299}
curl --location --request POST 'https://zylalabs.com/api/4499/content+similarity+analysis+api/5520/check+similarity' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{"text_1": "This is an example sentence.",
"text_2": "This is just another example sentence."}'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
La API acepta entradas de texto plano en formato UTF-8. Se pueden procesar tanto frases cortas como párrafos largos, lo que permite un uso flexible en diversas aplicaciones.
La API utiliza modelos avanzados de PNL para incrustar textos en vectores de 768 dimensiones y luego calcula la similitud coseno entre estos vectores para producir una puntuación de similitud que varía de -1 a 1, donde 1 indica textos idénticos.
La API utiliza modelos de vanguardia basados en transformadores, como BERT o sus variantes, para incrustar textos. Estos modelos están preentrenados en grandes corpus y ajustados para lograr alta precisión en la captura del significado semántico.
La API está optimizada para baja latencia, respondiendo típicamente dentro de unos cientos de milisegundos para solicitudes estándar. El rendimiento puede variar según la longitud y complejidad de los textos de entrada.
Sí, la API admite múltiples idiomas, siempre que el modelo de incrustación subyacente haya sido entrenado con datos multilingües. Esto permite cálculos de similitud precisos entre diferentes idiomas.
El endpoint Check Similarity devuelve un objeto JSON que contiene una única clave, "similarity," que representa la puntuación de similitud entre los dos textos de entrada. La puntuación varía de 0 a 1, donde 1 indica contenido idéntico y 0 indica ninguna similitud.
Los datos de respuesta incluyen el campo "similaridad", que es un número de punto flotante. Este valor cuantifica el grado de similitud entre las dos entradas de texto proporcionadas.
Los usuarios pueden personalizar sus solicitudes proporcionando dos parámetros de texto, `text_1` y `text_2`, cada uno con una longitud máxima de 5000 caracteres. Esto permite una entrada flexible basada en necesidades específicas de análisis de contenido.
Los datos de respuesta están estructurados en formato JSON, con un único par clave-valor. La clave es "similarity" y el valor es una puntuación numérica que representa la similitud entre los dos textos.
Los casos de uso típicos incluyen la detección de plagio en entornos educativos, recomendaciones de contenido en comercio electrónico, mejora de las respuestas de chatbots en atención al cliente y agrupación de documentos para una organización eficiente en contextos de investigación o legales.
La precisión de los datos se mantiene a través del uso de modelos de PNL avanzados que están preentrenados en conjuntos de datos extensos. Actualizaciones continuas y ajustes finos garantizan que los modelos sigan siendo efectivos en captar el significado semántico y proporcionar puntajes de similitud confiables.
Si una o ambas entradas de texto están vacías, la API generalmente devolverá un puntaje de similitud de 0, lo que indica que no hay similitud. Los usuarios deben asegurarse de que ambas entradas contengan texto válido para obtener resultados significativos.
Los usuarios pueden esperar que los puntajes de similitud varíen según el contenido. Los puntajes cercanos a 1 indican alta similitud, mientras que los puntajes cerca de 0 sugieren diferencias significativas. Pueden surgir patrones según el tipo de contenido que se esté comparando, como artículos académicos frente a escritos informales.
Nivel de Servicio:
100%
Tiempo de Respuesta:
326ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.002ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
388ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
335ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
290ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
449ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
542ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
308ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
603ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
586ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.343ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
491ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.978ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
166ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
9.808ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
49ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
255ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
751ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
446ms