Transcripción de voz a texto API

La API de Conversión de Voz a Texto convierte el lenguaje hablado en texto escrito con alta precisión, lo que permite la transcripción en tiempo real y capacidades de comandos de voz para aplicaciones.
Usa esta API desde tu agente de IA vía MCP
Funciona con OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline y cualquier cliente de IA compatible con MCP.
Docs y configuración
Crea un skill envolviendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Acerca de la API:  

La API de conversión de voz a texto representa una solución tecnológica sofisticada diseñada para cerrar la brecha entre el lenguaje hablado y el texto escrito. En esencia, esta API interpreta el discurso y lo traduce en representaciones textuales precisas. Aprovechando redes neuronales y vastos conjuntos de datos, puede entender y transcribir una amplia variedad de idiomas, acentos y dialectos, asegurando una amplia aplicabilidad en diferentes contextos lingüísticos.

Además, la API de conversión de voz a texto ha sido diseñada con la escalabilidad en mente. Puede acomodar volúmenes variables de datos de voz, desde comandos cortos hasta largos pasajes hablados. Esta escalabilidad asegura que la API pueda manejar tanto solicitudes individuales como implementaciones a gran escala, convirtiéndola en una herramienta versátil para diferentes aplicaciones.

En general, la API de conversión de voz a texto representa un avance significativo en el campo del procesamiento del lenguaje natural y el reconocimiento de voz. Combinando tecnología de vanguardia con un diseño centrado en el usuario, ofrece una poderosa herramienta para convertir el lenguaje hablado en texto escrito. Su versatilidad, precisión y adaptabilidad la convierten en un recurso valioso para una amplia gama de aplicaciones, desde la comunicación diaria hasta casos de uso en industrias especializadas.

 

¿Qué recibe esta API y qué proporciona su API (entrada/salida)?

La API recibe un archivo de audio y devuelve un texto.

 

¿Cuáles son los casos de uso más comunes de esta API?

  1. Asistentes de voz: Mejorar la funcionalidad de asistentes virtuales como Siri, Alexa y Google Assistant al permitirles entender y procesar comandos y consultas de usuarios en lenguaje natural.

    Servicios de transcripción: Convertir automáticamente audio de reuniones, entrevistas y conferencias en texto para fines de documentación y archivo.

    Servicio al cliente: Mejorar el soporte al cliente transcribiendo interacciones de voz entre clientes y agentes de servicio, permitiendo un mejor análisis y seguimiento.

    Análisis de voz: Analizar interacciones habladas para obtener información sobre el sentimiento del cliente, patrones de comportamiento y niveles de interacción en centros de llamadas o durante campañas de marketing.

    Aprendizaje de idiomas: Apoyar a los estudiantes de idiomas transcribiendo sesiones de práctica hablada y proporcionando retroalimentación sobre pronunciación y fluidez.

    Creación de contenido: Ayudar a creadores de contenido y periodistas transcribiendo entrevistas, pódcast o discursos, que pueden ser utilizados luego para artículos, blogs u otro contenido escrito.

     

¿Existen limitaciones en sus planes?

Además del número de llamadas a la API, no hay ninguna otra limitación.

Documentación de la API

Endpoints


Para utilizar este punto final, debe especificar un archivo mp3 para recibir el texto de audio.



                                                                            
POST https://zylalabs.com/api/4914/speech+to+text+api/6186/get+text
                                                                            
                                                                        

Obtener texto - Características del Endpoint

Objeto Descripción
Cuerpo de la Solicitud [Requerido] Archivo Binario
Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
  "text": "Hola a todos, espero que se encuentren bien."
}
                                                                                                                                                                                                                    
                                                                                                    

Obtener texto - CÓDIGOS DE EJEMPLO


    curl --location 'https://zylalabs.com/api/4914/speech+to+text+api/6186/get+text' \
    --header 'Content-Type: multipart/form-data' \ 
    --form 'image=@"FILE_PATH"'


Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el Transcripción de voz a texto API simplemente incluye tu token de portador en el encabezado de Autorización.
Encabezados
Encabezado Descripción
Autorización [Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en
$ 10.000/Año


  • Volumen Personalizado
  • Límite de solicitudes personalizado
  • Soporte al Cliente Especializado
  • Monitoreo de API en Tiempo Real

Funciones favoritas de los clientes

  • ✔︎ Paga Solo por Solicitudes Exitosas
  • ✔︎ Prueba 7 días gratis
  • ✔︎ Soporte Multilenguaje
  • ✔︎ Una Clave API, Todas las APIs.
  • ✔︎ Panel de Control Intuitivo
  • ✔︎ Manejo de Errores Integral
  • ✔︎ Documentación Amigable para Desarrolladores
  • ✔︎ Integración con Postman
  • ✔︎ Conexiones HTTPS Seguras
  • ✔︎ Tiempo de Actividad Fiable

Transcripción de voz a texto API FAQs

Para usar esta API, los usuarios deben especificar un archivo de audio.

La API de voz a texto convierte el lenguaje hablado en texto escrito utilizando algoritmos avanzados, lo que permite una transcripción precisa y la comprensión de las entradas de audio.

Zyla ofrece una amplia gama de métodos de integración para casi todos los lenguajes de programación. Puedes usar estos códigos para integrarlos en tu proyecto según lo necesites.

Hay diferentes planes que se adaptan a todos, incluido un plan gratuito para una pequeña cantidad de solicitudes por día, pero su tasa está limitada para prevenir el abuso del servicio.

Recibe el texto de un archivo de audio en formato JSON.

El punto final devuelve el texto transcrito del archivo de audio proporcionado en formato JSON. El campo principal en la respuesta es "text", que contiene la representación escrita del lenguaje hablado.

El campo clave en los datos de respuesta es "text", que contiene el contenido transcrito del archivo de audio. Este campo proporciona la transcripción completa de la entrada hablada.

Los datos de respuesta están estructurados en formato JSON, que contiene un único par clave-valor. La clave es "text" y el valor es el texto transcrito derivado de la entrada de audio.

El parámetro principal para este punto final es el archivo de audio, que debe estar en formato MP3. Los usuarios deben asegurarse de que el archivo de audio sea claro para una precisión óptima en la transcripción.

La precisión de los datos se mantiene a través de algoritmos avanzados y redes neuronales que han sido entrenadas en conjuntos de datos diversos, lo que permite a la API entender efectivamente varios idiomas, acentos y dialectos.

Los casos de uso típicos incluyen la transcripción en tiempo real para reuniones, la mejora de asistentes de voz, la generación de subtítulos para videos y la provisión de transcripciones para entrevistas o conferencias.

Los usuarios pueden utilizar el texto devuelto para documentación, análisis o integración en aplicaciones. Por ejemplo, las transcripciones se pueden utilizar para crear actas de reuniones o mejorar la accesibilidad en el contenido.

El punto final proporciona transcripciones de lenguaje hablado a partir de archivos de audio, permitiendo a los usuarios convertir comandos de voz, conferencias o conversaciones en texto escrito para diversas aplicaciones.

General FAQs

Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.

Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]


Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.

La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.

Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]

Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.

Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.

Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.

Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.

Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.

Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.

El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.

Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.

Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]

Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.

Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.

Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.

Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.


APIs Relacionadas


También te puede interesar