Sobre la API:
Nuestra API de texto a voz es una herramienta poderosa que te permite convertir texto escrito en palabras habladas. La API soporta múltiples idiomas y puede integrarse con cualquier aplicación para síntesis de voz, asistentes de voz y accesibilidad.
La API utiliza algoritmos avanzados de procesamiento de lenguaje natural para analizar el texto de entrada y generar una salida de voz correspondiente con un sonido natural. La salida puede ser personalizada con diferentes voces, idiomas y velocidad de habla. Esto la convierte en una herramienta ideal para una variedad de casos de uso, como la síntesis de voz, asistentes de voz y accesibilidad.
La API puede integrarse en cualquier aplicación para proporcionar retroalimentación hablada, como leer texto en voz alta, para usuarios con discapacidades visuales, o generar una versión de audio de contenido escrito, como libros, artículos y más. También puede ser utilizada para crear asistentes de voz y chatbots, que pueden interactuar con los usuarios a través del habla.
Además, la API puede ser utilizada en otras aplicaciones como sistemas de telefonía, dispositivos de navegación y otros sistemas donde se necesita síntesis de voz. También puede ser utilizada para generar clips de audio de cualquier texto, útil para podcasts, presentaciones en video y más.
En general, nuestra API de texto a voz es una herramienta valiosa para empresas e individuos que buscan añadir capacidades de síntesis de voz a sus aplicaciones. Es fácil de usar y soporta múltiples idiomas, lo que la hace accesible para una amplia gama de casos de uso y audiencias.
Pasa el texto que deseas convertir y selecciona el idioma. Recibe el audio listo para usar.
Accesibilidad: Utiliza la API para proporcionar retroalimentación hablada para usuarios con discapacidades visuales, como leer texto en voz alta en sitios web o en aplicaciones móviles.
Asistentes de voz: Utiliza la API para crear asistentes de voz y chatbots que pueden interactuar con los usuarios a través del habla.
Síntesis de voz: Utiliza la API para generar salida hablada a partir del texto escrito para su uso en sistemas de telefonía, dispositivos de navegación y otras aplicaciones.
Contenido educativo: Utiliza la API para convertir contenido educativo escrito, como libros electrónicos o guías de estudio, en audio hablado, facilitando su accesibilidad para los estudiantes.
Podcasting: Utiliza la API para generar clips de audio de contenido escrito, como publicaciones de blog o artículos, para su uso en episodios de podcast.
Presentaciones en video: Utiliza la API para generar audio hablado de contenido escrito, como guiones o narraciones, para su uso en presentaciones de video o animaciones.
Además de las limitaciones de llamadas a la API por mes, no hay otras limitaciones.
Lista de idiomas soportados:
Convierte tus textos a audio con este Servicio de Texto a Voz (TTS) instantáneo utilizando voces realistas.
Recibirás la URL de dónde se encuentra tu archivo MP3. Luego podrás descargarlo si es necesario.
Voz de género. Opciones: masculino, femenino o neutral.
Lista de idiomas soportados:
Por favor, añade "text_premium_" (si es contenido de texto) o "ssml_premium_" (si es código SSML) antes del código de idioma si deseas utilizar la voz premium (por ejemplo, para en_US sería text_premium_en_US)
Convertir - Características del Endpoint
| Objeto | Descripción |
|---|---|
text |
[Requerido] Your text content. 10000 characters limit for any plan. |
gender_voice |
[Requerido] Gender voice. Options: male, female or neutral. |
language |
[Requerido] Language. Options: en_US, en_GB, en_IN, en_AU, pt_BR,pt_PT, fr_FR, fr_CA, de_DE, es_ES, sv_SE, ru_RU or tr_TR. Please add "text_premium_" (if text content) or "ssml_premium_" (if SSML code) before the language code if you want to use the premium voice (for e.g. for en_US will be text_premium_en_US) |
speakingRate |
Opcional Declare the speed of the voice. The ranges are between 0.25 (slow) and 1 (normal). |
{"message":"Your audio has been created!","audio_src":"https:\/\/getwoordfiles.s3.amazonaws.com\/9466387111736361142677ec4b65cc398.51505313.mp3","error":false,"total_chars":14,"remaining_chars":998814}
curl --location --request POST 'https://zylalabs.com/api/23/text+to+speech+api/84/convert?text=Check our amazing text to speech tool&gender_voice=female&language=en_US' --header 'Authorization: Bearer YOUR_API_KEY'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
La API de texto a voz utiliza algoritmos avanzados de procesamiento de lenguaje natural para analizar el texto de entrada y generar una salida de voz correspondiente. Convierte el texto escrito en palabras habladas utilizando una voz que suena natural. Puedes personalizar la salida seleccionando diferentes voces, idiomas y ajustando la velocidad del habla.
La API se puede utilizar para diversos fines, incluyendo la síntesis de voz, asistentes de voz, funciones de accesibilidad, sistemas de telefonía, dispositivos de navegación y más. Puedes integrarla en tus aplicaciones para proporcionar retroalimentación hablada o generar versiones de audio de contenido escrito. También se puede utilizar para crear asistentes de voz, chatbots, podcasts y presentaciones en video.
Sí, la API admite múltiples idiomas. Puedes pasar texto en diferentes idiomas a la API y seleccionar el idioma deseado para la salida de voz. Esto te permite proporcionar capacidades de síntesis de voz en varios contextos lingüísticos.
Para usar la API, necesitas pasar el texto que deseas convertir en palabras habladas como entrada. Además, puedes seleccionar el idioma deseado para la salida de voz. La API te proporcionará una URL de audio como salida, que podrás usar para acceder y reproducir el audio generado.
Sí, puedes personalizar la voz y la velocidad del habla con la API. Ofrece diferentes voces para elegir, lo que te permite seleccionar la que mejor se adapte a tu aplicación o audiencia. Además, puedes ajustar la velocidad del habla para controlar la velocidad a la que se habla el texto, proporcionando flexibilidad en la salida de audio.
El endpoint Convert devuelve una respuesta JSON que contiene un mensaje, una URL de origen de audio, una bandera de error, el número total de caracteres procesados y los caracteres restantes disponibles para la conversión. Estos datos estructurados permiten a los usuarios acceder y utilizar fácilmente el audio generado.
Los campos clave en los datos de respuesta incluyen "mensaje" (confirmación de la creación de audio), "audio_src" (URL del archivo de audio generado), "error" (indica éxito o fracaso), "total_chars" (número de caracteres procesados) y "remaining_chars" (caracteres restantes para la conversión).
El endpoint Convert acepta parámetros como "texto" (el texto de entrada a convertir), "idioma" (el código de idioma deseado) y "voz" (para especificar voz masculina, femenina o neutral). Los usuarios pueden personalizar sus solicitudes seleccionando estos parámetros para adaptar la salida.
Los datos de respuesta del endpoint Convert están organizados en un formato JSON. Incluye un objeto de nivel superior que contiene campos como "message," "audio_src," "error," "total_chars," y "remaining_chars," lo que facilita su análisis y utilización en aplicaciones.
Los casos de uso típicos para el endpoint Convert incluyen generar audio para características de accesibilidad, crear locuciones para contenido educativo, producir clips de audio para podcasts y desarrollar asistentes de voz interactivos o chatbots que requieren síntesis de voz.
Los usuarios pueden utilizar la URL de audio devuelta al incorporarla en sus aplicaciones, lo que permite la reproducción del audio generado. Esto se puede hacer utilizando etiquetas de audio en HTML o integrándolo en aplicaciones móviles, asegurando que los usuarios puedan acceder fácilmente y escuchar el contenido hablado.
Los valores de parámetro aceptados para el idioma en el punto final Convert incluyen códigos de idioma como "en_US" para inglés americano, "fr_FR" para francés y "de_DE" para alemán, entre otros. Los usuarios pueden especificar estos códigos para generar audio en el idioma deseado.
La precisión de los datos en la API de Texto a Voz se mantiene a través de avanzados algoritmos de procesamiento de lenguaje natural que analizan el texto de entrada de manera contextual. Actualizaciones y mejoras continuas en los modelos subyacentes aseguran que la salida de voz generada permanezca natural e inteligible en los idiomas admitidos.
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
888ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.594ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.645ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
646ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
9.808ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
319ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
780ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.978ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
166ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
19ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
446ms