Gemma 3 API

Gemma 3 27B API - Accede al poderoso modelo de lenguaje de 27 mil millones de parámetros de Google para completar chats
Usa esta API desde tu agente de IA vía MCP
Funciona con OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline y cualquier cliente de IA compatible con MCP.
Docs y configuración
Crea un skill envolviendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

API de Google Gemma 3 27B

Accede al poderoso modelo de lenguaje de Google de 27 mil millones de parámetros a través de una simple API REST.


Características

  • Completaciones de Chat - Conversaciones de múltiples turnos con historial de mensajes
  • Parámetros Personalizables - Controla la temperatura, la longitud de la respuesta y el comportamiento del sistema
  • Integración Simple - Fácil de usar con cualquier lenguaje de programación

 

Casos de Uso

  • Chatbots de IA - Crea asistentes conversacionales con memoria de contexto
  • Creación de Contenido - Genera publicaciones de blog, artículos y textos de marketing
  • Asistencia de Código - Obtén ayuda con la programación, depuración y explicaciones de código
  • Soporte al Cliente - Automatiza respuestas y maneja consultas comunes
  • Educación - Crea sistemas de tutoría y explica temas complejos
  • Traducción - Traduce texto entre idiomas
  • Resumen - Condensa documentos largos en puntos clave
  • Escritura Creativa - Genera historias, poemas y guiones

Documentación de la API

Endpoints


Completaciones de chat de múltiples turnos para conversaciones y aplicaciones de IA interactivas

 

Conversación Simple

{
    "messages": [
        {
            "role": "user",
            "content": "¿Cuál es la capital de Francia?"
        }
    ],
    "temperature": 0.7,
    "max_tokens": 100
}

Conversación de Múltiples Turnos

{
    "messages": [
        {
            "role": "system",
            "content": "Eres un asistente de viajes útil."
        },
        {
            "role": "user",
            "content": "¿Cuál es la mejor época para visitar Japón?"
        },
        {
            "role": "assistant",
            "content": "La primavera (marzo a mayo) y el otoño (septiembre a noviembre) son las mejores épocas para visitar Japón por el clima templado y las hermosas flores de cerezo o los colores otoñales."
        },
        {
            "role": "user",
            "content": "¿Qué tal la comida allí?"
        }
    ],
    "temperature": 0.8,
    "max_tokens": 150
}

Ayuda de Programación

{
    "messages": [
        {
            "role": "system",
            "content": "Eres un programador experto en JavaScript."
        },
        {
            "role": "user",
            "content": "¿Cómo invierto una cadena en JavaScript?"
        }
    ],
    "temperature": 0.5,
    "max_tokens": 200
}


                                                                            
POST https://zylalabs.com/api/12286/gemma+3+api/23070/chat+completions
                                                                            
                                                                        

Completaciones de Chat - Características del Endpoint

Objeto Descripción
Cuerpo de la Solicitud [Requerido] Json
Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"id":"chatcmpl-1774906044901","object":"chat.completion","created":1774906044,"model":"gemma-3-27b-it","choices":[{"index":0,"message":{"role":"assistant","content":"The capital of France is **Paris**. \n\nIt's known for iconic landmarks like the Eiffel Tower, the Louvre Museum, and the Arc de Triomphe, as well as its fashion, cuisine, and culture.\n\n\n\n"},"finish_reason":"stop"}],"usage":{"prompt_tokens":15,"completion_tokens":47,"total_tokens":62}}
                                                                                                                                                                                                                    
                                                                                                    

Completaciones de Chat - CÓDIGOS DE EJEMPLO


curl --location --request POST 'https://zylalabs.com/api/12286/gemma+3+api/23070/chat+completions' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
  "messages": [
    {
      "role": "user",
      "content": "What is the capital of France?"
    }
  ],
  "temperature": 0.7,
  "max_tokens": 100
}'

    

Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el Gemma 3 API simplemente incluye tu token de portador en el encabezado de Autorización.
Encabezados
Encabezado Descripción
Autorización [Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en
$ 10.000/Año


  • Volumen Personalizado
  • Límite de solicitudes personalizado
  • Soporte al Cliente Especializado
  • Monitoreo de API en Tiempo Real

Funciones favoritas de los clientes

  • ✔︎ Paga Solo por Solicitudes Exitosas
  • ✔︎ Prueba 7 días gratis
  • ✔︎ Soporte Multilenguaje
  • ✔︎ Una Clave API, Todas las APIs.
  • ✔︎ Panel de Control Intuitivo
  • ✔︎ Manejo de Errores Integral
  • ✔︎ Documentación Amigable para Desarrolladores
  • ✔︎ Integración con Postman
  • ✔︎ Conexiones HTTPS Seguras
  • ✔︎ Tiempo de Actividad Fiable

Gemma 3 API FAQs

El endpoint de Completaciones de Chat devuelve un objeto JSON que contiene la respuesta del asistente a las consultas del usuario Esto incluye el mensaje del asistente el rol del mensaje (usuario o asistente) y metadatos como el ID de la finalización y el uso de tokens

Los campos clave en la respuesta incluyen "id" (identificador único) "object" (tipo de respuesta) "created" (marca de tiempo) "model" (modelo utilizado) "choices" (arreglo de respuestas) y "usage" (conteos de tokens para el prompt, la finalización y total)

Los datos de respuesta están estructurados como un objeto JSON Contiene un array de "elecciones" donde cada elección incluye el mensaje del asistente y su rol El campo "uso" proporciona detalles sobre el consumo de tokens ayudando a los usuarios a entender la complejidad de su solicitud

Los usuarios pueden personalizar las solicitudes con parámetros como "temperatura" (controla la aleatoriedad), "max_tokens" (limita la longitud de la respuesta) y "top_p" (muestra de núcleo). Estos parámetros permiten respuestas personalizadas según las necesidades del usuario

El endpoint proporciona información sobre una amplia gama de temas incluyendo conocimiento general asistencia en codificación escritura creativa y más. Soporta conversaciones de múltiples turnos permitiendo interacciones conscientes del contexto

Los usuarios pueden extraer el mensaje del asistente del array "choices" para mostrar respuestas en aplicaciones El campo "usage" ayuda a monitorear el consumo de tokens lo que es útil para optimizar solicitudes y gestionar el flujo de datos

Los casos de uso típicos incluyen la construcción de chatbots de IA para soporte al cliente, generación de contenido para blogs, provisión de asistencia en programación y creación de herramientas educativas La versatilidad de la API soporta diversas aplicaciones en distintas industrias

La precisión de los datos se mantiene a través del entrenamiento continuo del modelo de lenguaje subyacente en conjuntos de datos diversos Actualizaciones regulares y controles de calidad aseguran que el modelo proporcione información relevante y precisa sobre varios temas

El endpoint de Completaciones de Chat puede generar una amplia gama de información que incluye respuestas a preguntas fácticas piezas de escritura creativa ayuda con programación y contenido educativo. Soporta conversaciones de múltiples turnos lo que permite interacciones conscientes del contexto que mejoran el compromiso del usuario

Los usuarios pueden personalizar las solicitudes ajustando parámetros como "temperatura" para la aleatoriedad de las respuestas "max_tokens" para limitar la longitud de la respuesta y "top_p" para el muestreo por núcleo Estas configuraciones permiten a los usuarios adaptar la salida a sus necesidades y preferencias específicas

Los datos devueltos están estructurados como un objeto JSON Incluye un array de "opciones" cada una conteniendo el mensaje del asistente y su rol Además el campo "uso" proporciona conteos de tokens ayudando a los usuarios a entender la complejidad de sus solicitudes

Los usuarios deben verificar el array "choices" en la respuesta Si está vacío puede indicar que el modelo no pudo generar una respuesta Implementar manejo de errores en la aplicación puede ayudar a gestionar tales escenarios sugiriendo a los usuarios que reformulen sus consultas si es necesario

Los campos clave incluyen "id," que identifica de manera única la respuesta; "object," que indica el tipo de respuesta; "created," que muestra la marca de tiempo; y "choices," que contiene los mensajes generados por el asistente. Entender estos campos ayuda a los usuarios a utilizar eficazmente los datos

La precisión de los datos se mantiene a través de la formación continua del modelo de lenguaje en conjuntos de datos diversos Actualizaciones y evaluaciones regulares garantizan que el modelo proporcione información relevante y precisa mejorando la fiabilidad de las respuestas generadas

Los usuarios pueden esperar que las respuestas sigan un formato conversacional con el asistente proporcionando respuestas coherentes y contextualmente relevantes La estructura típicamente incluye una respuesta o explicación clara a menudo formateada para facilitar la lectura especialmente en contextos creativos o educativos

Los datos cubren un amplio espectro de temas que incluyen tecnología cultura ciencia y más Esta versatilidad permite a los usuarios explorar varias categorías lo que lo hace adecuado para aplicaciones en educación creación de contenido soporte al cliente y más

Los valores de parámetros aceptados incluyen "temperature" (típicamente entre 0 y 1), "max_tokens" (un entero positivo que define la longitud de la respuesta) y "top_p" (un número decimal entre 0 y 1 para muestreo de núcleo) Estos valores ayudan a controlar la creatividad y la longitud de las respuestas generadas

Los datos de respuesta están estructurados como un objeto JSON que contiene un array de "opciones" Cada opción incluye el mensaje del asistente y su rol (usuario o asistente) El campo "uso" proporciona conteos de tokens ayudando a los usuarios a entender la complejidad y eficiencia de su solicitud

Los casos de uso típicos incluyen el desarrollo de chatbots de IA para atención al cliente, la generación de contenido de marketing, la provisión de asistencia en programación y la creación de herramientas educativas. Su versatilidad permite aplicaciones en diversas industrias, mejorando la participación del usuario y la productividad

Los datos se derivan de una amplia variedad de fuentes incluyendo libros artículos y sitios web en los que se ha entrenado el modelo de lenguaje subyacente Este entrenamiento diverso ayuda a garantizar que el modelo pueda proporcionar información relevante y precisa sobre diversos temas

General FAQs

Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.

Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]


Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.

La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.

Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]

Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.

Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.

Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.

Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.

Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.

Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.

El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.

Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.

Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]

Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.

Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.

Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.

Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.


APIs Relacionadas