Tras su presentación inicial junto al lanzamiento del Pixel 10, Google ha introducido soporte nativo de salida de audio en Android y iOS para Gemini Live. Esta actualización incorpora las mejoras del último modelo, conocido como Gemini 2.5 Flash Live API, que optimiza notablemente la capacidad del sistema para entender y aprovechar matices más sutiles del habla humana. Estas mejoras permiten que las conversaciones sean más adaptativas y expresivas, elevando la calidad de la interacción en la plataforma Gemini Live.
Personalización y control en Gemini Live
Una característica destacada es la capacidad de los usuarios para ajustar la velocidad de respuesta de Gemini Live. Se pueden solicitar respuestas más rápidas o lentas mediante comandos como “vale, acelera”, lo que facilita distintos usos, por ejemplo, obtener resúmenes rápidos sobre temas específicos. Esta función mejora la accesibilidad, permitiendo que cada usuario adapte el ritmo del habla a sus necesidades de claridad y comodidad, haciendo que la experiencia sea más fluida y cómoda.
Además, el sistema incluye soporte para ejercicios personalizados de aprendizaje de idiomas. Puede, por ejemplo, realizar cuestionarios sobre números en coreano o ayudar a practicar saludos informales en español, consolidando así su utilidad como herramienta educativa. Respecto a la personalización, Gemini Live también permite adoptar diferentes acentos durante la interacción. Esto añade un valor lúdico y creativo: desde un acento vaquero para planificar eventos temáticos hasta un acento cockney británico narrando una receta.
Gemini Live y la narrativa histórica inmersiva
La implementación de historias con personajes se extiende a la narración histórica. Gemini puede presentar datos sobre el Imperio Romano desde la perspectiva de Julio César, usando acentos característicos del personaje. Esta forma de entrega enriquece el contenido, haciendo que el aprendizaje y el entretenimiento resulten más inmersivos y atractivos para el usuario. Gracias a estas opciones, la experiencia con Gemini Live gana en dinamismo y personalización, adaptándose a diferentes gustos y contextos.
Las personalizaciones realizadas durante una conversación permanecen activas durante toda su duración, pero se restablecen al iniciar un nuevo diálogo. Si se desea, es posible reactivar estas configuraciones accediendo a la transcripción del chat y seleccionando el botón Live. La implementación de estas mejoras se ha ido desplegando progresivamente en las últimas semanas, y la salida nativa de audio ya está disponible en las principales plataformas móviles, reforzando las capacidades de interacción vocal de Gemini Live.