Google lanza el chat Gemini Live AI para todos los usuarios de Android

Google ha puesto su función de chatbot de IA controlado por voz, Gemini Live, a disposición de todos los usuarios de Android de forma gratuita. La función, que permite a los usuarios hablar con AI Chatbot de Google mediante comandos de voz, anteriormente estaba completamente disponible para los suscriptores de Gemini Advanced.

La nueva función permite a todos los usuarios de Android utilizar las funciones de diálogo del chatbot, que ahora incluyen hacer preguntas por voz e interrumpir las respuestas en el proceso.

Este anuncio se produce después del primer lanzamiento de la aplicación Gemini Live el mes pasado en el evento Pixel 9 de Google. Los usuarios de Android ahora pueden habilitar fácilmente la función directamente presionando un ícono de forma de onda dentro de la aplicación Gemini que les permite comenzar a usar interacciones de voz con la IA. El lanzamiento se produce en un momento en que la característica competidora de Open AI, el Modo de Voz Avanzado para ChatGPT, aún no se ha implementado por completo.

Los usuarios ahora pueden acceder al modo de voz de Gemini con más control

La característica más notable de Gemini Live incluye la capacidad de que los usuarios hagan preguntas en voz alta, detengan las respuestas en medio de una oración y elijan diferentes voces para las respuestas de la IA. Esta funcionalidad de manos libres añade un grado de flexibilidad y personalización, haciendo que las conversaciones con la IA sean más fluidas y receptivas. Además de gestionar la discusión en tiempo real, los participantes también pueden "retener" las respuestas o "finalizar" la conversación en cualquier momento cuando sea necesario.

Aunque la capacidad de control por voz era inicialmente una característica de un servicio pago, esta funcionalidad de voz ahora está disponible en la versión gratuita de la aplicación Gemini. Los usuarios de Android pueden comenzar a usar la aplicación o la superposición para acceder a ella de inmediato. Actualmente, el modo de voz solo está optimizado para admitir el idioma inglés; sin embargo, Google ha confirmado planes para agregar más idiomas y hacer que esta función también esté disponible en dispositivos iOS, aunque no se proporcionó un cronograma exacto.

Google lanza Gemini Live debido a que la funcionalidad de voz OpenAI se retrasa

El momento de este lanzamiento coloca a Google por delante de OpenAI, que lanzó su modo de voz avanzado para ChatGPT en mayo. Sin embargo, esta funcionalidad ofrecida por Open AI aún no está ampliamente disponible, ya que estuvo disponible de forma limitada desde finales de julio. Otros expertos de la industria también han sugerido que el largo período de espera podría deberse a la alta potencia informática necesaria para respaldar las interacciones de IA basadas en voz, especialmente a escala.

La decisión de Google de lanzar Gemini Live de forma gratuita contrasta con el lanzamiento escalonado de OpenAI de una función similar. Mientras OpenAI continúa desarrollando una estrategia para una adopción más amplia, el lanzamiento de Google pone Gemini Live en manos de usuarios deseosos de interactuar con la IA hablando en lugar de escribir, lo que convierte esto en una ventaja competitiva entre las dos empresas.

Actualmente, se puede acceder a Gemini Live en dispositivos Android y Google planea agregar más funciones a medida que desarrolla el servicio.