La demostración de Project Astra nos adelanta el futuro de los asistentes virtuales
Gemini es capaz de ver y escuchar para responder preguntas en directo
Desde Xataka Android estamos cubriendo el mayor evento de Google: el Google I/O 2024 está desvelando las cartas del gigante de Mountain View con novedades en todos los frentes. Ya sabíamos que Gemini pasaba de ser un chatbot al estilo de ChatGPT, a cumplir con la tarea de sustituir al Asistente de Google, pero lo presentado por la firma americana ahora ha superado las expectativas.
La renovación del asistente virtual de Android no empezó con buen pie, faltándole características que ha ido adquiriendo estos últimos meses, y ahora sube de nivel con la IA más avanzada de Google. Te contamos todo lo visto durante la keynote, que no es poco, y es que nos hemos encandilado con los encantos del nuevo "Asistente de Google".
El nuevo Asistente de Google, Gemini, da un paso de gigante
Project Astra se ha mostrado al mundo en una demostración que nos ha dejado boquiabiertos. Durante la conferencia, hemos visto cómo Gemini, la IA de Google, consigue responder en tiempo real a distintas cuestiones, todo esto trabajando como una herramienta multimodal.
Usando nuestro móvil, podremos interactuar como si de una persona se tratase: tiene ojos, pues ve a través de la cámara, y oídos, gracias a los micrófonos. No necesita nada más que el ingrediente "mágico" de los modelos de lenguaje de la firma de Mountain View para convertirse en un copiloto de vida.
La presentación exhibida, se enfoca en el ámbito profesional y de la productividad. Dando un paseo por la oficina, todas las dudas quedan despejadas, ya sean preguntas sobre objetos del lugar, de programación (analiza el código que tengamos en pantalla) o de ubicación (con solo ver las calles de una ciudad, nos dirá dónde nos encontramos), no hay límites para Gemini.
De hecho, una de las cosas que más han alucinado a un servidor, es la pregunta de "¿Dónde están mis gafas?". La IA de Google recuerda todo lo que ve, y consigue acordarse incluso la ubicación de objetos, dando detalles en su descripción. Esto da paso al siguiente aspecto de Project Astra: la continuidad.
Gemini con Project Astra también en realidad aumentada
La demostración continúa desde el visor de realidad aumentada, las gafas que estaban perdidas. Gemini también está dentro de ellas para que ahora, literalmente, sus ojos sean los nuestros. Vuelve a deslumbrar su análisis de imagen, con una pregunta que en realidad es un acertijo: sin problemas para Gemini.
Y al final viene la anécdota, cuando encuentra un nombre para un dúo formado por un bonito canino y un peluche. Gemini se las sabe todas: gracias a la gran capacidad de reconocimiento visual y la comprensión del lenguaje humano, parece que tuviese raciocinio.
Podemos decir, por tanto, que Project Astra es el caldero en el que Google ha vertido todos los ingredientes puestos a madurar en los últimos meses. Sus modelos de lenguaje lucen genial sumado a esta iniciativa que llegará a finales de año, en una fecha sin determinar y parcialmente.
Cómo no quedar cautivado por un asistente así
"El futuro de los asistentes con inteligencia artificial", así lo ha bautizado Google, y lo cierto es que no parece muy desacertado. La visión de la firma americana pasa por brindarnos un asistente disponible para cualquier aspecto de nuestras vidas, lo soñado por muchos entusiastas del mundillo.
Obviamente tiene un largo camino que recorrer, empezando por estar disponible para todo el mundo, pero el margen de mejora es brutal. Es, a la vez, fácil y difícil imaginar hasta dónde podrá llegar, pero Google deja algunas claves en su discurso: "tiene que ser proactivo, didáctico y personal", denotando la importancia de estar siempre atento y contextualizado al usuario.
Otro de los aspectos a remarcar es la velocidad de respuesta (recordemos que ayer OpenAI presumió de velocidad con GPT-4o), confesando la propia Google la dificultad que supone: "reducir el tiempo de respuesta a algo conversacional es un difícil reto de ingeniería".
A la hora de intentar minimizarlo, han optado por procesar la información mediante la "codificación continua de fotogramas de vídeo, la combinación de vídeo y voz en una línea temporal de eventos y el almacenamiento en caché de esta información para una recuperación eficiente".
La voz del asistente también importa, con aspectos como su entonación. En Google aseguran haber dotado al asistente de una gama más aplia de entonaciones que dependerán del contexto. Sumando todos estos pequeños detalles que engrandecen el conjunto... ¿Nadie se acuerda de 'Her'?
Una IA compañera, consejera, y confidente
No queremos acabar en el futuro manteniendo una relación emocional con nuestro asistente, claro está, pero qué difícil será asimilar que no tenemos delante a una persona. Gemini no está lejos de ser la IA de la película, ya ofrece (a su manera) apoyo, ayuda, e incluso conversaciones creativas.
La cinta explora las posibles consecuencias de una IA que se vuelve demasiado humana. En este sentido, el avance de Gemini, entre otros sistemas de IA conversacional, invita a pensar sobre cuánto falta para que llegue se momento. Si la IA puede echarnos un cable en cualquier instante y recordar (en un futuro) muchos momentos vividos, se abre la puerta a que pueda desempeñar un papel importante en el desarrollo personal.
Por suerte -o desgracia- aun queda mucho, así que nos conformamos con las capacidades actuales de este nuevo Gemini, que representa un paso adelante en la IA conversacional. Tiene un futuro con posibilidades infinitas y estamos deseando probarlo.
En Xataka Android | Los 108 mejores packs de stickers para WhatsApp de 2024, cómo descargarlos y de qué manera puedes hacer los tuyos
En Xataka Android | Cómo desbloquear y recuperar tu Android si has olvidado el patrón o la contraseña
Ver todos los comentarios en https://www.xatakandroid.com
VER 2 Comentarios