Google no para, ha pisado el acelerador con su IA generativa: tras matar a Google Bard y presentar su suscripción de pago Gemini Advanced, todo basado en la versión 1.0 de su modelo, la empresa ya tiene listo Gemini 1.5. Más rápido, más potente y con un cambio que puede marcar la verdadera diferencia: Google ha ampliado de manera drástica el contexto que puede manejar su IA.
No es que Google haya hecho poco por la IA, ya que la empresa es pionera en las herramientas de entrenamiento, análisis y ejecución. Pero sí quedó claro que Google falló a la hora de llevar dicha IA al consumidor, Open AI le terminó arrebatando el cetro de los chatbots generativos con el omnipresente ChatGPT. Y claro, Google no podía quedar por detrás, de ahí que apretara el acelerador con Gemini. Tanto, que ya tiene lista una nueva versión del modelo multimodal.
Gemini 1.5: hasta 1 millón de tokens frente a los 128.000 de GPT-4
Las cifras que resumen lo picada que está Google ante el dominio de Open AI y sus modelos GPT son las que ponen de manifiesto el impresionante potencial teórico del nuevo modelo de Gemini, la recién lanzada versión 1.5. Google asegura que ha obtenido altísimos resultados en AI benchmark; con un 87 % de superioridad frente a la anterior versión del modelo, Gemini Pro 1.0.
Gemini 1.5 puede manejar entornos de hasta un millón de tokens de manera consistente. Esto amplía el entendimiento del contexto y la respuesta del modelo muy por encima de las herramientas actuales de IA generativa. Por contextualizar, GPT-4 Turbo admite hasta 128.000 tokens. Y Gemini Pro 1.0, la versión que actualmente utiliza Google en su IA gratuita abierta al público, emplea 32.000 tokens.
Con el nuevo modelo multimodal el usuario obtendrá mejores respuestas a sus órdenes, mayor creatividad en el comportamiento, Gemini 1.5 entiende mejor el contexto y también es más rápido en la ejecución; con un menor número de recursos necesarios para las tareas de generación.
Según ha explicado Google en su blog:
"Gemini 1.5 Pro puede procesar grandes cantidades de información de una sola vez, incluyendo 1 hora de video, 11 horas de audio, bases de código con más de 30.000 líneas de código o más de 700.000 palabras. En nuestra investigación, también hemos probado con éxito hasta 10 millones de tokens".
El nuevo modelo de IA generativa aún no estará disponible para el gran público, pero los desarrolladores y algunos clientes empresariales tendrán pronto acceso a él. Las pruebas se realizarán sobre Gemini Pro 1.5 con una limitación de 128.000 tokens, los mismos que actualmente procesa Gemini Ultra 1.0.
Una vez el periodo de pruebas concluya, Google llevará el modelo de lenguaje multimodal a sus tres divisiones: Nano (en móviles, como el Pixel 8 Pro), Pro (en la versión gratuita del chatbot Gemini) y Ultra (Gemini Advanced). De momento no han dado fechas para la actualización de todas las herramientas que actualmente están disponibles para usuarios particulares y empresariales.
En Xataka Android | La app de Gemini para Android ya está aquí. Así puedes probar la IA más avanzada de Google en tu móvil