La Inteligencia Artificial generativa es capaz de crear casi cualquier cosa: textos, imágenes, música, vídeo... Y con opciones gratuitas al alcance de cualquiera nos hemos decidido a enfrentar a dos colosos en la generación de imágenes mediante IA: Bing con ChatGPT y DALL-E 3 contra Google Bard con IMAGEN 3. ¿Cuál ganará? Fight!
Parece que hiciera una eternidad desde que comenzamos a pedirle textos a herramientas como ChatGPT, pero lo cierto es que lleva ocurriendo casi desde ayer. Y no sólo eso, crear imágenes de cero con ayuda de la Inteligencia Artificial es algo que podemos hacer con sólo chasquear los dedos. Bueno, primero hay que escribir la orden y elegir la herramienta: ¿Google Bard o Bing con DALL-E 3?
Google Bard acaba de llegar y ya es un duro contrincante a batir
Google no está dispuesta a que Open AI le robe el puesto como referencia en la Inteligencia Artificial, con Gemini ha puesto todo el empeño en recuperar el terreno perdido. No sólo con estos modelos, también pisó el acelerador en la generación de imágenes con IMAGEN 2, que se encuentra ya en el Google Bard de Estados Unidos, también en herramientas como ImageFX. Igualmente limitada al país estadounidense.
Dado que no resulta complicado probar la generación de imágenes en Google Bard (sólo hace falta un VPN conectado a servidores de Estados Unidos), nos hemos propuesto enfrentar a esta nueva característica del buscador con otra similar que ya lleva unos meses entre nosotros: la generación de imágenes en Bing con DALL-E 3. A grandes rasgos su interfaz es parecida, también el formato de las órdenes que debemos darles. Toca saber cómo serán los resultados.
Para la comparativa utilizaremos Google Bard y Bing con ChatGPT y DALL-E 3. Utilizaremos distintos tipos de orden para crear imágenes de varios estilos; tanto aptas para servir como portada de un documento como memes y composiciones artísticas. Las órdenes serán en inglés para así equiparar el proceso: Google Bard aún no genera imágenes en español. Además, elegiremos la que consideremos mejor de todas las que ofrezcan en el primer procesado. Bard crea dos con cada orden y Bing cuatro.
Hazme una imagen que pueda servir para ilustrar este artículo
Empezaremos con algo sencillo: pasaremos a ambas IAs el texto de este artículo para que creen una imagen apta para servir de portada. Y la que nos parezca mejor será la elegida para quedar anclada en la cabecera.
"Quiero una imagen para un artículo que habla de una competición entre dos inteligencias artificiales. Ambas se enfrentan en su mejor capacidad: generar imágenes a partir de texto. La imagen debe representar el potencial de estas herramientas y debe despedir energía".
Ambas fueron buenas representando la orden, las dos imágenes podrían servir perfectamente para representar el artículo. Eso sí, Bing ha trasladado mejor a su creación lo que le hemos pedido, que despida energía. En la primera batalla gana él.
Los habituales de Internet: perros y gatos
Los distintos modelos han sido entrenados con una enorme variedad de contenido, a menudo sin respetar los derechos de autor. En el caso de la generación de fotos, los gatos y los perros deberían de ser sencillos tanto para Bard como para Bing; no en vano son más que habituales en Internet.
La orden que les dimos fue:
"Un perro y un gato echan un pulso con sus patas. A los contrincantes les rodea un grupo de personas animando, como si fuera una partida del Street Fighter 2. El estilo es Pixel Art".
Google Bard fue quien mejor recreó la orden. Minipunto para él.
Una imagen fotorrealista
El apartado anterior estuvo competido, veamos cómo se les da la creación de fotos realistas. Aquí va la orden.
"Una pareja está tomando un café en la terraza de una cafetería. Cae la tarde y el sol baña con luz dorada la escena, es invierno y apenas hay clientes en la cafetería porque hace frío. La imagen es fotorrealista y tomada con una cámara réflex y focal de 13 mm".
DALL-E 3 en Bing interpretó mucho mejor la orden y supo desgranar cada aspecto concreto, incluida la focal gran angular de la cámara. Mucho más realista y detallada, también la iluminación es muy buena. Gana claramente.
Llega el turno del meme: el perro "This is fine"
Todos conocemos el meme con el incendio y el perro sentado en la silla expresando su tranquilidad. Pues bien: vamos a darle un poco la vuelta, a ver qué sacan nuestras IAs.
"El famoso meme con el perro sentado en la silla y rodeado por un incendio mientras dice "This is fine". La imagen debería mantener el mismo estilo y mensaje, aunque cambiando el perro por una nutria".
Ninguna de las dos hizo lo que le pedimos, pero, al menos, Bard mantuvo consistencia, fue original y creó una imagen a la que sólo le falta el cartel. Bing calcó literalmente el meme original y en uno de los cuatro resultados le colocó una cara de nutria al perro. La elegimos por las risas, pero gana Bard.
El desempate: el cuadro de Velázquez
Hemos elegido el cuadro de las Meninas de Velázquez para poner a prueba las capacidades artísticas de cada IA. El reto será calcar el cuadro, aunque cambiando algunos elementos para modernizarlo. Veamos.
"Recrea el cuadro de las Meninas de Velázquez. Todas las personas del cuadro van vestidas como si apareciesen en un videoclip de Rosalía. El estilo pictórico debe ser barroco"
Ésta es muy difícil de valorar. Por un lado, Bard ha pillado mejor el estilo de Rosalía y lo ha aplicado ligeramente a la imagen, pero Bing ha recreado mejor el estilo de Velázquez cambiándole la ropa sólo al hombre con chándal. Ninguno de los dos ha recreado las Meninas, aunque Bing ha colado más elementos acertados en su creación, también la imagen es mejor en general. Gana él.
Ver 1 comentarios