El sistema, al cual puede accederse a través de su herramienta de Test Kitchen, permite crear imágenes en su mayoría fotorrealistas con textos que puedes colocar incluso en español.
Después de su presentación en el pasado Google I/O de mayo, Google ha lanzado una versión de prueba para todo público de Imagen 3, un generador de fotografías por Inteligencia Artificial que busca competir contra Midjourney, Dall-E y el recientemente presentado Grok-2 de X.
Imagen 3 funciona de manera similar a otros generadores de imágenes: a través de un texto que puede ser en inglés, pero también en español, la IA interpretará lo que estás pidiendo y te entregará una serie de imágenes basadas en lo que la máquina se imaginó.
Google ha enfatizado su compromiso con el uso responsable de la IA, por lo que ha implementado un sistema de filtrado y etiquetado de datos para que las imágenes creadas no sean dañinas ni se utilicen para difamar o crear noticias falsas. Cada imagen generada por el modelo está marcada con la marca de agua digital SynthID de Google, que ayuda a rastrear los orígenes de la imagen, mejorando la transparencia y la confianza en las salidas del modelo.
El modelo de Google tiene especial cuidado en generar imágenes donde aparezcan niños y figuras prominentes. Sin embargo, en algunos casos, ha demostrado flexibilidad, como cuando generó una imagen de Godzilla basada en uno de sus últimos modelos.
Algunos usuarios de Reddit han criticado el modelo por sus directrices restrictivas de contenido. A pesar de esto, Google sostiene que estas restricciones son vitales para garantizar el uso ético del modelo. Imagen 3 está pensado por defecto para la generación de imágenes fotorrealistas, aunque también puede crear caricaturas si se indica en la descripción, aunque los resultados en este ámbito no son tan buenos.
Acá comparto algunos de los resultados creados por Imagen 3 y las frases que escogí para generarlos:
“Un samurai portando una bandera de Chile en un campo de amapolas”
“Un campesino chileno caminando por las calles de Tokyo” (Primero intenté con la palabra huaso chileno, pero no la reconoció, así que opté por una descripción más neutral)
“Un completo italiano, una sopaipilla y una empanada caminando de la mano por un parque” En este caso no se logró nada, pero solo quiero compartirla por la horrible imagen que generó con ese perro dando la mano al dueño.
“Un corgi jugando juegos de mesa”
Para aquellos interesados en probar Imagen 3 de Google y comprender sus límites en cuanto al contenido ofensivo o inapropiado, el modelo ya está accesible a través de ImageFX y se espera que, cuando esté listo, se incluya dentro de las capacidades de otros servicios como Gemini.