Escenas geométricas de ensueño generadas por IA hipnotizan a los usuarios de las redes sociales
El domingo, un usuario de Reddit llamado “Ugleh” publicó una imagen generada por IA de una aldea medieval en forma de espiral que rápidamente ganó atención en las redes sociales por sus notables cualidades geométricas. Las publicaciones de seguimiento obtuvieron aún más elogios, incluido un tweet con más de 145.000 me gusta. Ugleh creó las imágenes utilizando Stable Diffusion y una técnica de guía llamada ControlNet.
Las reacciones a la obra de arte en línea variaron desde el asombro y el asombro hasta el respeto por desarrollar algo novedoso en el arte generativo de IA. “Nunca había visto imágenes como esta. Algo nuevo en el mundo del arte”, escribió un usuario de X. “Para ser honesto, he visto MUCHO arte con IA, he estado en este espacio durante mucho tiempo y esta es una de las piezas más impresionantes que he visto en mi vida. Lo hiciste muy bien”, escribió el artista de IA Kali Yuga en X.
Quizás lo más notable es que el cofundador de Y-Combinator y frecuente comentarista tecnológico de redes sociales, Paul Graham, escribió : «Este fue el punto en el que el arte generado por IA pasó la prueba de Turing para mí».
Por supuesto, no todos quedaron impresionados con algunos usuarios de X que intentaron separar los elementos compositivos de la aldea en espiral generada por IA. «Es bonito, pero hay muchas decisiones que un ser humano no tomaría», escribió un diseñador gráfico llamado Trent. “Muchas de las sombras no son correctas y colocar chimeneas justo encima de las ventanas no tiene sentido. Al acercarnos también se ven los patrones de ruido reveladores del arte de la IA”.
En junio, cubrimos una técnica que utilizaba el modelo de síntesis de imágenes de IA Stable Diffusion y ControlNet para crear códigos QR que parecen obras de arte ricas, incluido el arte inspirado en el anime. Ugleh tomó la misma red neuronal optimizada para crear esos códigos QR (que en sí mismos son formas geométricas) y en su lugar le introdujo imágenes simples de espirales y patrones de tablero de ajedrez.
Cuando se guió por el mensaje, “Escena de pueblo medieval con calles concurridas y un castillo en la distancia (obra maestra: 1.4), (mejor calidad), (detallado) ”, ControlNet representó escenas donde los elementos artísticos de las imágenes coinciden con las formas perceptivas de espirales y tableros de ajedrez. En una imagen, las nubes se arquean en lo alto y la gente se para en una suave curva para igualar la guía en espiral. En otro, cuadrados de nubes, setos, fachadas de edificios y una carreta conforman una escena en forma de tablero de ajedrez.
La magia de ControlNet
¿Entonces, cómo funciona? Hemos cubierto la difusión estable con frecuencia antes . Es un modelo de red neuronal entrenado con millones de imágenes extraídas de Internet. Pero la clave aquí es ControlNet, que apareció por primera vez en un artículo de investigación titulado “ Agregar control condicional a los modelos de difusión de texto a imagen ” de Lvmin Zhang, Anyi Rao y Maneesh Agrawala en febrero de 2023, y rápidamente se hizo popular en Stable Diffusion. comunidad.
Normalmente, una imagen de Difusión estable se crea utilizando un mensaje de texto (llamado text2image) o un mensaje de imagen (img2img). ControlNet presenta orientación adicional que puede tomar la forma de información extraída de una imagen de origen, incluida la detección de pose, mapeo de profundidad, mapeo normal, detección de bordes y mucho más. Usando ControlNet, alguien que genere obras de arte con IA puede replicar mucho más fielmente la forma o pose de un sujeto en una imagen.
Usando ControlNet y sugerencias similares, es fácil replicar el trabajo de Ugleh, y otros lo han hecho con efectos divertidos, incluidos personajes de anime de tablero de ajedrez , una animación , «goatse » de aldea medieval (sorprendentemente segura para trabajar) y una versión de aldea medieval de » Girl «. con un pendiente de perla ”.
A pesar de la atención masiva y las muchas ofertas para convertir la obra de arte en NFT, Ugleh ha optado por mantener un perfil bajo por ahora. En X, dijo : “Aprecio todos los comentarios positivos hacia el arte de la IA, no planeo ganar dinero con mis últimas generaciones y no haré ninguna entrevista oficial. Solo soy un nerd normal de la IA experto en tecnología que experimentó con una nueva técnica ControlNet”.
Si desea experimentar con ControlNet, este sitio tiene un buen tutorial. Además, Ugleh publicó un flujo de trabajo paso a paso , incluidos los archivos de plantilla de espiral y tablero de ajedrez, en Imgur.
Si bien la obra de arte es notable, la política de derechos de autor actual de EE. UU. dice que las imágenes no cumplen con los estándares para recibir protección de derechos de autor, por lo que técnicamente son de dominio público. Si bien las obras de arte generadas por IA siguen siendo un tema polémico para muchos por motivos éticos y legales, los entusiastas continúan superando los límites de lo que es posible para un profesional no calificado o capacitado que utilice estas nuevas herramientas.
Deja una respuesta