Scene geometriche da sogno generate dall’intelligenza artificiale incantano gli utenti dei social media

Scene geometriche da sogno generate dall’intelligenza artificiale incantano gli utenti dei social media

Domenica, un utente Reddit di nome “Ugleh” ha pubblicato un’immagine generata dall’intelligenza artificiale di un villaggio medievale a forma di spirale che ha rapidamente attirato l’attenzione sui social media per le sue notevoli qualità geometriche. I post successivi hanno raccolto ancora più elogi, incluso un tweet con oltre 145.000 Mi piace. Ugleh ha creato le immagini utilizzando Stable Diffusion e una tecnica di guida chiamata ControlNet.

Le reazioni all’opera d’arte online spaziavano dalla meraviglia e dallo stupore al rispetto per lo sviluppo di qualcosa di nuovo nell’arte generativa dell’intelligenza artificiale. “Mai viste foto come questa. Qualcosa di nuovo nel mondo dell’arte”, ha scritto un utente X. “A dire il vero, ho visto MOLTA arte artistica, sono stato in questo spazio per molto tempo, e questo è uno dei pezzi più fantastici che abbia mai visto. Sei stato così bravo”, ha scritto l’artista AI Kali Yuga su X.

Forse in particolare, il co-fondatore di Y-Combinator e frequente commentatore tecnologico dei social media Paul Graham ha scritto : “Questo è stato il punto in cui l’arte generata dall’intelligenza artificiale ha superato il test di Turing per me”.

Nessuno
Nessuno
Nessuno
Nessuno
Nessuno

Non tutti sono rimasti colpiti, ovviamente, dal fatto che alcuni utenti di X abbiano tentato di separare gli elementi compositivi del villaggio a spirale generato dall’intelligenza artificiale. “È carino, ma ci sono molte decisioni che un essere umano non prenderebbe”, ha scritto un grafico di nome Trent. “Molte ombre non sono corrette e mettere i camini proprio sopra le finestre non ha senso. Zoomando ci sono anche i modelli di rumore rivelatori dell’arte dell’intelligenza artificiale.

A giugno abbiamo trattato una tecnica che utilizzava il modello di sintesi delle immagini AI Stable Diffusion e ControlNet per creare codici QR che assomigliavano a ricche opere d’arte, comprese quelle ispirate agli anime. Ugleh ha preso la stessa rete neurale ottimizzata per creare quei codici QR (che a loro volta sono forme geometriche) e vi ha invece inserito semplici immagini di spirali e motivi a scacchiera.

Quando guidato dal prompt “Scena di villaggio medievale con strade trafficate e castello in lontananza (capolavoro: 1.4), (migliore qualità), (dettagliato) “, ControlNet ha eseguito il rendering di scene in cui gli elementi artistici delle immagini corrispondono alle forme percettive di spirali e scacchiere. In un’immagine, le nuvole si inarcano sopra la testa e le persone stanno in una curva delicata per adattarsi alla guida a spirale. In un altro, quadrati di nuvole, siepi, facciate di edifici e un carro compongono una scena a forma di scacchiera.

La magia di ControlNet

Quindi, come funziona? Abbiamo già parlato spesso di Stable Diffusion . È un modello di rete neurale addestrato su milioni di immagini recuperate da Internet. Ma la chiave qui è ControlNet, apparso per la prima volta in un documento di ricerca intitolato “ Adding Conditional Control to Text-to-Image Diffusion Models ” di Lvmin Zhang, Anyi Rao e Maneesh Agrawala nel febbraio 2023, ed è diventato rapidamente popolare nella Stable Diffusion Comunità.

In genere, un’immagine a diffusione stabile viene creata utilizzando un prompt di testo (chiamato text2image) o un prompt di immagine (img2img). ControlNet introduce ulteriori indicazioni che possono assumere la forma di informazioni estratte da un’immagine sorgente, tra cui rilevamento della posa, mappatura della profondità, mappatura normale, rilevamento dei bordi e molto altro. Utilizzando ControlNet, chi genera opere d’arte con intelligenza artificiale può replicare molto più fedelmente la forma o la posa di un soggetto in un’immagine.

Nessuno
Nessuno
Nessuno

Usando ControlNet e suggerimenti simili, è facile replicare il lavoro di Ugleh, e altri lo hanno fatto con effetti divertenti, inclusi personaggi anime a scacchiera , un’animazione , una “capra ” del villaggio medievale (sorprendentemente sicura per il lavoro) e una versione del villaggio medievale di ” Ragazza “. con un orecchino di perla .

Nonostante la massiccia attenzione e le numerose offerte per trasformare le opere d’arte in NFT, Ugleh ha scelto di mantenere un profilo basso per ora. Su X, ha detto : “Apprezzo tutti i feedback positivi verso l’arte basata sull’intelligenza artificiale, non ho intenzione di guadagnare soldi dalle mie ultime generazioni e non farò alcuna intervista ufficiale. Sono solo un normale nerd dell’intelligenza artificiale esperto di tecnologia che ha sperimentato una nuova tecnica ControlNet”.

Se vuoi sperimentare ControlNet, questo sito ha un buon tutorial. Inoltre, Ugleh ha pubblicato su Imgur un flusso di lavoro passo passo , inclusi i file modello a spirale e a scacchiera.

Sebbene l’opera d’arte sia notevole, l’attuale politica sul copyright degli Stati Uniti afferma che le immagini non soddisfano gli standard per ricevere la protezione del copyright, quindi tecnicamente sono di dominio pubblico. Sebbene le opere d’arte generate dall’intelligenza artificiale siano ancora un argomento controverso per molti per motivi etici e legali, gli appassionati continuano a spingere i confini di ciò che è possibile per un professionista non qualificato o non addestrato che utilizza questi nuovi strumenti.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *