Drømmende AI-genererede geometriske scener fascinerer brugere af sociale medier
Søndag postede en Reddit-bruger ved navn “Ugleh” et AI-genereret billede af en spiralformet middelalderlandsby, der hurtigt fik opmærksomhed på sociale medier for sine bemærkelsesværdige geometriske kvaliteter. Opfølgende indlæg høstede endnu mere ros, herunder et tweet med over 145.000 likes. Ugleh skabte billederne ved hjælp af Stable Diffusion og en vejledningsteknik kaldet ControlNet.
Reaktionerne på kunstværket online spændte fra undren og forbløffelse til respekt for at udvikle noget nyt inden for generativ kunstig intelligens. “Aldrig set billeder som dette. Noget nyt i kunstens verden,” skrev en X-bruger. “Tbh, jeg har set MEGET ai-kunst, været i dette rum i lang tid, og dette er et af de mest fantastiske værker, jeg nogensinde har set. Du gjorde det så godt,” skrev AI-kunstneren Kali Yuga på X.
Måske mest bemærkelsesværdigt, Y-Combinator medstifter og hyppige sociale medier teknologikommentator Paul Graham skrev : “Dette var det punkt, hvor AI-genereret kunst bestod Turing-testen for mig.”
Ikke alle var selvfølgelig imponerede over, at nogle X-brugere forsøgte at skille de kompositoriske elementer fra den AI-genererede spirallandsby ad. “Det er rart, men der er masser af beslutninger, et menneske ikke ville tage,” skrev en grafisk designer ved navn Trent. “Mange af skyggerne er ikke korrekte, og det giver ingen mening at sætte skorstene lige over vinduer. Ved at zoome ind er der også de afslørende støjmønstre i kunstig intelligens.”
I juni dækkede vi en teknik, der brugte AI-billedsyntesemodellen Stable Diffusion og ControlNet til at skabe QR-koder, der ligner rige kunstværker, inklusive anime-inspireret kunst. Ugleh tog det samme neurale netværk, der var optimeret til at skabe disse QR-koder (som i sig selv er geometriske former) og fodrede simple billeder af spiraler og skakbrætmønstre ind i det i stedet.
Når guidet af prompten, “Middelalderlandsbyscene med travle gader og slot i det fjerne (mesterværk:1.4), (bedste kvalitet), (detaljeret) ,” gengivede ControlNet scener, hvor kunstneriske elementer i billederne matcher de perceptuelle former af spiraler og skakbrætter. På et billede buer skyerne over hovedet, og folk står i en blid kurve for at matche spiralføringen. I en anden udgør firkanter af skyer, hække, bygningsflader og en vognvogn en skakbrætformet scene.
Magien ved ControlNet
Så hvordan virker det? Vi har ofte behandlet stabil diffusion før . Det er en neural netværksmodel, der er trænet på millioner af billeder skrabet fra internettet. Men nøglen her er ControlNet, som først dukkede op i et forskningspapir med titlen ” Tilføjelse af betinget kontrol til tekst-til-billede-diffusionsmodeller “af Lvmin Zhang, Anyi Rao og Maneesh Agrawala i februar 2023, og hurtigt blev populært i den stabile diffusion fællesskab.
Typisk oprettes et stabilt diffusionsbillede ved hjælp af en tekstprompt (kaldet text2image) eller en billedprompt (img2img). ControlNet introducerer yderligere vejledning, der kan tage form af udtrukket information fra et kildebillede, herunder positionsdetektion, dybdekortlægning, normal kortlægning, kantdetektering og meget mere. Ved at bruge ControlNet kan en person, der genererer AI-kunstværker, meget tættere replikere formen eller poseringen af et motiv i et billede.
Ved at bruge ControlNet og lignende prompts er det nemt at replikere Uglehs arbejde, og andre har gjort det med en underholdende effekt, herunder skakternet anime-karakterer , en animation , middelalderlandsby “ged ” (overraskende sikker for arbejde) og en middelalderlandsbyversion af ” Girl med en perleørering .”
På trods af den massive opmærksomhed og mange tilbud om at gøre kunstværket til NFT’er, har Ugleh valgt at holde en lav profil indtil videre. På X sagde han: “Jeg sætter pris på al den positive feedback til kunstig intelligens, jeg har ikke planer om at tjene penge på mine seneste generationer, og jeg vil ikke lave nogen officielle interviews. Jeg er bare en normal teknisk kyndig AI-nørd, der eksperimenterede med en ny ControlNet-teknik.”
Hvis du vil eksperimentere med ControlNet, har denne side en god tutorial. Ugleh postede også en trin-for-trin arbejdsgang , inklusive spiral- og skakbrætskabelonfilerne, på Imgur.
Selvom kunstværket er bemærkelsesværdigt, siger den nuværende amerikanske copyright-politik, at billederne ikke opfylder standarderne for at modtage copyright-beskyttelse, så teknisk set er de i det offentlige domæne. Mens AI-genererede kunstværker stadig er et omstridt emne for mange på etiske og juridiske grunde, fortsætter entusiaster med at skubbe grænserne for, hvad der er muligt for en ufaglært eller utrænet praktiker, der bruger disse nye værktøjer.
Skriv et svar