Dromerige, door AI gegenereerde geometrische scènes betoveren gebruikers van sociale media
Zondag plaatste een Reddit-gebruiker genaamd “Ugleh” een door AI gegenereerde afbeelding van een spiraalvormig middeleeuws dorp dat snel de aandacht kreeg op sociale media vanwege zijn opmerkelijke geometrische kwaliteiten. Vervolgposts oogstten nog meer lof, waaronder een tweet met meer dan 145.000 likes. Ugleh maakte de beelden met behulp van Stable Diffusion en een begeleidingstechniek genaamd ControlNet.
De reacties op het kunstwerk online varieerden van verwondering en verbazing tot respect voor het ontwikkelen van iets nieuws in generatieve AI-kunst. “Ik heb nog nooit zulke foto’s gezien. Iets nieuws in de kunstwereld”, schreef een X-gebruiker. “Tbh, ik heb VEEL ai-kunst gezien, ben al heel lang in deze ruimte, en dit is een van de meest geweldige stukken die ik ooit heb gezien. Je hebt het zo goed gedaan”, schreef AI-kunstenaar Kali Yuga op X.
Misschien wel het meest opvallend schreef Paul Graham, medeoprichter van Y-Combinator en frequent social media tech-commentator : “Dit was voor mij het punt waarop door AI gegenereerde kunst de Turing-test doorstond.”
Niet iedereen was natuurlijk onder de indruk van het feit dat sommige X-gebruikers probeerden de compositorische elementen van het door AI gegenereerde spiraalvormige dorp uit elkaar te halen . “Het is leuk, maar er zijn veel beslissingen die een mens niet zou nemen”, schreef grafisch ontwerper Trent. “Veel schaduwen kloppen niet, en het heeft geen zin om schoorstenen vlak boven de ramen te plaatsen. Als je inzoomt, zie je ook de veelbetekenende ruispatronen van AI-kunst.”
In juni hebben we een techniek besproken waarbij gebruik wordt gemaakt van het AI-beeldsynthesemodel Stable Diffusion en ControlNet om QR-codes te creëren die eruit zien als rijke kunstwerken, waaronder op anime geïnspireerde kunst. Ugleh gebruikte hetzelfde neurale netwerk dat was geoptimaliseerd voor het maken van QR-codes (die zelf geometrische vormen zijn) en voerde er in plaats daarvan eenvoudige afbeeldingen van spiralen en dambordpatronen in.
Wanneer geleid door de prompt: “Middeleeuws dorpsscène met drukke straten en kasteel in de verte (meesterwerk:1.4), (beste kwaliteit), (gedetailleerd) ,” geeft ControlNet scènes weer waarin artistieke elementen van de beelden overeenkomen met de perceptuele vormen van spiralen en damborden. In één afbeelding vormen de wolken een boog boven hun hoofd en staan mensen in een flauwe bocht, passend bij de spiraalgeleiding. In een ander voorbeeld vormen vierkanten van wolken, heggen, gebouwgezichten en een wagenkar een schaakbordvormig tafereel.
De magie van ControlNet
Dus hoe werkt het? We hebben Stabiele Diffusie al vaker behandeld . Het is een neuraal netwerkmodel dat is getraind op basis van miljoenen afbeeldingen die van internet zijn geplukt. Maar de sleutel hier is ControlNet, dat voor het eerst verscheen in een onderzoeksartikel met de titel ‘ Adding Conditional Control to Text-to-Image Diffusion Models ’ van Lvmin Zhang, Anyi Rao en Maneesh Agrawala in februari 2023, en al snel populair werd in de Stable Diffusion gemeenschap.
Normaal gesproken wordt een Stabiele Diffusie-afbeelding gemaakt met behulp van een tekstprompt (genaamd text2image) of een afbeeldingsprompt (img2img). ControlNet introduceert aanvullende richtlijnen die de vorm kunnen aannemen van geëxtraheerde informatie uit een bronafbeelding, waaronder posedetectie, dieptetoewijzing, normale mapping, randdetectie en nog veel meer. Met behulp van ControlNet kan iemand die AI-kunstwerken maakt de vorm of pose van een onderwerp in een afbeelding veel nauwkeuriger nabootsen.
Met behulp van ControlNet en soortgelijke aanwijzingen is het gemakkelijk om het werk van Ugleh te repliceren, en anderen hebben dit met een grappig effect gedaan, inclusief schaakbord-anime-personages , een animatie , een middeleeuws dorp ‘geit ‘ (verrassend veilig voor werk) en een middeleeuwse dorpsversie van ‘ Girl’ . met een pareloorring .”
Ondanks de enorme aandacht en vele aanbiedingen om van het artwork NFT’s te maken, heeft Ugleh ervoor gekozen om voorlopig onopvallend te blijven. Over X zei hij: “Ik waardeer alle positieve feedback op AI-kunst, ik ben niet van plan geld te verdienen aan mijn nieuwste generaties, en ik zal geen officiële interviews doen. Ik ben gewoon een normale, technisch onderlegde AI-nerd die heeft geëxperimenteerd met een nieuwe ControlNet-techniek.”
Als je met ControlNet wilt experimenteren, heeft deze site een goede tutorial. Ugleh plaatste ook een stapsgewijze workflow , inclusief de spiraal- en dambordsjabloonbestanden, op Imgur.
Hoewel het artwork opmerkelijk is, zegt het huidige Amerikaanse auteursrechtbeleid dat de afbeeldingen niet voldoen aan de normen voor auteursrechtelijke bescherming, zodat ze zich technisch gezien in het publieke domein bevinden. Hoewel door AI gegenereerde kunstwerken op ethische en juridische gronden voor velen nog steeds een controversieel onderwerp zijn , blijven enthousiastelingen de grenzen verleggen van wat mogelijk is voor een ongeschoolde of ongetrainde beoefenaar die deze nieuwe hulpmiddelen gebruikt.
Geef een reactie