Unenomaiset tekoälyn luomat geometriset kohtaukset lumoavat sosiaalisen median käyttäjiä

Unenomaiset tekoälyn luomat geometriset kohtaukset lumoavat sosiaalisen median käyttäjiä

Sunnuntaina Reddit-käyttäjä nimeltä ”Ugleh” julkaisi tekoälyn luoman kuvan spiraalimaisesta keskiaikaisesta kylästä, joka sai nopeasti huomiota sosiaalisessa mediassa merkittävien geometristen ominaisuuksiensa vuoksi. Jatkoviestit keräsivät vielä enemmän kiitosta, mukaan lukien twiitti , jossa on yli 145 000 tykkäystä. Ugleh loi kuvat käyttämällä Stable Diffusionia ja ControlNet-nimistä ohjaustekniikkaa.

Nettireaktiot taideteokseen vaihtelivat ihmetyksestä ja hämmästyksestä kunnioitukseen kehittää jotain uutta generatiivisessa tekoälytaiteessa. ”En ole koskaan nähnyt tällaisia ​​kuvia. Jotain uutta taiteen maailmassa”, kirjoitti yksi X-käyttäjä. ”Tbh, olen nähnyt PALJON ai-taidetta, ollut tässä tilassa pitkään, ja tämä on yksi upeimmista teoksista, joita olen koskaan nähnyt. Teit niin hyvin”, kirjoitti tekoälytaiteilija Kali Yuga X:ssä.

Ehkä merkittävin, Y-Combinatorin perustaja ja usein sosiaalisen median teknologiakommentaattori Paul Graham kirjoitti : ”Tämä oli kohta, jossa tekoälyn luoma taide läpäisi Turingin testin minulle.”

Ei mitään
Ei mitään
Ei mitään
Ei mitään
Ei mitään

Kaikki eivät tietenkään olleet vaikuttuneita siitä, että jotkut X-käyttäjät yrittivät erottaa tekoälyn luoman kierrekylän sävellyselementit. ”Se on mukavaa, mutta on monia päätöksiä, joita ihminen ei tekisi”, kirjoitti graafinen suunnittelija Trent. ”Monet varjot eivät ole oikein, eikä savupiippujen sijoittaminen suoraan ikkunoiden yläpuolelle ole järkevää. Zoomaamalla siellä näkyvät myös tekoälytaiteen ilmaisimet.”

Kesäkuussa käsittelimme tekniikkaa , joka käytti tekoälykuvan synteesimallia Stable Diffusion ja ControlNet luodakseen QR-koodeja, jotka näyttävät rikkailta taideteoksilta, mukaan lukien animen inspiroima taide. Ugleh otti saman neuroverkon, joka on optimoitu luomaan noita QR-koodeja (jotka ovat itse geometrisia muotoja) ja syöttivät siihen sen sijaan yksinkertaisia ​​kuvia spiraaleista ja shakkitaulukuvioista.

Kehotteen ohjaamana ”Keskiaikainen kyläkohtaus vilkkailla kaduilla ja linnalla kaukana (mestariteos: 1.4), (paras laatu), (yksityiskohtainen) ”ControlNet renderöi kohtauksia, joissa kuvien taiteelliset elementit sopivat yhteen spiraalien ja havaintomuotojen kanssa. shakkilaudat. Yhdessä kuvassa pilvet kaarevat pään yläpuolella ja ihmiset seisovat loivasti kaaressa spiraalin ohjauksen mukaisesti. Toisessa pilvien neliöt, pensaat, rakennuspinnat ja vaunukärry muodostavat shakkilaudan muotoisen kohtauksen.

ControlNetin taika

Joten miten se toimii? Olemme käsitelleet Stable Diffusionia usein aiemmin . Se on neuroverkkomalli, joka on koulutettu miljoonien Internetistä kaavittujen kuvien pohjalta. Mutta avain tässä on ControlNet, joka ilmestyi ensimmäisen kerran Lvmin Zhangin, Anyi Raon ja Maneesh Agrawalan helmikuussa 2023 tekemässä tutkimuksessa ” Ehdollisen ohjauksen lisääminen tekstistä kuvaksi diffuusiomalleihin ”, ja siitä tuli nopeasti suosittu Stable Diffusion -ohjelmassa. Yhteisö.

Tyypillisesti vakaa diffuusiokuva luodaan tekstikehotteen (teksti2image) tai kuvakehotteen (img2img) avulla. ControlNet tarjoaa lisäohjeita, jotka voivat olla lähdekuvasta poimittujen tietojen muodossa, mukaan lukien asennon tunnistus, syvyyskartoitus, normaali kartoitus, reunan tunnistus ja paljon muuta. ControlNetin avulla joku tekoälyn taideteoksia luova voi jäljitellä paljon tarkemmin kuvassa olevan kohteen muotoa tai asentoa.

Ei mitään
Ei mitään
Ei mitään

ControlNetin ja vastaavien kehotteiden avulla Uglehin töitä on helppo kopioida, ja muut ovat tehneet sen huvittavalla tavalla, mukaan lukien shakkilaudan animehahmot , animaatio , keskiaikainen kylä ”vuohi ” (yllättävän turvallista työhön) ja keskiaikainen kyläversio ” Girlistä ” helmikorvakorulla .”

Huolimatta valtavasta huomiosta ja monista tarjouksista muuttaa taideteos NFT:ksi, Ugleh on päättänyt pitää matalaa profiilia toistaiseksi. X:ssä hän sanoi : ”Arvostan kaikkea positiivista palautetta tekoälytaidetta kohtaan, en aio ansaita rahaa uusimmilta sukupolviltani, enkä aio tehdä virallisia haastatteluja. Olen vain tavallinen tekniikkaan perehtynyt tekoälynörtti, joka kokeili uutta ControlNet-tekniikkaa.

Jos haluat kokeilla ControlNetiä, tällä sivustolla on hyvä opetusohjelma. Lisäksi Ugleh julkaisi Imgurissa vaiheittaisen työnkulun , mukaan lukien spiraali- ja shakkitaulumallitiedostot.

Vaikka taideteos on merkittävä, Yhdysvaltain nykyinen tekijänoikeuskäytäntö sanoo, että kuvat eivät täytä tekijänoikeussuojan standardeja, joten teknisesti ne ovat julkisia. Vaikka tekoälyn tuottama taideteos on edelleen kiistanalainen aihe monille eettisistä ja oikeudellisista syistä, harrastajat jatkavat rajojen työntämistä kokemattomille tai kouluttamattomille ammattilaisille näiden uusien työkalujen avulla.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *