OpenAI DALL-E 2 voi renderöidä kuvia kaikesta, mitä voit kuvitella

OpenAI DALL-E 2 voi renderöidä kuvia kaikesta, mitä voit kuvitella

OpenAI DALL-E 2 -tekoäly luo sarjakuvakuvia mielikuvituksesi tekstikuvauksen perusteella.

Tammikuussa 2021 Elon Muskin perustama ja Microsoftin rahoittama OpenAI-konsortio julkisti tähän mennessä kunnianhimoisimman projektinsa, DALL-E-koneoppimisjärjestelmän. Tämä nerokas multimodaalinen tekoäly pystyi luomaan sarjakuvatyylisiä kuvia vain käyttäjän määrittämien avainsanojen perusteella. Äskettäin konsortio esitteli uuden version DALL-E:stä , jolla on korkeampi resoluutio ja pienempi latenssi kuin edellinen.

Tekoäly OpenAI DALL-E 2 luo sarjakuvakuvia

DALL-E:n ensimmäinen versio (lyhenne sanoista Dalie ja Wall-E) voi luoda kuvia ja yhdistää useita kuvia kollaasiksi, ehdottaa erilaisia ​​kuvakulmia ja jopa arvata useita kuvaelementtejä – kuten varjotehosteita – yksinkertaisesta kirjallisesta kuvauksesta. .

”Toisin kuin 3D-renderöijä, jonka syöte on määritettävä yksiselitteisesti pienimpiä yksityiskohtia myöten, DALL-E voi usein ”täyttää aukot”, kun otsikko viittaa siihen, että kuva sisältää tiettyjä yksityiskohtia, joita ei ole erikseen mainittu”, tiimi selitti. Avaa AI vuonna 2021.

DALL-E:tä ei koskaan suunniteltu kaupalliseksi tuotteeksi, joten sen ominaisuudet olivat rajalliset, koska OpenAI-tiimi piti sitä vain tutkimustyökaluna. Oli myös vältettävä tilanne, joka Microsoftilla oli Tay-chatbotinsa kanssa ja ettei järjestelmä voinut tuottaa vääriä tietoja. Tämän toisen version tavoitteet pysyvät samoina, ja kuvaan on lisätty vesileima osoittamaan selvästi, että se on tekoälyn luoma. Lisäksi järjestelmä estää nyt käyttäjiä luomasta kuvia erinimillä.

mielikuvituksestasi otetun tekstikuvauksen mukaan

DALL-E 2, joka käyttää OpenAI CLIP -kuvantunnistusjärjestelmää, käyttää sen kuvanluontiominaisuuksia. Käyttäjät voivat nyt valita ja muokata tiettyjä alueita olemassa olevista kuvista, lisätä tai poistaa elementtejä varjoineen, yhdistää kaksi kuvaa yhdeksi kollaasiksi ja luoda muunnelmia olemassa olevasta kuvasta. Luodut kuvat ovat nyt 1024 pikseliä, kun taas alkuperäiset avatarit olivat 256 pikseliä. CLIP on suunniteltu tiivistämään kuvan sisältö tavalla, jonka ihminen voi ymmärtää. Konsortio käänsi prosessin päinvastaiseksi luomalla kuvan hänen kuvauksestaan.

”DALL-E 1 käytti GPT-3-lähestymistapaamme kieleen ja sovelsi sitä kuvan luomiseen: pakkaamme kuvat sanajoukoksi ja opimme ennustamaan, mitä tapahtuu seuraavaksi”, tutkija Prafulla Dhariwal selitti The Rodille.

Toisin kuin ensimmäinen versio, jolla kaikki voivat pelata OpenAI-sivustolla, tämä versio 2 on tällä hetkellä vain tiettyjen kumppanien saatavilla, ja he itse ovat rajoitettuja siinä, mitä he voivat tehdä. Vain harvat onnekkaat pääsevät käyttämään sitä. He eivät myöskään voi viedä kolmannen osapuolen alustalla luotuja kuvia, vaikka OpenAI aikookin saattaa DALL-E 2:n uudet ominaisuudet saataville API:n kautta tulevaisuudessa. Jos haluat silti kokeilla järjestelmää, voit liittyä jonotuslistalle .

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *