OpenAI DALL-E 2 suudab renderdada pilte kõigest, mida ette kujutate

OpenAI DALL-E 2 suudab renderdada pilte kõigest, mida ette kujutate

OpenAI DALL-E 2 tehisintellekt loob teie kujutlusvõimest lähtuva tekstikirjelduse põhjal koomiksipilte.

2021. aasta jaanuaris avalikustas Elon Muski asutatud ja Microsofti rahastatud OpenAI konsortsium oma seni kõige ambitsioonikama projekti – masinõppesüsteemi DALL-E. See geniaalne multimodaalne tehisintellekt suutis luua koomiksilaadseid pilte ainult kasutaja määratud märksõnade põhjal. Hiljuti tutvustas konsortsium DALL-E uut versiooni, millel on suurem eraldusvõime ja väiksem latentsus kui eelmine.

Tehisintellekt OpenAI DALL-E 2 loob koomiksipilte

DALL-E esimene versioon (lühend sõnadest Dalie ja Wall-E) võib luua pilte ja kombineerida mitu pilti kollaažiks, soovitada erinevaid vaatenurki ja isegi ära arvata mitmeid pildielemente – näiteks varjuefekte – lihtsast kirjalikust kirjeldusest. .

“Erinevalt 3D-renderdajast, mille sisend tuleb täpsustada üheselt väikseima detailini, võib DALL-E sageli “täita lüngad”, kui pealkiri viitab sellele, et pilt sisaldab teatud detaile, mida pole selgesõnaliselt öeldud,” selgitas meeskond. Avage AI 2021. aastal.

DALL-E ei olnud kunagi mõeldud kaubanduslikuks tooteks, seega olid selle võimalused piiratud, kuna OpenAI meeskond pidas seda ainult uurimisvahendiks. Samuti tuli vältida olukorda, mis Microsoftil oli oma Tay chatbotiga ja et süsteem ei saaks genereerida valeinfot. Selle teise versiooni eesmärgid jäävad samaks ja pildile on lisatud vesimärk, mis näitab selgelt, et selle lõi tehisintellekt. Lisaks keelab süsteem nüüd kasutajatel luua pärisnimedega pilte.

teie kujutlusvõimest võetud tekstilise kirjelduse järgi

DALL-E 2, mis kasutab OpenAI CLIP pildituvastussüsteemi, kasutab oma piltide genereerimise võimalusi. Kasutajad saavad nüüd valida ja redigeerida olemasolevate piltide teatud alasid, lisada või eemaldada elemente koos nende varjudega, liita kaks pilti üheks kollaažiks ja luua olemasolevast pildist variatsioone. Loodud kujutised on nüüd 1024 piksli ruudud, samas kui algsed avatarid olid 256 pikslit. CLIP loodi pildi sisu kokkuvõtmiseks inimesele arusaadaval viisil. Konsortsium muutis protsessi vastupidiseks, luues tema kirjelduse põhjal pildi.

“DALL-E 1 kasutas meie GPT-3 lähenemisviisi keelele ja rakendas seda kujutise loomiseks: tihendasime pildid sõnade komplektiks ja õppisime ennustama, mis edasi saab,” selgitas teadlane Prafulla Dhariwal ajakirjale The Rod.

Erinevalt esimesest versioonist, millega kõik said OpenAI saidil mängida, on see versioon 2 praegu saadaval ainult teatud partneritele ja nende endi tegevus on piiratud. Ainult vähesed õnnelikud saavad seda kasutada. Samuti ei saa nad eksportida kolmanda osapoole platvormil loodud pilte, kuigi OpenAI plaanib tulevikus teha DALL-E 2 uued funktsioonid API kaudu kättesaadavaks. Kui soovite siiski süsteemi proovida, võite liituda ootenimekirjaga .

Lisa kommentaar

Sinu e-postiaadressi ei avaldata. Nõutavad väljad on tähistatud *-ga