OpenAI DALL-E 2 var atveidot visu, ko vien varat iedomāties

OpenAI DALL-E 2 var atveidot visu, ko vien varat iedomāties

OpenAI DALL-E 2 mākslīgais intelekts veido multfilmu attēlus, pamatojoties uz teksta aprakstu no jūsu iztēles.

2021. gada janvārī OpenAI konsorcijs, kuru dibināja Elons Masks un finansēja Microsoft, atklāja savu līdz šim vērienīgāko projektu — mašīnmācīšanās sistēmu DALL-E. Šis ģeniālais multimodālais mākslīgais intelekts spēja ģenerēt karikatūras stila attēlus, pamatojoties tikai uz lietotāja norādītiem atslēgvārdiem. Pavisam nesen konsorcijs ieviesa jaunu DALL-E versiju ar augstāku izšķirtspēju un mazāku latentumu nekā iepriekšējā.

Mākslīgais intelekts OpenAI DALL-E 2 rada multfilmu attēlus

Pirmā DALL-E versija (saīsinājums no Dalie un Wall-E) varēja ģenerēt attēlus un apvienot vairākus attēlus kolāžā, ieteikt dažādus leņķus un pat uzminēt vairākus attēla elementus, piemēram, ēnu efektus, izmantojot vienkāršu rakstisku aprakstu. .

“Atšķirībā no 3D renderētāja, kura ievade ir nepārprotami jānorāda līdz mazākajai detaļai, DALL-E bieži var “aizpildīt nepilnības”, ja nosaukums norāda, ka attēlā ir noteiktas detaļas, kas nav skaidri norādītas,” skaidroja komanda. Atvērt AI 2021. gadā.

DALL-E nekad nebija paredzēts kā komerciāls produkts, tāpēc tā iespējas bija ierobežotas, jo OpenAI komanda to uzskatīja tikai par pētniecības rīku. Bija arī jāizvairās no situācijas, kāda bija Microsoft ar savu Tay tērzēšanas robotu un ka sistēma nevarēja ģenerēt nepatiesu informāciju. Šai otrajai versijai mērķi paliek nemainīgi, un attēlam ir pievienota ūdenszīme, kas skaidri norāda, ka to radījis mākslīgais intelekts. Turklāt sistēma tagad aizliedz lietotājiem izveidot attēlus ar īpašvārdiem.

saskaņā ar teksta aprakstu, kas ņemts no jūsu iztēles

DALL-E 2, kas izmanto OpenAI CLIP attēlu atpazīšanas sistēmu, izmanto savas attēlu ģenerēšanas iespējas. Lietotāji tagad var atlasīt un rediģēt noteiktus esošo attēlu apgabalus, pievienot vai noņemt elementus kopā ar to ēnām, apvienot divus attēlus vienā kolāžā un izveidot esoša attēla variantus. Ģenerētie attēli tagad ir 1024 pikseļu kvadrāti, savukārt sākotnējie iemiesojumi bija 256 pikseļi. CLIP tika izstrādāts, lai apkopotu attēla saturu cilvēkam saprotamā veidā. Konsorcijs mainīja procesu, izveidojot attēlu no viņa apraksta.

“DALL-E 1 izmantoja mūsu GPT-3 pieeju valodai un izmantoja to, lai izveidotu attēlu: mēs saspiežam attēlus vārdu kopā un iemācījāmies paredzēt, kas notiks tālāk,” pētniece Prafulla Dhariwal paskaidroja The Rod.

Atšķirībā no pirmās versijas, ar kuru ikviens varēja spēlēt OpenAI vietnē, šī 2. versija pašlaik ir pieejama tikai noteiktiem partneriem, un viņiem pašiem ir ierobežots, ko viņi var darīt. Tikai daži laimīgie var to izmantot. Viņi arī nevar eksportēt attēlus, kas izveidoti trešās puses platformā, lai gan OpenAI plāno nākotnē padarīt DALL-E 2 jaunās funkcijas pieejamas, izmantojot API. Ja joprojām vēlaties izmēģināt sistēmu, varat pievienoties gaidīšanas sarakstam .

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *