„OpenAI DALL-E 2“ gali atvaizduoti viską, ką tik galite įsivaizduoti

„OpenAI DALL-E 2“ gali atvaizduoti viską, ką tik galite įsivaizduoti

„OpenAI DALL-E 2“ dirbtinis intelektas kuria animacinius vaizdus pagal jūsų vaizduotės tekstinį aprašymą.

2021 m. sausį OpenAI konsorciumas, įkurtas Elono Musko ir finansuojamas Microsoft, pristatė iki šiol ambicingiausią projektą – mašininio mokymosi sistemą DALL-E. Šis išradingas multimodalinis dirbtinis intelektas sugebėjo generuoti animacinių filmų stiliaus vaizdus tik pagal vartotojo nurodytus raktinius žodžius. Visai neseniai konsorciumas pristatė naują DALL-E versiją su didesne skiriamąja geba ir mažesne delsa nei ankstesnė.

Dirbtinis intelektas OpenAI DALL-E 2 kuria animacinius vaizdus

Pirmoji DALL-E versija (sutrumpintai nuo Dalie ir Wall-E) gali generuoti vaizdus ir sujungti kelis vaizdus į koliažą, pasiūlyti skirtingus kampus ir net atspėti daugybę vaizdo elementų, pvz., šešėlių efektus, iš paprasto rašytinio aprašymo. .

„Skirtingai nei 3D atvaizdavimo įrenginys, kurio įvestis turi būti vienareikšmiškai nurodyta iki smulkiausių detalių, DALL-E dažnai gali „užpildyti spragas“, kai pavadinimas rodo, kad vaizde yra tam tikrų detalių, kurios nėra aiškiai nurodytos“, – paaiškino komanda. Atidarykite AI 2021 m.

DALL-E niekada nebuvo skirtas komerciniam produktui, todėl jo galimybės buvo ribotos, nes OpenAI komanda jį laikė tik tyrimo priemone. Taip pat reikėjo išvengti situacijos, kurią „Microsoft“ turėjo su savo „Tay“ pokalbių robotu ir kad sistema negalėtų generuoti klaidingos informacijos. Šios antrosios versijos tikslai išlieka tie patys, o prie vaizdo pridėtas vandens ženklas, aiškiai nurodantis, kad jį sukūrė dirbtinis intelektas. Be to, dabar sistema draudžia vartotojams kurti vaizdus tinkamais vardais.

pagal tekstinį aprašymą, paimtą iš jūsų vaizduotės

DALL-E 2, kuris naudoja OpenAI CLIP vaizdo atpažinimo sistemą, naudoja savo vaizdo generavimo galimybes. Dabar vartotojai gali pasirinkti ir redaguoti konkrečias esamų vaizdų sritis, pridėti arba pašalinti elementus kartu su jų šešėliais, sujungti du vaizdus į vieną koliažą ir kurti esamo vaizdo variantus. Sugeneruoti vaizdai dabar yra 1024 pikselių kvadratų, o pradiniai avatarai buvo 256 pikseliai. CLIP buvo sukurta siekiant apibendrinti vaizdo turinį taip, kad jį galėtų suprasti žmogus. Konsorciumas pakeitė procesą, sukurdamas vaizdą iš jo aprašymo.

„DALL-E 1 pasirinko mūsų GPT-3 požiūrį į kalbą ir pritaikė jį vaizdui sukurti: suspaudžiame vaizdus į žodžių rinkinį ir išmokome nuspėti, kas nutiks toliau“, – „The Rod“ aiškino tyrėjas Prafulla Dhariwal.

Skirtingai nuo pirmosios versijos, su kuria visi galėjo žaisti OpenAI svetainėje, ši 2 versija šiuo metu prieinama tik tam tikriems partneriams, o jiems patiems yra ribojama, ką jie gali padaryti. Tik keli laimingieji gali juo pasinaudoti. Jie taip pat negali eksportuoti vaizdų, sukurtų trečiosios šalies platformoje, nors OpenAI planuoja ateityje padaryti naujas DALL-E 2 funkcijas pasiekiamas per API. Jei vis tiek norite išbandyti sistemą, galite prisijungti prie laukiančiųjų sąrašo .

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *