Мрійливі геометричні сцени, створені ШІ, заворожують користувачів соціальних мереж

Мрійливі геометричні сцени, створені ШІ, заворожують користувачів соціальних мереж

У неділю користувач Reddit на ім’я «Ugleh» опублікував створене штучним інтелектом зображення середньовічного села у формі спіралі, яке швидко привернуло увагу в соціальних мережах завдяки своїм чудовим геометричним якостям. Подальші публікації отримали ще більше похвали, включаючи твіт , який отримав понад 145 000 лайків. Угле створив зображення за допомогою стабільної дифузії та методу наведення під назвою ControlNet.

Реакція на твір мистецтва в Інтернеті варіювалася від подиву та здивування до поваги до розробки чогось нового в генеративному штучному мистецтві. «Ніколи не бачив таких фотографій. Щось новеньке у світі мистецтва», – написав один з користувачів X. «Тбх, я бачив БАГАТО мистецтва штучного інтелекту, був у цьому просторі дуже довго, і це один із найдивовижніших творів, які я коли-небудь бачив. Ви зробили так добре», – написав художник ШІ Калі Юга на X.

Можливо, найвідомішим є те, що співзасновник Y-Combinator і постійний коментатор соціальних мереж Пол Грем написав : «Це був момент, коли мистецтво, створене штучним інтелектом, пройшло для мене тест Тьюринга».

Жодного
Жодного
Жодного
Жодного
Жодного

Звичайно, не всі були вражені тим, що деякі користувачі X намагалися розібрати композиційні елементи створеного ШІ спірального села. «Це добре, але є багато рішень, які людина не прийме», — написав графічний дизайнер на ім’я Трент. «Багато тіней неправильні, і розміщувати димарі прямо над вікнами немає сенсу. Збільшення масштабу також показує яскраві шумові моделі штучного інтелекту».

У червні ми розглянули техніку, яка використовувала модель синтезу зображень штучного інтелекту Stable Diffusion і ControlNet для створення QR-кодів, які виглядають як багаті твори мистецтва, включно з мистецтвом, натхненним аніме. Угле взяв ту саму нейронну мережу, оптимізовану для створення QR-кодів (які самі по собі є геометричними фігурами), і натомість додав у неї прості зображення спіралей і шахових візерунків.

Керуючись підказкою «Середньовічна сільська сцена з жвавими вулицями та замком на відстані (шедевр: 1.4), (найкраща якість), (детально) », ControlNet відтворив сцени, де художні елементи зображень збігаються з перцепційними формами спіралей і шашки. На одному зображенні хмари дугою над головою, а люди стоять у пологій кривій відповідно до спіральних вказівок. В іншому квадрати хмар, живоплоти, фасади будівель і візок утворюють сцену у формі шахової дошки.

Магія ControlNet

Отже, як це працює? Раніше ми вже часто розглядали Стабільну дифузію . Це модель нейронної мережі, навчена на мільйонах зображень, зібраних з Інтернету. Але ключовим тут є ControlNet, який вперше з’явився в дослідницькій статті під назвою « Додавання умовного керування до моделей розповсюдження тексту в зображення » Lvmin Zhang, Anyi Rao та Maneesh Agrawala в лютому 2023 року та швидко став популярним у Stable Diffusion. громада.

Як правило, зображення Stable Diffusion створюється за допомогою текстової підказки (називається text2image) або підказки зображення (img2img). ControlNet представляє додаткові вказівки, які можуть приймати форму витягнутої інформації з вихідного зображення, включаючи визначення пози, відображення глибини, відображення нормалей, визначення країв і багато іншого. Використовуючи ControlNet, хтось, хто створює ілюстрації штучного інтелекту, може набагато точніше відтворити форму або позу об’єкта на зображенні.

Жодного
Жодного
Жодного

Використовуючи ControlNet і подібні підказки, легко відтворити роботу Уґле, і інші зробили це з кумедним ефектом, включаючи аніме-персонажів із шаховою дошкою , анімацію , середньовічне село «козла » (напрочуд безпечне для роботи) та середньовічну сільську версію « Дівчина» . з перлинною сережкою ».

Незважаючи на величезну увагу та численні пропозиції перетворити твір мистецтва на NFT, Угле вирішив поки що триматися тихо. На X він сказав : «Я ціную всі позитивні відгуки про мистецтво штучного інтелекту, я не планую заробляти гроші на моїх останніх поколіннях і я не буду давати жодних офіційних інтерв’ю. Я звичайний технічно підкований ботанік, який експериментував із новою технікою ControlNet».

Якщо ви хочете поекспериментувати з ControlNet, на цьому сайті є хороший посібник. Крім того, Угле опублікував на Imgur покроковий робочий процес , включаючи файли шаблонів спіралі та шахової дошки.

Незважаючи на чудовий твір мистецтва, чинна політика США щодо авторського права говорить, що зображення не відповідають стандартам захисту авторських прав, тому технічно вони є суспільним надбанням. Незважаючи на те, що твори мистецтва, створені штучним інтелектом, все ще є предметом суперечок для багатьох з етичних і юридичних міркувань, ентузіасти продовжують розширювати межі того, що можливо для некваліфікованих або непідготовлених практиків, використовуючи ці нові інструменти.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *