В воскресенье пользователь Reddit под ником «Угле» опубликовал созданное искусственным интеллектом изображение средневековой деревни спиралевидной формы, которое быстро привлекло внимание в социальных сетях благодаря своим замечательным геометрическим качествам. Последующие посты получили еще больше похвал, включая твит , набравший более 145 000 лайков. Углех создал изображения, используя стабильную диффузию и метод управления под названием ControlNet.
Реакция на произведения искусства в Интернете варьировалась от удивления и удивления до уважения к разработке чего-то нового в генеративном искусстве искусственного интеллекта. «Никогда не видел таких фотографий. Что-то новое в мире искусства», — написал один из пользователей X. «Честно говоря, я видел МНОГО ИИ-арта, был в этом пространстве долгое время, и это одно из самых потрясающих произведений, которые я когда-либо видел. Ты так хорошо справился», — написала художница Кали Юга на X.
Пожалуй, наиболее примечательно то, что соучредитель Y-Combinator и частый комментатор социальных сетей Пол Грэм написал : «Это был момент, когда искусство, созданное искусственным интеллектом, прошло для меня тест Тьюринга».





Конечно, не всех впечатлило то, что некоторые пользователи X пытались разобрать композиционные элементы сгенерированной ИИ спиральной деревни. «Это приятно, но есть много решений, которые человек не принял бы», — написал графический дизайнер по имени Трент. «Многие тени неправильны, и размещение дымоходов прямо над окнами не имеет смысла. При увеличении можно также увидеть характерные шумы искусства искусственного интеллекта».
В июне мы рассмотрели технику, в которой используется модель синтеза изображений искусственного интеллекта Stable Diffusion и ControlNet для создания QR-кодов, которые выглядят как богатые произведения искусства, в том числе в стиле аниме. Угле взял ту же нейронную сеть, оптимизированную для создания этих QR-кодов (которые сами по себе представляют собой геометрические фигуры), и вместо этого ввел в нее простые изображения спиралей и шахматных узоров.
Руководствуясь подсказкой «Средневековая деревенская сцена с оживленными улицами и замком вдалеке (шедевр: 1.4), (наилучшее качество), (детализация) », ControlNet визуализировал сцены, в которых художественные элементы изображений соответствуют воспринимаемым формам спиралей и шахматные доски. На одном изображении облака изгибаются над головой, а люди стоят, плавно изгибаясь, следуя спиральному направлению. В другом квадраты облаков, живые изгороди, фасады зданий и повозка составляют сцену в форме шахматной доски.
Магия ControlNet
Итак, как это работает? Мы уже часто рассматривали Stable Diffusion . Это модель нейронной сети, обученная на миллионах изображений, взятых из Интернета. Но ключевым моментом здесь является ControlNet, который впервые появился в исследовательской работе под названием « Добавление условного управления к моделям диффузии текста в изображение » Львмина Чжана, Аньи Рао и Маниша Агравалы в феврале 2023 года и быстро стал популярным в рамках стабильной диффузии. сообщество.
Обычно изображение Stable Diffusion создается с использованием текстового приглашения (называемого text2image) или графического приглашения (img2img). ControlNet представляет дополнительные рекомендации, которые могут принимать форму извлеченной информации из исходного изображения, включая определение позы, отображение глубины, отображение нормалей, обнаружение краев и многое другое. Используя ControlNet, тот, кто создает изображения с использованием искусственного интеллекта, может гораздо точнее воспроизвести форму или позу объекта на изображении.



Используя ControlNet и подобные подсказки, легко воспроизвести работу Углеха, и другие сделали это с забавным эффектом, включая шахматных аниме-персонажей , анимацию , средневековую деревенскую «козу » (на удивление безопасную для работы) и средневековую деревенскую версию « Девочки» . с жемчужной сережкой ».
Несмотря на огромное внимание и множество предложений превратить произведения искусства в NFT, Угле пока решил вести себя сдержанно. На X он сказал : «Я ценю все положительные отзывы об искусстве искусственного интеллекта, я не планирую зарабатывать деньги на своих последних поколениях и не буду давать никаких официальных интервью. Я обычный технически подкованный фанат искусственного интеллекта, который экспериментировал с новой техникой ControlNet».
Если вы хотите поэкспериментировать с ControlNet, на этом сайте есть хорошее руководство. Кроме того, Углех опубликовал на Imgur пошаговый рабочий процесс , включая файлы шаблонов спирали и шахматной доски.
Хотя произведение искусства замечательное, действующая политика США в отношении авторских прав гласит, что изображения не соответствуют стандартам защиты авторских прав, поэтому технически они находятся в общественном достоянии. Хотя произведения искусства, созданные с помощью ИИ, по-прежнему являются спорным вопросом для многих по этическим и юридическим причинам, энтузиасты продолжают раздвигать границы того, что возможно для неквалифицированного или неподготовленного специалиста, использующего эти новые инструменты.