人工智能生成的夢幻幾何場景讓社交媒體用戶著迷

人工智能生成的夢幻幾何場景讓社交媒體用戶著迷

週日,一位名為“Ugleh”的 Reddit 用戶發布了一張人工智能生成的螺旋形中世紀村莊的圖像,該圖像因其非凡的幾何品質而迅速在社交媒體上引起關注。後續帖子獲得了更多讚譽,其中一條推文獲得了超過 145,000 次點贊。Ugleh 使用穩定擴散和稱為 ControlNet 的製導技術創建了圖像。

人們對網上藝術作品的反應從驚嘆和驚訝到對在生成人工智能藝術中開發新穎的東西的尊重。“從來沒有見過這樣的照片。藝術界的一些新事物,”一位 X 用戶寫道。“說實話,我看過很多人工智能藝術,在這個領域呆了很長時間,這是我見過的最棒的作品之一。你做得很好,”人工智能藝術家 Kali Yuga 在 X 上寫道。

也許最值得注意的是,Y-Combinator 聯合創始人兼頻繁社交媒體技術評論員 Paul Graham寫道:“這就是人工智能生成的藝術通過了我的圖靈測試的時刻。”

沒有任何
沒有任何
沒有任何
沒有任何
沒有任何

當然,並不是所有人都對一些 X 用戶試圖分解人工智能生成的螺旋村莊的組成元素感到印象深刻。“這很好,但有很多決定是人類不會做出的,”一位名叫特倫特的平面設計師寫道。“很多陰影都不正確,將煙囪放在窗戶上方是沒有意義的。放大後還可以看到人工智能藝術的噪音模式。”

六月,我們介紹了一項技術,該技術使用 AI 圖像合成模型 Stable Diffusion 和 ControlNet 創建看起來像豐富藝術品(包括動漫風格的藝術作品)的 QR 碼。Ugleh 採用了為創建這些 QR 碼(本身就是幾何形狀)而優化的相同神經網絡,並將螺旋和棋盤圖案的簡單圖像輸入其中。

當按照提示“中世紀村莊場景,繁忙的街道和遠處的城堡(傑作:1.4),(最佳質量),(詳細) ”時,ControlNet 渲染了場景,其中圖像的藝術元素與螺旋的感知形狀相匹配,棋盤。在一張圖像中,雲朵在頭頂上呈弧形,人們以柔和的曲線站立,以配合螺旋引導。在另一幅作品中,方形的雲朵、樹籬、建築物的表面和一輛馬車構成了一個棋盤形狀的場景。

ControlNet 的魔力

那麼它是怎樣工作的?我們之前經常介紹過穩定擴散。它是一個神經網絡模型,根據從互聯網上抓取的數百萬張圖像進行訓練。但這裡的關鍵是 ControlNet,它首次出現在2023 年 2 月 Lvmin Zhang、Anyi Rao 和 Maneesh Agrawala 發表的題為“ Adding Conditional Control to Text-to-Image Diffusion Models ”的研究論文中,並迅速在穩定擴散領域流行起來。社區。

通常,穩定擴散圖像是使用文本提示(稱為 text2image)或圖像提示(img2img)創建的。ControlNet 引入了額外的指導,可以採用從源圖像中提取信息的形式,包括姿勢檢測、深度映射、法線映射、邊緣檢測等等。使用 ControlNet,生成人工智能藝術作品的人可以更精確地複製圖像中主體的形狀或姿勢。

沒有任何
沒有任何
沒有任何

使用 ControlNet 和類似的提示,很容易複製 Ugleh 的作品,其他人也這樣做了,達到了有趣的效果,包括棋盤動漫人物、動畫、中世紀村莊“山羊”(工作起來非常安全中世紀村莊版本的“女孩”帶著珍珠耳環。”

儘管受到了廣泛關注,也有很多人提出將藝術品轉化為 NFT,但 Ugleh 目前選擇保持低調。在X上,他:“我感謝所有對人工智能藝術的積極反饋,我不打算從我的最新世代中賺錢,我也不會做任何官方採訪。我只是一個普通的精通技術的人工智能迷,嘗試了一種新的 ControlNet 技術。”

如果您想嘗試 ControlNet,該網站有一個很好的教程。此外,Ugleh 在 Imgur 上發布了分步工作流程,包括螺旋和棋盤模板文件。

雖然這件藝術品非常出色,但美國現行版權政策規定,這些圖像不符合版權保護的標準,因此從技術上講,它們屬於公共領域。雖然人工智能生成的藝術作品在道德和法律方面對許多人來說仍然是一個有爭議的話題,但愛好者們仍在繼續突破不熟練或未經訓練的從業者使用這些新工具的可能性界限。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *