AI が生成した夢のような幾何学的なシーンがソーシャル メディア ユーザーを魅了

AI が生成した夢のような幾何学的なシーンがソーシャル メディア ユーザーを魅了

日曜日、「Ugleh」という名前の Reddit ユーザーが、AI が生成したらせん状の中世の村の画像を投稿し、その驚くべき幾何学的性質によりソーシャル メディアで急速に注目を集めました。フォローアップの投稿はさらに賞賛を集め、そのツイートには 145,000 を超える「いいね!」が付きました。Ugleh 氏は、安定拡散と ControlNet と呼ばれる誘導技術を使用して画像を作成しました。

このアートワークに対するオンラインでの反応は、驚きや驚きから、生成 AI アートで新しいものを開発したことへの敬意まで多岐にわたりました。「こんな写真は見たことがない。アートの世界に何か新しいことがある」と、ある X ユーザーは書きました。「ところで、私はたくさんの AI アートを見てきましたし、この空間に長い間滞在していましたが、これは私が今まで見た中で最も素晴らしい作品の 1 つです。とても上手にできました」とAIアーティストのカリ・ユガはXに書いた。

おそらく最も注目に値するのは、Y-Combinator の共同創設者であり、頻繁にソーシャル メディア技術評論家を務めるポール グレアム氏が、「これが、AI によって生成されたアートが私にとってチューリング テストに合格した点です。」と書いています。

なし
なし
なし
なし
なし

もちろん、一部の X ユーザーがAI によって生成された螺旋村の構成要素を分解しようとしたことに、誰もが感銘を受けたわけではありません。「それは素晴らしいことですが、人間では下せない決断もたくさんあります」とグラフィックデザイナーのトレントは書いている。「多くの影は正しくありませんし、窓のすぐ上に煙突を置くのは意味がありません。そこにズームインすると、AI アートの特徴的なノイズ パターンも確認できます。」

6 月には、AI 画像合成モデル Stable Diffusion と ControlNet を使用して、アニメからインスピレーションを得たアートなどの豊かなアートワークのように見える QR コードを作成するテクニックを取り上げましたUgleh は、QR コード (それ自体が幾何学的形状です) を作成するために最適化された同じニューラル ネットワークを使用し、代わりにスパイラルとチェッカーボード パターンの単純な画像を入力しました。

「交通量の多い通りと遠くに城がある中世の村のシーン(傑作: 1.4)、(最高品質)、(詳細) 」というプロンプトに従って、ControlNet は画像の芸術的要素がらせんの知覚的な形状と一致するシーンをレンダリングし、市松模様。ある画像では、雲が頭上で弧を描き、人々は螺旋の誘導に合わせて緩やかな曲線を描いて立っています。別の写真では、正方形の雲、生け垣、建物の面、荷車が市松模様の風景を構成しています。

ControlNet の魔法

では、どのように機能するのでしょうか? 安定拡散についてはこれまでに頻繁に取り上げてきました。これは、インターネットから収集した何百万もの画像でトレーニングされたニューラル ネットワーク モデルです。しかし、ここで重要なのは ControlNet です。これは、2023 年 2 月に Lvmin Zhang 氏、Anyi Rao 氏、Maneesh Agrawala 氏による「 Adding Conditional Control to Text-to-Image Diffusion Models 」というタイトルの研究論文で初めて登場し、安定版拡散ですぐに人気になりました。コミュニティ。

通常、安定拡散イメージは、テキスト プロンプト (text2image と呼ばれる) またはイメージ プロンプト (img2img) を使用して作成されます。ControlNet では、姿勢検出、深度マッピング、法線マッピング、エッジ検出などを含む、ソース イメージから抽出された情報の形式をとる追加のガイダンスが導入されています。ControlNet を使用すると、AI アートワークを生成する人は、画像内の被写体の形状やポーズをより厳密に複製できます。

なし
なし
なし

ControlNet や同様のプロンプトを使用すると、Ugleh の作品を簡単に複製できます。チェッカーボードのアニメ キャラクターアニメーション、中世の村「ヤギ」 (驚くほど安全に作業できます)、中世の村バージョンの「少女」など、他の人も面白い効果をもたらしています。真珠のイヤリングと一緒に。」

大きな注目とアートワークをNFTに変えるという多くのオファーにもかかわらず、Uglehは今のところ目立たないようにすることを選択しました。Xについて、彼は次のように述べた。「AIアートに対するすべての肯定的なフィードバックに感謝します。私は最新世代からお金を稼ぐつもりはなく、公式インタビューも受けるつもりはありません。私は、新しい ControlNet 技術を実験した、テクノロジーに精通した普通の AI オタクです。」

ControlNet を試してみたい場合は、このサイトに優れたチュートリアルがあります。また、Ugleh は、スパイラルとチェッカーボードのテンプレート ファイルを含む、ステップバイステップのワークフローをImgur に投稿しました。

アートワークは注目に値しますが、現在の米国の著作権政策によれば、画像は著作権保護を受けるための基準を満たしていないため、技術的にはパブリック ドメインにあります。AI によって生成されたアートワークは、依然として倫理的および法的な理由で多くの人にとって議論の対象となっていますが、愛好家たちは、これらの新しいツールを使用して、未熟練または訓練を受けていない実践者が可能なことの限界を押し広げ続けています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です