OpenAI DALL-E 2 は、想像できるあらゆるものの画像をレンダリングできます

OpenAI DALL-E 2 は、想像できるあらゆるものの画像をレンダリングできます

OpenAI DALL-E 2 人工知能は、あなたの想像力によるテキストの説明に基づいて漫画の画像を作成します。

2021 年 1 月、イーロン・マスク氏が設立し、マイクロソフト社が資金提供した OpenAI コンソーシアムは、これまでで最も野心的なプロジェクトである DALL-E 機械学習システムを発表しました。この独創的なマルチモーダル人工知能は、ユーザーが指定したキーワードのみに基づいて漫画風の画像を生成することができました。最近では、コンソーシアムは、以前のものよりも高解像度で低遅延の新しいバージョンの DALL-Eを導入しました。

人工知能 OpenAI DALL-E 2 が漫画の画像を作成

DALL-E (Dalie と Wall-E の略) の最初のバージョンでは、画像を生成し、複数の画像を組み合わせてコラージュを作成したり、さまざまな角度を提案したり、簡単な記述から影の効果などの画像要素の数を推測したりすることもできました。 。

「入力を細部に至るまで明確に指定する必要がある 3D レンダラーとは異なり、DALL-E は、タイトルが画像に明示的に記載されていない特定の詳細が含まれていることを暗示している場合に、多くの場合「ギャップを埋める」ことができます」とチームは説明しました。2021 年には AI をオープンにします。

DALL-E は商用製品になることを意図したものではなかったため、OpenAI チームは DALL-E を研究ツールとしてのみ考えていたため、その機能は限られていました。また、Microsoft が Tay チャットボットで経験した、システムが虚偽の情報を生成できないという状況を避ける必要もありました。この 2 番目のバージョンでも、目標は同じであり、人工知能によって作成されたことを明確に示すために画像に透かしが追加されています。さらに、システムはユーザーが固有名を持つ画像を作成することを禁止しています。

あなたの想像から得られたテキストの説明によると

OpenAI CLIP 画像認識システムを使用する DALL-E 2 は、その画像生成機能を使用します。ユーザーは、既存の画像の特定の領域を選択して編集したり、影とともに要素を追加または削除したり、2 つの画像を 1 つのコラージュに結合したり、既存の画像のバリエーションを作成したりできるようになりました。生成された画像は 1024 ピクセルの正方形になりましたが、元のアバターは 256 ピクセルでした。CLIP は、人間が理解できる方法で画像の内容を要約するように設計されました。コンソーシアムは、彼の説明から画像を作成することで、このプロセスを逆転させました。

「DALL-E 1は言語に対するGPT-3アプローチを採用し、それを画像の作成に適用しました。私たちは画像を一連の単語に圧縮し、次に何が起こるかを予測することを学びました」と研究者のプラフラ・ダリワル氏はザ・ロッドに説明した。

OpenAI サイトで誰もがプレイできた最初のバージョンとは異なり、このバージョン 2 は現在特定のパートナーのみが利用でき、パートナー自身もできることは限られています。幸運な少数の人だけがそれを使用できます。また、サードパーティのプラットフォームで作成された画像をエクスポートすることもできませんが、OpenAI は将来的に API 経由で DALL-E 2 の新機能を利用できるようにする予定です。それでもシステムを試したい場合は、待機リストに参加できます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です