OpenAI DALL-E 2 kann Bilder von allem rendern, was Sie sich vorstellen können

OpenAI DALL-E 2 kann Bilder von allem rendern, was Sie sich vorstellen können

Die künstliche Intelligenz OpenAI DALL-E 2 erstellt Cartoon-Bilder basierend auf einer Textbeschreibung Ihrer Fantasie.

Im Januar 2021 stellte das von Elon Musk gegründete und von Microsoft finanzierte OpenAI-Konsortium sein bislang ehrgeizigstes Projekt vor, das maschinelle Lernsystem DALL-E. Diese geniale multimodale künstliche Intelligenz war in der Lage, Bilder im Cartoon-Stil zu generieren, die nur auf vom Benutzer angegebenen Schlüsselwörtern basierten. Vor Kurzem stellte das Konsortium eine neue Version von DALL-E mit höherer Auflösung und geringerer Latenz als die vorherige vor.

Künstliche Intelligenz OpenAI DALL-E 2 erstellt Cartoon-Bilder

Die erste Version von DALL-E (kurz für Dalie und Wall-E) konnte Bilder erzeugen und mehrere Bilder zu einer Collage kombinieren, verschiedene Blickwinkel vorschlagen und sogar eine Reihe von Bildelementen – wie Schatteneffekte – aus einer einfachen schriftlichen Beschreibung erraten .

„Im Gegensatz zu einem 3D-Renderer, dessen Eingabe bis ins kleinste Detail eindeutig spezifiziert werden muss, kann DALL-E oft ‚die Lücken füllen‘, wenn der Titel impliziert, dass das Bild bestimmte Details enthält, die nicht explizit angegeben sind“, erklärte das Team. Offene KI im Jahr 2021.

DALL-E war nie als kommerzielles Produkt gedacht, daher waren seine Fähigkeiten begrenzt, da das OpenAI-Team es nur als Forschungstool betrachtete. Es galt auch zu vermeiden, dass Microsoft mit seinem Tay-Chatbot eine Situation hatte und das System keine falschen Informationen generieren konnte. Bei dieser zweiten Version bleiben die Ziele dieselben und dem Bild wurde ein Wasserzeichen hinzugefügt, um deutlich zu machen, dass es durch künstliche Intelligenz erstellt wurde. Darüber hinaus verbietet das System Benutzern nun das Erstellen von Bildern mit Eigennamen.

nach einer Textbeschreibung, die Ihrer Fantasie entstammt

DALL-E 2, das das OpenAI CLIP-Bilderkennungssystem verwendet, nutzt dessen Bilderzeugungsfunktionen. Benutzer können jetzt bestimmte Bereiche vorhandener Bilder auswählen und bearbeiten, Elemente zusammen mit ihren Schatten hinzufügen oder entfernen, zwei Bilder zu einer Collage zusammenführen und Variationen eines vorhandenen Bildes erstellen. Die generierten Bilder sind jetzt Quadrate mit 1024 Pixeln, während die ursprünglichen Avatare 256 Pixel groß waren. CLIP wurde entwickelt, um den Inhalt eines Bildes so zusammenzufassen, dass er für einen Menschen verständlich ist. Das Konsortium kehrte den Prozess um, indem es aus seiner Beschreibung ein Bild erstellte.

„DALL-E 1 nutzte unseren GPT-3-Ansatz zur Sprache und wandte ihn an, um ein Bild zu erstellen: Wir komprimierten Bilder in eine Reihe von Wörtern und lernten, vorherzusagen, was als nächstes passieren würde“, erklärte Forscherin Prafulla Dhariwal gegenüber The Rod.

Im Gegensatz zur ersten Version, mit der jeder auf der OpenAI-Seite spielen konnte, steht diese Version 2 derzeit nur bestimmten Partnern zur Verfügung und diese selbst sind in ihren Möglichkeiten eingeschränkt. Nur wenige Glückliche haben die Möglichkeit, es zu nutzen. Sie können auch keine Bilder exportieren, die auf einer Plattform eines Drittanbieters erstellt wurden, obwohl OpenAI plant, die neuen Funktionen von DALL-E 2 in Zukunft über eine API verfügbar zu machen. Wenn Sie das System dennoch ausprobieren möchten, können Sie sich in die Warteliste eintragen .

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert