Das KI-Tool aus dem Hause OpenAI kann aus Textbeschreibungen Bilder generieren. Wie überzeugend sind die Resultate? Wie werden sie erstellt? Und wem gehören die Bilder?
- Was ist DALL-E bzw. DALL-E 2?
- Welche Technik steckt hinter DALL-E?
- Wie funktioniert DALL-E? Bilder erstellen mit der OpenAI-Software
- Was ist ein Prompt?
- Bilder & Fotos editieren
- Wieviel kostet DALL-E bzw. DALL-E 2 ?
- Regeln bei der Benutzung von DALL-E
- Copyright - Wem gehören die Bilder?
- Alternativen zu DALL-E
- Fazit
Was ist DALL-E bzw. DALL-E 2?
DALL-E ist eine von OpenAI entwickelte KI-Anwendung, die künstliche Intelligenz einsetzt, um aus einem geschriebenen Satz ein Bild zu generieren.
DALL-E wurde im Jänner 2021 von OpenAI veröffentlicht, der Nachfolger DALL-E 2 erschien 2022.
Welche Technik steckt hinter DALL-E?
Wie lässt sich ein Satz oder auch nur einzelne Stichwörter in ein Bild verwandeln? Das KI-Unternehmen beschreibt auf seinem Blog den Vorgang wie folgt: "Der dahinterliegende Prozess heißt 'Diffusion'. Ausgehend von einem Muster, das aus zufälligen Punkten besteht, entsteht allmählich ein Bild, sobald das Programm bestimmte Aspekte des Bildes erkennt." Das Programm wurde vorab mit einer Vielzahl an Bildern trainiert. Jedes Bild wurde entsprechend mit dem passenden Begriff versehen. Im Video können Sie nachvollziehen, wie die KI trainiert wurde.
Wie funktioniert DALL-E? Bilder erstellen mit der OpenAI-Software
Einer der Gründe, warum der Bildgenerator so beliebt ist - das Tool kann lässt sich einfach bedienen. Nachfolgend eine Schritt für Schritt Anleitung, wie Sie DALL-E nutzen können.
Erstellen Sie einen kostenlosen OpenAI Account. Gehen Sie dazu auf die Website von OpenAI und klicken Sie auf „Sign up“
Geben Sie eine E-Mail Adresse sowie eine Telefonnummer an und bestätigen Sie Ihre Anmeldung.
Sollten Sie bereits einen OpenAI Account haben, können Sie diesen Schritt vernachlässigen.
Nachdem Sie einen Account angelegt und aktiviert haben, rufen Sie direkt die Website des Tools DALL-E auf.
Nun gibt es verschiedene Ansätze, das Tool auszuprobieren. Für all jene, die nicht von der kreativen Muse geküsst wurden, empfiehlt sich der Button "Suprise me" - überrasche mich. DALL-E generiert daraufhin eine Textbeschreibung, sowie das passende Bild. Sie können aber auch ein Bild hochladen und das Programm - über das Eingabefeld - auffordern, das Bild nach Ihren Vorstellungen zu bearbeiten. Die dritte Option ist wohl die populärste: Geben Sie ihren Prompt direkt in das Eingabefeld ein und lassen Sie ein Bild erstellen.
Was ist ein Prompt?
Sehr einfach formuliert: Ein Prompt ist jene Information, die Sie einer KI geben, damit sie das tut, was Sie von ihr wollen.
Prompts sind Grundlage aller KI-Tools
Die Qualität eines Prompts definiert die Qualtiät des Resultats. Heißt: Je präziser der Prompt formuliert wird, desto hochwertiger und exakter ist der Output, den die KI liefert.
Einen ausführlichen Artikel zu "Prompts - Was ist das und wie schreibe ich gute Prompts?" lesen Sie hier
Prompt-Tipps für DALL-E & DALL-E 2
In DALL-E können Sie bis zu 400 Zeichen eingeben
Beschreiben Sie das Motiv so detailliert wie möglich
Inkludieren Sie auch eine Beschreibung des Hintergrunds bzw. der Umgebung
Definieren Sie einen bestimmten Stil, den Sie dem Bild verleihen wollen. Beispielsweise: Ölgemälde, minimalistisch, Retro, 3D-Illustration etc.
Definieren Sie die Stimmung, die das Bild ausstrahlen soll
DALL-E erstellt im Anschluss vier Bilder. Diese lassen sich durch ein einfaches Klicken vergrößern (1024px x 1024px), sowie herunterladen
Das Programm kann auch weitere Variationen eines Bildes generieren. Nachdem DALL-E Bilder erstellt hat, klicken Sie auf "Variations".
Bilder & Fotos editieren
Fotos und Bilder lassen sich mit DALL-E 2 nun auch bearbeiten. Durch das Klicken auf "Edit" lassen sich weitere quadratische Elemente hinzufügen, neue Prompts formulieren oder bestimmte Ausschnitte entfernen.
Eine ausführliche Beschreibung der Prozesse sind auf dem Blog von OpenAI zu finden.
Wieviel kostet DALL-E bzw. DALL-E 2 ?
DALL-E ist nicht ganz gratis. Wie auch bei anderen Funktionen, wird bei DALL-E bzw. DALL-E 2, jede Eingabeaufforderung - die durch das Klicken auf "Generate" ausgelöst wird - von Ihrem Guthaben abgezogen. Sie verfügen zu Beginn über 15 Credits im Monat. Eine Bilderstellung kostet jeweils einen Credit. Sollten Sie mehr Credits benötigen, müssen Sie diese erwerben. 115 Credits kosten 15 US-Dollar.
Regeln bei der Benutzung von DALL-E
OpenAI veröffentlichte eine content policy für ihre Produkte. So sollen die Ergebnisse jugendfrei sein; Bilder zu politischen oder kontroversen Themen sind verboten, sowie die Verwendung von vermeintlich harmlosen Bildern, die jedoch für "gesellschaftsschädigende Zwecke" eingesetzt werden.
Zudem ist es untersagt, Prompts zu verfassen, die Personen des öffentlichen Lebens beinhalten.
Die ausführliche Liste können Sie auf dem Blog von OpenAI lesen.
OpenAI formuliert zudem drei Punkte, die die Rechte anderer wahren sollten:
"Laden Sie keine Bilder von Personen ohne deren Zustimmung hoch.
Laden Sie keine Bilder hoch, für die Sie nicht die entsprechenden Nutzungsrechte besitzen.
Erstellen Sie keine Bilder von Personen des öffentlichen Lebens."
Copyright - Wem gehören die Bilder?
Aktuell beansprucht OpenAI das Urheberrecht für alle mit DALL-E bzw. DALL-E 2 erstellten Bilder.
Zudem müssen diese Bilder mit einem DALL-E und OpenAI Copyright versehen werden; sie dürfen nicht als Ihre eigene Arbeit ausgegeben werden. Hinweis: Das Wasserzeichen in der unteren rechten Ecke des Bildes fungiert auch als Copyright - und wird als "DALL-Es Unterschrift" bezeichnet.
Rechtlicher Graubereich
Eine definitive Antwort in puncto Urheberrecht ist aktuell nicht zu finden; da hier noch im Graubereich agiert wird. So gibt es die eine Seite, die den Standpunkt vertritt, dass das Urheberrecht am Output der KI dem Programmierer derselben zukommen sollte. Die andere Seite vertritt die Ansicht, dass der Inputgeber/Prompt-Engineer, also jemand der der KI einen Auftrag zum Generieren von Content gibt, zum Urheber wird, weil auch im Akt des Auftrages eine "eigentümliche geistige Schöpfung" gesehen werden kann.
Es darf aber davon ausgegangen werden, dass aufgrund der hohen Popularität der Tools, die Judikatur in absehbarer Zeit die ersten Leitplanken in dieser Hinsicht vorgeben wird.
Alternativen zu DALL-E
Weitere KI-Bildgeneratoren zum Ausprobieren:
Fazit
DALL-E ist einfach zu bedienen, gut zugänglich und de facto selbsterklärend. Das Tool ist in der Lage die verschiedensten Objekte, Konzepte und Stile zu kombinieren. Schwächen zeigen sich bisher noch in der Darstellung von menschlichen Gesichtern, realistischen Darstellungen oder komplexer Szenen. Zudem spielt auch hier - wie bei den meisten KI-Tools - der Algorithmic bias eine Rolle. Bilder werden in Sachen Hautfarbe, Nationalitäten etc. wenig vielfältig dargestellt.