Trend Logo

DALL-E: Bilder aus Text erstellen mit künstlicher Intelligenz

Subressort
Aktualisiert
Lesezeit
8 min
Dall-e auf einem Laptop geöffnet
Dall-e auf einem Laptop geöffnet©Elke Mayr
  1. home
  2. Business
  3. Business Tools

Das KI-Tool aus dem Hause OpenAI kann aus Textbeschreibungen Bilder generieren. Wie überzeugend sind die Resultate? Wie werden sie erstellt? Und wem gehören die Bilder?

von

Was ist DALL-E bzw. DALL-E 2?

DALL-E ist eine von OpenAI entwickelte KI-Anwendung, die künstliche Intelligenz einsetzt, um aus einem geschriebenen Satz ein Bild zu generieren.
DALL-E wurde im Jänner 2021 von OpenAI veröffentlicht, der Nachfolger DALL-E 2 erschien 2022.

Welche Technik steckt hinter DALL-E?

Wie lässt sich ein Satz oder auch nur einzelne Stichwörter in ein Bild verwandeln? Das KI-Unternehmen beschreibt auf seinem Blog den Vorgang wie folgt: "Der dahinterliegende Prozess heißt 'Diffusion'. Ausgehend von einem Muster, das aus zufälligen Punkten besteht, entsteht allmählich ein Bild, sobald das Programm bestimmte Aspekte des Bildes erkennt." Das Programm wurde vorab mit einer Vielzahl an Bildern trainiert. Jedes Bild wurde entsprechend mit dem passenden Begriff versehen. Im Video können Sie nachvollziehen, wie die KI trainiert wurde.

DALL-E2 erklärt

Wie funktioniert DALL-E? Bilder erstellen mit der OpenAI-Software

Einer der Gründe, warum der Bildgenerator so beliebt ist - das Tool kann lässt sich einfach bedienen. Nachfolgend eine Schritt für Schritt Anleitung, wie Sie DALL-E nutzen können.

  • Erstellen Sie einen kostenlosen OpenAI Account. Gehen Sie dazu auf die Website von OpenAI und klicken Sie auf „Sign up“

Blurred image background

Die Website von OpenAI

 © Screenshot/ChatGPT
  • Geben Sie eine E-Mail Adresse sowie eine Telefonnummer an und bestätigen Sie Ihre Anmeldung.

Blurred image background

In wenigen Klicks kann man sich einloggen

 © Screenshot/ChatGPT

Sollten Sie bereits einen OpenAI Account haben, können Sie diesen Schritt vernachlässigen.

  • Nachdem Sie einen Account angelegt und aktiviert haben, rufen Sie direkt die Website des Tools DALL-E auf.

  • Nun gibt es verschiedene Ansätze, das Tool auszuprobieren. Für all jene, die nicht von der kreativen Muse geküsst wurden, empfiehlt sich der Button "Suprise me" - überrasche mich. DALL-E generiert daraufhin eine Textbeschreibung, sowie das passende Bild. Sie können aber auch ein Bild hochladen und das Programm - über das Eingabefeld - auffordern, das Bild nach Ihren Vorstellungen zu bearbeiten. Die dritte Option ist wohl die populärste: Geben Sie ihren Prompt direkt in das Eingabefeld ein und lassen Sie ein Bild erstellen.

Blurred image background

Die Eingabemaske bei DALL-E

 © Screenshot/DALL-E/OpenAI

Was ist ein Prompt?

Sehr einfach formuliert: Ein Prompt ist jene Information, die Sie einer KI geben, damit sie das tut, was Sie von ihr wollen.

  • Prompts sind Grundlage aller KI-Tools

  • Die Qualität eines Prompts definiert die Qualtiät des Resultats. Heißt: Je präziser der Prompt formuliert wird, desto hochwertiger und exakter ist der Output, den die KI liefert.

Einen ausführlichen Artikel zu "Prompts - Was ist das und wie schreibe ich gute Prompts?" lesen Sie hier

Prompt-Tipps für DALL-E & DALL-E 2

  • In DALL-E können Sie bis zu 400 Zeichen eingeben

  • Beschreiben Sie das Motiv so detailliert wie möglich

  • Inkludieren Sie auch eine Beschreibung des Hintergrunds bzw. der Umgebung

  • Definieren Sie einen bestimmten Stil, den Sie dem Bild verleihen wollen. Beispielsweise: Ölgemälde, minimalistisch, Retro, 3D-Illustration etc.

  • Definieren Sie die Stimmung, die das Bild ausstrahlen soll

  • DALL-E erstellt im Anschluss vier Bilder. Diese lassen sich durch ein einfaches Klicken vergrößern (1024px x 1024px), sowie herunterladen

Blurred image background

Beispiele für von DALL-E generierte Bilder

 © Screenshot/DALL-E/OpenAI

Das Programm kann auch weitere Variationen eines Bildes generieren. Nachdem DALL-E Bilder erstellt hat, klicken Sie auf "Variations".

Bilder & Fotos editieren

Fotos und Bilder lassen sich mit DALL-E 2 nun auch bearbeiten. Durch das Klicken auf "Edit" lassen sich weitere quadratische Elemente hinzufügen, neue Prompts formulieren oder bestimmte Ausschnitte entfernen.

Eine ausführliche Beschreibung der Prozesse sind auf dem Blog von OpenAI zu finden.

Wieviel kostet DALL-E bzw. DALL-E 2 ?

DALL-E ist nicht ganz gratis. Wie auch bei anderen Funktionen, wird bei DALL-E bzw. DALL-E 2, jede Eingabeaufforderung - die durch das Klicken auf "Generate" ausgelöst wird - von Ihrem Guthaben abgezogen. Sie verfügen zu Beginn über 15 Credits im Monat. Eine Bilderstellung kostet jeweils einen Credit. Sollten Sie mehr Credits benötigen, müssen Sie diese erwerben. 115 Credits kosten 15 US-Dollar.

Regeln bei der Benutzung von DALL-E

OpenAI veröffentlichte eine content policy für ihre Produkte. So sollen die Ergebnisse jugendfrei sein; Bilder zu politischen oder kontroversen Themen sind verboten, sowie die Verwendung von vermeintlich harmlosen Bildern, die jedoch für "gesellschaftsschädigende Zwecke" eingesetzt werden.

Zudem ist es untersagt, Prompts zu verfassen, die Personen des öffentlichen Lebens beinhalten.

Die ausführliche Liste können Sie auf dem Blog von OpenAI lesen.

OpenAI formuliert zudem drei Punkte, die die Rechte anderer wahren sollten:

  • "Laden Sie keine Bilder von Personen ohne deren Zustimmung hoch.

  • Laden Sie keine Bilder hoch, für die Sie nicht die entsprechenden Nutzungsrechte besitzen.

  • Erstellen Sie keine Bilder von Personen des öffentlichen Lebens."

Copyright - Wem gehören die Bilder?

Aktuell beansprucht OpenAI das Urheberrecht für alle mit DALL-E bzw. DALL-E 2 erstellten Bilder.

Zudem müssen diese Bilder mit einem DALL-E und OpenAI Copyright versehen werden; sie dürfen nicht als Ihre eigene Arbeit ausgegeben werden. Hinweis: Das Wasserzeichen in der unteren rechten Ecke des Bildes fungiert auch als Copyright - und wird als "DALL-Es Unterschrift" bezeichnet.

Rechtlicher Graubereich

Eine definitive Antwort in puncto Urheberrecht ist aktuell nicht zu finden; da hier noch im Graubereich agiert wird. So gibt es die eine Seite, die den Standpunkt vertritt, dass das Urheberrecht am Output der KI dem Programmierer derselben zukommen sollte. Die andere Seite vertritt die Ansicht, dass der Inputgeber/Prompt-Engineer, also jemand der der KI einen Auftrag zum Generieren von Content gibt, zum Urheber wird, weil auch im Akt des Auftrages eine "eigentümliche geistige Schöpfung" gesehen werden kann.

Es darf aber davon ausgegangen werden, dass aufgrund der hohen Popularität der Tools, die Judikatur in absehbarer Zeit die ersten Leitplanken in dieser Hinsicht vorgeben wird.

Alternativen zu DALL-E

Fazit

DALL-E ist einfach zu bedienen, gut zugänglich und de facto selbsterklärend. Das Tool ist in der Lage die verschiedensten Objekte, Konzepte und Stile zu kombinieren. Schwächen zeigen sich bisher noch in der Darstellung von menschlichen Gesichtern, realistischen Darstellungen oder komplexer Szenen. Zudem spielt auch hier - wie bei den meisten KI-Tools - der Algorithmic bias eine Rolle. Bilder werden in Sachen Hautfarbe, Nationalitäten etc. wenig vielfältig dargestellt.

DigitalKünstliche Intelligenz

Über die Autoren

Logo
Jetzt trend. ab € 14,60 im Monat abonnieren!