©Elke Mayr
OpenAI, das Unternehmen hinter einigen der fortschrittlichsten KI-Technologien, hat angekündigt, dass sein neuester Durchbruch, der Sora Text-zu-Video-Generator, noch in diesem Jahr für die Öffentlichkeit zugänglich gemacht wird. Sora, das hyperrealistische Szenen basierend auf Texteingaben erstellen kann, wurde erstmals im Februar vorgestellt und war bisher nur für visuelle Künstler, Designer und Filmemacher verfügbar.
Öffentliche Verfügbarkeit von Sora
In einem Interview mit dem Wall Street Journal teilte Mira Murati, Chief Technology Officer von OpenAI, mit, dass Sora "dieses Jahr" und möglicherweise "in ein paar Monaten" allgemein verfügbar sein wird. Dies ist eine aufregende Entwicklung für alle, die an der Schnittstelle von Kreativität und Technologie arbeiten, da sie die Möglichkeit bietet, mit der KI neue Formen visueller Inhalte zu erstellen.
Erweiterung der Funktionalität
OpenAI plant, Sora um Audiofunktionen zu erweitern, um die generierten Szenen noch realistischer zu gestalten. Darüber hinaus möchte das Unternehmen den Nutzern die Möglichkeit geben, die Inhalte der von Sora produzierten Videos zu bearbeiten, da KI-Tools nicht immer detailgetreue Bilder erstellen.
Trainingsdaten und Partnerschaften
Auf die Frage nach den Daten, mit denen Sora trainiert wurde, gab Murati keine spezifischen Details preis und wich der Frage aus. Sie bestätigte jedoch, dass Sora Inhalte von Shutterstock verwenden würde. Mit dem Bilderdienst ging OpenAI eine Partnerschaft ein.
Kosten und Herausforderungen
Murati erwähnte auch, dass Sora "viel teurer" im Betrieb ist als andere KI-Modelle des Unternehmens, wie zum Beispiel DALL-E, das AI Text-zu-Bild-Modell. OpenAI ist bestrebt, das Tool zu ähnlichen Kosten wie DALL-E anzubieten, wenn es öffentlich zugänglich gemacht wird.
Bedenken hinsichtlich Fehlinformationen
Mit der Annäherung an die Präsidentschaftswahlen 2024 gibt es Bedenken hinsichtlich generativer KI-Tools und ihrem Potenzial, Fehlinformationen zu erzeugen. Diese Bedenken sind besonders relevant, da die Technologie immer realistischere Inhalte produzieren kann.
Was ist Sora?
Sora ist ein KI-gestütztes Modell, das in der Lage ist, aus Texteingaben Videos von bis zu einer Minute Länge zu erstellen. Diese Videos können detaillierte Szenen, komplexe Kamerabewegungen und mehrere Charaktere mit lebendigen Emotionen umfassen. Sora versteht nicht nur die Anforderungen im Text, sondern auch, wie diese Elemente in der realen Welt existieren.
Wie funktioniert Sora?
Sora nutzt Diffusionsmodelle und Transformer-Architektur, ähnlich wie OpenAIs DALL-E für Text-zu-Bild-Generierung. Diese Technologie ermöglicht es Sora, geschriebene Beschreibungen in dynamische, hochwertige Videos umzuwandeln, indem sie ein tiefes Verständnis für Sprachmodelle und die Fähigkeit, Sätze in imaginative Szenenfolgen zu verwandeln, kombiniert.
Key Take-Aways
OpenAI wird seinen Sora Text-zu-Video-Generator, der hyperrealistische Szenen erstellen kann, noch in diesem Jahr für die Öffentlichkeit zugänglich machen.
Das Unternehmen plant, Audiofunktionen hinzuzufügen und den Nutzern die Möglichkeit zu geben, die Inhalte zu bearbeiten, um die Genauigkeit und Realitätstreue zu erhöhen.
Trotz der hohen Betriebskosten von Sora strebt OpenAI an, das Tool zu ähnlichen Kosten wie das AI Text-zu-Bild-Modell DALL-E anzubieten
Über die Autoren
Roman Gaisböck
Leiter der VGN-Digital-Redaktionen. Digital Consultant. Co-Founder mehrerer Startups. Leidenschaftlicher Musiker.
Ann Kathrin Hermes
Ann Kathrin Hermes, Redakteurin trend.at, Senior Manager für strategisches PMO
Themenschwerpunkte: Digitalisierung, Künstliche Intelligenz (KI), Leadership, Strategie