©Elke Mayr
Ein KI Start-up aus dem Schwarzwald kann es mit den großen Playern auf dem Markt aufnehmen. Mit ihrem Bildgenerator „FLUX.1“ machen Black Forest Labs DALL-E 3 oder Midjourney echte Konkurrenz.
Black Forest Labs wurde 2024 gegründet und hat seinen Hauptsitz in Freiburg im Breisgau.
Das Startup hat sich der generativen KI verschrieben und will hochmoderne generative Deep-Learning-Modelle für Bilder und Videos entwickeln und vorantreiben; dabei sollen die „Grenzen der Kreativität, Effizienz und Vielfalt neu definiert werden“, wie es auf der Unternehmensseite heißt.
„Wir glauben, dass generative KI ein grundlegender Baustein aller zukünftigen Technologien sein wird. Indem wir unsere Modelle einem breiten Publikum zugänglich machen, wollen wir ihre Vorteile allen zugänglich machen, die Öffentlichkeit aufklären und das Vertrauen in die Sicherheit dieser Modelle stärken.“
So verwundert es nicht, dass ein Modell von FLUX.1 als frei zugängliches und kostenloses Open Source Modell zur Verfügung steht.
Wer hat Black Forest Labs gegründet?
Die Gründer von Black Forest Labs sind Robin Rombach, Patrick Esser und Andreas Blattmann. Die drei KI-Experten waren auch bei der Entwicklung des KI-Tools Stable Diffusion maßgeblich involviert.
Heute besteht das Team von Black Forest Labs aus 15 Mitarbeitenden.
Wie finanziert sich Black Forest Labs?
Black Forest Labs hat erfolgreich eine Series Seed Finanzierungsrunde in Höhe von 31 Millionen US-Dollar abgeschlossen.
Unter den Investoren waren die private amerikanische Wagniskapitalfirma Andreessen Horowitz und Angel-Investoren wie Brendan Iribe, Michael Ovitz, Garry Tan, Timo Aila und Vladlen Koltun sowie weitere renommierte Experten in der KI-Forschung und Unternehmensgründung. Folgeinvestitionen kamen von General Catalyst und MätchVC.
FLUX.1 und SOTA – die Produkte von Black Forest Labs
Das Flaggschiff-Produkt von Black Forest Labs ist die FLUX.1 Modellfamilie, eine Suite von Text-zu-Bild-Modellen, die neue Maßstäbe in Bilddetails, Prompt-Präzision, Stilvielfalt und Szenenkomplexität setzt. Die FLUX.1 Modelle sind in drei Varianten erhältlich:
FLUX.1 [pro]: Bietet die beste Leistung in der Bildgenerierung mit höchster visueller Qualität und Vielfalt
FLUX.1 [dev]: Ein offenes Modell für nicht-kommerzielle Anwendungen, das ähnliche Qualität wie FLUX.1 [pro] bietet, jedoch effizienter ist
FLUX.1 [schnell]: Das schnellste Modell, optimiert für lokale Entwicklung und den persönlichen Gebrauch
Alle FLUX.1 Modelle basieren auf einer hybriden Architektur von multimodalen und parallelen Diffusionstransformator-Blöcken und haben 12 Milliarden Parameter. Diese Modelle übertreffen aktuelle State-of-the-Art-Diffusionsmodelle
SOTA
Neben der Veröffentlichung der FLUX.1 Text-zu-Bild-Modelle plant Black Forest Labs die Einführung einer Suite von generativen Text-zu-Video-Systemen mit dem Namen SOTA. Dieses Tool soll Video-Content in hoher Auflösung und beispielloser Geschwindigkeit erstellen. Ein Release Datum steht noch nicht fest; es wird aber davon ausgegangen, dass die Veröffentlichung bald stattfinden wird.
Wie kann ich FLUX.1 nutzen?
Wer das KI-Tool kostenlos ausprobieren möchte, der kann das unter anderem via Replicate tun.
Ansonsten sind die Tools auch über Huggingface (lesen Sie hier "Was ist Huggingface?") und Github zugänglich.
Wie die meisten KI-Bildtools lässt sich Flux via Prompts, sehr intuitiv bedienen.
Vergleich: Welche Vorteile bietet FLUX.1 im Vergleich zu anderen Text-to-Image-Modellen?
Nach eigenen Angaben sollen die FLUX.1 Modelle Tools wie Midjourney oder DALL-E in pucto Qualität, Geschwindigkeit oder auch Vielfalt übertreffen.
Eine Übersicht:
Bildqualität und Detailgenauigkeit
Erweiterte Bildqualität: FLUX.1 erzeugt visuell beeindruckende Bilder mit hoher Auflösung und Detailgenauigkeit
Fortschrittliche menschliche Anatomie und Fotorealismus: Das Modell ist besonders gut in der Lage, realistische und anatomisch korrekte Bilder zu erzeugen, was bei anderen Modellen oft eine Herausforderung darstellt
Prompt-Präzision
Genauigkeit der Ausgabe: FLUX.1 zeigt eine bemerkenswerte Fähigkeit, Eingabeaufforderungen präzise in visuelle Darstellungen umzusetzen
One-Shot- Technologie: Das Modell kann Bilder aus einer einzigen Eingabeaufforderung ohne die Notwendigkeit tiefgehender Verfeinerungen erstellen, was es von vielen Modellen unterscheidet, bei denen es oft mehrere Anpassungen bedarf
Geschwindigkeit und Effizienz
Schnellere Bildgenerierung: Die FLUX.1 [schnell] Variante erzeugt Bilder etwa zehnmal schneller als die FLUX.1 [pro] Variante.
Effiziente Verarbeitungstechniken: FLUX.1 nutzt innovative Methoden wie Flow Matching und rotatorische Positions-Einbettungen, die sowohl die Leistung als auch die Hardware-Effizienz verbessern und so zu schnelleren Verarbeitungszeiten und einer größeren Vielfalt der Ausgaben beitragen
Hybride Architektur
Multimodale und parallele Diffusionstransformator-Blöcke: Die hybride Architektur von FLUX.1 kombiniert multimodale und parallele Diffusionstransformator-Blöcke, die zu einer verbesserten visuellen Darstellung und Detailgenauigkeit führen
12 Milliarden Parameter: Mit einer beeindruckenden Anzahl von 12 Milliarden Parametern ist FLUX.1 eines der größten und leistungsfähigsten offenen Modelle seiner Art, was zu einer herausragenden Bildqualität und Detailgenauigkeit beiträgt