Homestaging KI
Anna Staging
3.2.2023
7 Min. Lesezeit

LoRA und Flux: Neue Technologien zur KI-Bilderzeugung

Erfahren Sie mehr über LoRA und Flux, zwei bahnbrechende KI-Technologien, die die Welt der Bilderzeugung revolutionieren. Entdecken Sie die Vorteile und Anwendungen dieser neuen Techniken.

LoRA
Flux
KI-Bilderzeugung
KI-Modelle
Technologie
Black Forest Labs
Stability AI

LoRA und Flux: Neue Technologien zur KI-Bilderzeugung

In der Welt der künstlichen Intelligenz (KI) hat sich in den letzten Jahren vieles getan. Zwei der aufregendsten Entwicklungen sind sicherlich die neuen KI-Modelle LoRA und Flux. Diese Technologien haben das Potenzial, die Bilderzeugung und -bearbeitung grundlegend zu verändern. Doch was genau sind LoRA und Flux? Und wie funktionieren sie?

Was ist LoRA?

LoRA steht für Low-Rank Adaptations. Es handelt sich hierbei um kleinere KI-Modelle, die speziell dafür entwickelt wurden, auf spezialisierte Aufgaben optimiert zu werden. Mit ihrer Hilfe können große Modelle effizient angepasst und verbessert werden, ohne dass dafür enorme Rechenressourcen notwendig sind.
HomestagingKIEin Bild, das ein LoRA-Modell in Aktion zeigt.

Was ist Flux?

Flux ist ein hochmodernes KI-Modell zur Bilderzeugung, entwickelt von Black Forest Labs. Es kombiniert Transformator- und Diffusionstechniken und kann auf bis zu 12 Milliarden Parameter skaliert werden. Mit dieser hybriden Architektur bietet es eine erstklassige Promptheit, visuelle Qualität, Bilddetails und Ausgabevielfalt.
Die Entwicklung von Flux kann als bedeutender Fortschritt in der KI-generierten Kunst angesehen werden. Black Forest Labs, gegründet von den ursprünglichen Schöpfern der Stable Diffusion-Modelle, hat Flux als eine Weiterentwicklung vorgestellt. Die bekanntesten Vorgängermodelle wie Stable Diffusion XL und Stable Video Diffusion haben bereits die Bild- und Videogenerierung revolutioniert. Black Forest Labs

Wie funktioniert Flux?

Flux basiert auf einem transformatorbetriebenen Strömungsmodell. Die öffentliche Version von FLUX.1 verwendet eine hybride Architektur aus multimodalen und parallelen Diffusionstransformatorblöcken. Diese Architektur verbessert die bisherigen State-of-the-Art-Diffusionsmodelle durch die Einbeziehung von Flow-Matching, einer Methode, die die Generierung hochauflösender Bilder aus Textbeschreibungen ermöglicht.
Zusätzlich zur leistungsstarken Bilderzeugung verbessert Flux die Hardware-Effizienz und die Modellleistung durch rotierende p-Embold-Prädiktoren. Dies ermöglicht eine schnellere und effizientere Bildsynthese. Eine detaillierte Beschreibung dieser Technik findet man im Papier Scaling Rectified Flow Transformers for High-Resolution Image Synthesis das im Juli 2024 auf der ICML in Wien vorgestellt wurde.

Verbesserte Beschriftungen

OpenAI hat gezeigt, dass synthetisch erzeugte Bildunterschriften die Leistung von Text-Bild-Modellen deutlich verbessern können.

Neue Modellarchitektur

Ein neuartiges Diffusions-Backbone auf Basis multimodaler Transformer, genannt MM-DiT, verbessert die Leistung gegenüber bisherigen Modellen.

Effizientes Training

Das Team von Black Forest Labs hat ein innovatives Zeitschritt-Sampling für das Training rektifizierter Flüsse vorgeschlagen.

Zusammenfassend lässt sich sagen:

Die Technologien LoRA und Flux bieten enorme Fortschritte in der KI-Bilderzeugung. Während LoRA eine effizientere Adaptation und Anpassung ermöglicht, hebt Flux die Bilderzeugung durch seine hybride Architektur und neuartigen Techniken auf ein neues Niveau. Diese Modelle demonstrieren eindrucksvoll, wie weit die Entwicklung in der KI-gestützten Kunst bereits fortgeschritten ist. HomestagingKi