Die Welt der künstlichen Intelligenz hat in den letzten Jahren faszinierende Fortschritte gemacht, dies nicht nur m reinen Sprachbereich bei der Texterstellung, sondern auch im Bereich der Bildgenerierung. Bildgeneratoren wies wie Midjourney, Stable Diffusion und DALL-E 2 ermöglichen es uns, aus einfachen Textbeschreibungen beeindruckende Bilder zu erstellen, auch wenn man mitunter auch so seine Überraschungen bekommt. Mein Erachtens nach sind KI-generierte Bilder zumeist noch kein Ersatz für echte Fotos/Stockfotos, aber ich habe auch keinen Zweifel, dass dies sich in rasanten Tempo ändern wird. Man schaue sich nur Sora von OpenAI an.
Es gibt natürlich noch mehr Bildgeneratoren wie Midjourney, Stable Diffusion und DALL-E 2, so kann man auch mit Microsoft Designer KI-Kunst erstellen, aber man muss eine Auswahl treffen und die genannten gehören im Moment sicherlich mit zu den bekanntesten KI-basierten Bildgeneratoren.
Welcher dieser Lösungen jetzt für Dich und deine Anforderungen der Beste ist lässt ich nicht einfach beantworten, aber ein kurzer schneller Vergleich hilft vielleicht bei der ersten Orientierung und natürlich kann man sie auch einfach alle selber testen.
Midjourney
Midjourney ist primär über Discord zugänglich, was für viele Nutzer eine gewisse Eingewöhnungszeit bedeutet. Midjourney ist bekannt für seine künstlerischen und mitunter surrealistischen Ergebnisse. Die Bilder sind meist sehr detailreich und ästhetisch auch sehr ansprechend. Ein Pluspunkt von Midjourney ist auch die große Community, die sehr aktiv und kreativ ist und ständig neue Prompts und Techniken austauscht. Man kann hier also auch beim Thema Prompting viel lernen. Midjourney bietet verschiedene Preispläne für unterschiedliche Nutzungsintensitäten, kurzum: wie die meisten oder zumindest sehr KI-Tools kostet Midjourney Geld auf Abo-Basis, so ab 10 US$ ist man dabei. Midjourney gehört zu den Tools bei denen man nach den genauen Preis suchen muss, was ich perönlich gar nicht schätze.
Stable Diffusion
Stable Diffusion ist ein sehr netter Start in die Welt der KI-basierten Bildgeneratoren, da in der Regel alsals Open-Source-Version verfügbar, was einerseits eine hohe Flexibilität und Anpassbarkeit ermöglicht, andererseits auch keine Kosten.
Man kann mit Stable Diffusion Fotos/Bilder auf Basis von verschiedenen Stilen erzeugen, von fotorealistisch bis hin zu abstrakt und dies auch teils sehr detailliert und komplex.
Die Qualität kann teils durchaus beeindrucken, wie bei all diesen Tools bekommt man auch Seltsamkeiten, die man durch genauere Texteingaben, mitunter Negativ-Prompting meist aber korrigieren kann. Durch die Open-Source-Natur können Nutzer das Modell an ihre spezifischen Bedürfnisse anpassen.
DALL-E 2
DALL-E 2 stammt von OpenAI, also dem gleichen Anbieter, der auch für ChatGPT verantwortlich ist. DALL-E 2 kann wie ChatGPT in gewissem Umfang kostenlos genutzt werden, allerdings ist man bei den Möglichkeiten beschränkt, besonders im Hinblick auf der Anzahl der erzeugten Bilder. Wie ChatGPT bekommt man, anders ausgedrückt, schöpferische Pause geschenkt 😊
Natürlich kann man seine Nutzungszeiten auch ausdehnen, wenn man sich kostenpflichtige Modelle entscheidet. DALL-W 2 ist stark fokussiert auf fotorealistische Bilder und kann komplexe Szenen mit hoher Genauigkeit erzeugen. Qualitativ ein sehr hochwertiger, teils sehr realistischer Bildgenerator, der sicher noch besser wird im Laufe des Jahres, wenn man de aktuellen Entwicklungen bei OpenAI so verfolgt.
DALL-E 2 beinhaltet gewisse Sicherheitsmaßnahmen, um die Erstellung von schädlichen Inhalten zu verhindern.
Welchen Bildgenerator solltest du wählen?
Die Wahl des richtigen Bildgenerators hängt von deinen spezifischen Anforderungen ab: Gerade, wenn du einen künstlerischer Ausdruck suchst dann ist Midjourney eine gute Wahl.
Stable Diffusion bietet die größte Flexibilität und kann an deine individuellen Bedürfnisse angepasst werden. Zudem kann die Software kostenlos genutzt werden.
DALL-E 2 ist ideal für die Erstellung von beeindruckend fotorealistischen Bildern und komplexen Szenen.
Zusammenfassung
Alle drei Bildgeneratoren haben ihre eigenen Stärken und Schwächen. Die beste Wahl hängt von deinen individuellen Bedürfnissen und Vorlieben ab. Es lohnt sich, alle drei Tools auszuprobieren, um herauszufinden, welches am besten zu deinem Arbeitsstil passt.
Und natürlich gibt es zahlreiche weitere Tools dieser Art mit individuellen Stärken. Es lohnt sich zum Beispiel auch Leoardo.ai zu testen, wobei ein gewisser Basis-Umfang hier kostenlos genutzt werden kann.
Bei allen Tools sollte man immer prüfen, wie es mit dem geistigen Eigentum der erzeugten Bilder steht und natürlich auch, ob man diese auch kommerziell nutzen kann.
Lokale Alternativen zum Erstellen von KI-basierten pixelbasierten Bilder oder Vektor-basierten Grafiken direkt auf deinem eigenen Rechner ohne die Beteiligung Dritter.
Vision FX 2.0 – die lokale AI-Alternative für artistische Foto-Kunst
Corel Vector FX – lokal KI-generiert Vektorgrafiken erstellen lassen
In meiner kleinen Serie zum Thema KI-basierte Bildgeneratoren ist bisher erschienen:
KI-basierte Bildgeneratoren: Technologie und Anwendungsbereiche (1)
Tipps für die Erstellung guter Prompts für deinen Bildgenerator (3)
Prompts: Spezifische Techniken für Midjourney, Stable Diffusion und DALL-E 2 (4)
Mit Negativ-Prompts deine Bildgenerierung präzisieren (5)
Seed-Werte: Verschiedene Variationen desselben Bildes erzeugen (6)
Vorschau:
Teil drei der Serie befasst sich dann mit dem Thema „Tipps für die Erstellung guter Prompt“, Teil vier befasst sich mit spezifischen Techniken für Midjourney, Stable Diffusion und DALL-E 2 und in Teil fünf geht es um den Einsatz von Negativ-Prompts, um deine Bildgenerierung zu präzisieren. Der sechste Teil meiner kleinen Serie rund um KI-basierte Bildgeneratoren befasst sich mit dem Thema „Die Rolle von Seed-Werten: Wie man verschiedene Variationen desselben Bildes erzeugt“.
Lesetipp: Mastering ChatGPT: Fortgeschrittene Strategien und Techniken für Selbstständige