Direktantwort: Google Gemini eignet sich nach unserer Analyse als Hauptlösung für Fashion-Produktbilder. Models bleiben über mehrere Bilder konsistent, suboptimale Input-Fotos werden automatisch korrigiert, und brauchbare Ergebnisse entstehen beim ersten Versuch. OpenAI lieferte in den Tests bessere Text-Darstellung, kopiert aber Input-Fehler 1:1 und benötigt teilweise 2-3 Iterationen bis zum gewünschten Ergebnis.

Fashion-Brands stehen vor einem wiederkehrenden Problem: Jede neue Kollektion benötigt professionelle Produktbilder – Studio-Shots für PDPs, Model-Shots für Kategorie-Seiten, Mood-Bilder für Kampagnen. Klassische Fotoshootings mit Models, Location und Nachbearbeitung kosten Zeit und Budget.

KI-Bildgenerierung verspricht eine Alternative. Aber funktioniert das wirklich shop-tauglich? Wir haben Google Gemini (Nano Banana Pro) und OpenAI (GPT Image 1.5) ausführlich getestet. Das Ergebnis: KI-Produktbilder funktionieren grundsätzlich für Fashion Shops – aber nur mit dem richtigen Modell und realistischen Erwartungen.

1. Was wir getestet haben: 3 Bildtypen, 2 Modelle

Drei Bildtypen mit unterschiedlichen Anforderungen

Wir haben drei Bildtypen mit zwei KI-Modellen getestet: Studio-Shots, Model-Shots und Mood-Shots. Beide Modelle erhielten identische Handyfotos als Input und identische Prompts.

Gestreifte Shirt KI Test

Studio-Shots (Ghost Mannequin):
Produktbilder für Produktdetailseiten – Kleidung frei schwebend auf neutralem Hintergrund ohne sichtbares Model. Der "Invisible Mannequin Look" fokussiert rein auf das Produkt.

Strickjacke Model-Test

Model-Shots:
Models tragen die Kleidung in neutraler Studio-Umgebung. Model-Steckbriefe in den Prompts definieren Alter, Körperbau, spezifische Features (Tattoos, Vitiligo, Sommersprossen).

Streifenshirt Mood Test

Mood-Shots:
Atmosphärische Inszenierungen in definierten Settings (z.B. Gewächshaus, Industrial-Loft, Café).

Zwei KI-Modelle im direkten Vergleich

Wir haben Google Gemini (Nano Banana Pro) und OpenAI GPT Image 1.5 parallel getestet. Beide Modelle nutzen identische Prompts, um die Ergebnisse vergleichbar zu machen. Als Input dienten einfache Fotos der Produkte aus mehreren Perspektiven (z.B. auf Bügel, flach ausgebreitet) – bewusst keine optimierten, professionellen Studio-Aufnahmen, um realistische Bedingungen für Händler:innen abzubilden.

2. Rechtliche Grundlagen: Darfst du KI-generierte Bilder kommerziell nutzen?

KI-generierte Bilder von Google Gemini und OpenAI können kommerziell genutzt werden. Beide Anbieter beanspruchen keine Eigentumsrechte am generierten Output. 

Urheberrechtliche Einordnung:

KI-Bilder sind nach aktueller Rechtslage in Deutschland oft nicht als eigenständige urheberrechtliche Werke geschützt, wenn keine ausreichende menschliche Schöpfungshöhe vorliegt. Exklusivität gegenüber Dritten ist daher nicht gegeben – ähnliche Outputs können auch anderen Nutzern entstehen.

Vertraglich IP-Freistellungen (Business/Enterprise-Tarife):

  • Google und OpenAI bieten vertragliche Freistellungen für Copyright-Ansprüche
  • Gültig unter Bedingungen: unmodifizierter Output, Safety-Features nicht umgehen, keine Kenntnis offensichtlicher Verletzung
  • Ausschlüsse für Marken-/Trademark-Claims im geschäftlichen Verkehr

Was sollten Fashion Brands speziell bei KI-generierten Bildern beachten?

Selbstverständlich sollten auch AI-generierte Bilder einen authentischen Eindruck vom Produkt verkörpern. In der Fashion-Branche ist es z.B. üblich, Musterteile zu fotografieren, die minimal vom späteren Serienprodukt abweichen können. Diese branchentypischen Toleranzen gelten analog für KI-generierte Produktbilder – kleine visuelle Abweichungen zwischen KI-Bild und realem Produkt bewegen sich im üblichen Rahmen für Fashion-E-Commerce. Dennoch sollte klar sein, dass Kund:innen auf authentische Produktfotografien vertrauen und zu große Abweichungen ein Grund für Retouren sein kann.

Keine Nutzung für Training:

Prompts und Outputs werden in Business-/API-Angeboten typischerweise nicht zur Modellverbesserung genutzt. Consumer-Apps können je nach Einstellung zur Modellverbesserung beitragen.

Kennzeichnungspflicht ab 2. August 2026 (EU AI Act):

  • Anbieter müssen KI-generierte Inhalte maschinenlesbar markierbar machen
  • Kennzeichnungskonzept für realistische KI-Produktbilder sollte früh mitgeplant werden
  • Konkrete Umsetzung im E-Commerce wird derzeit noch konkretisiert

3. Google Gemini für Fashion: Authentische Models, konsistente Ergebnisse

Google Gemini liefert bei unseren Versuchen verwendbare Fashion-Bilder. Models wirken natürlich, Features bleiben über mehrere Bilder identisch, und fehlerhafte Inputs werden automatisch korrigiert.

Testbeispiele (Auszug) inkl. Bewertungen:

Strickjacke (Studio: 9/10, Model: 7/10, Mood: 5/10)

Gestreifte Strickjacke KI-Test
Beobachtungen

Die Strickjacke hing auf dem Input-Foto schief auf dem Bügel. Google Gemini korrigiert dies automatisch – die Streifen verlaufen im generierten Bild gerade und ordentlich. Der Stoff fällt realistisch, das Streifenmuster wird präzise erfasst.

Der Nachteil zeigt sich bei der Model-Darstellung: Das Best-Ager-Model wirkt deutlich als KI-generiert erkennbar. Auch die Mood-Shots erreichen ein hohes Glätte-Niveau, das die Authentizität mindert.

Blumenpullover (Studio: 10/10, Model: 9/10, Mood: 5/10)

Blumenpullover KI-Test
Beobachtungen

Auch hier war das Ausgangsbild kein ideales Foto – Gemini korrigiert das Blumenmuster automatisch und stellt es gerade dar. Das androgyne Model wirkt überraschend natürlich, Sommersprossen werden detailreich abgebildet. Bei diesem Test hätte das Research Team nicht sofort vermutet, dass das Model KI-generiert ist.

Das Café-Setting im Mood Shot fällt jedoch durch übermäßige Perfektion auf – zu glatt, zu perfekt inszeniert. Für authentische Shop-Bilder weniger geeignet.

Shirt mit Aufdruck (Studio: 10/10, Model: 8/10, Mood: 8/10)

Shirt mit Aufdruck KI-Test
Beobachtungen

Der Shirt-Aufdruck wird exakt 1:1 übernommen, der Stoff fällt realistisch. Die Tattoos des Models bleiben auch über mehrere Tests hinweg identisch. Dies ermöglicht z. B. den Aufbau einer wiederverwendbaren Model-Bibliothek.

Das Model wirkt natürlich, nicht sofort als KI erkennbar. Das Industrial-Loft-Setting funktioniert gut und unterstreicht den edgy Look des Produkts.

Gestreiftes Shirt (Studio: 10/10, Model: 9/10, Mood: 9/10)

Gestreiftes Shirt KI-Test
Beobachtungen

Das Model mit Vitiligo wirkt natürlich und authentisch – auch hier wurde vom Research Team nicht sofort auf KI-Generierung getippt. Die Vitiligo-Flecken bleiben über alle Bilder konsistent.

Das Gewächshaus-Setting wurde als das stärkste Mood-Ergebnis bewertet – die Atmosphäre mit tiefgrünen Pflanzen, rostigen Metallstreben und diffusem Licht funktioniert hervorragend. Die Ausleuchtung der Produkte bleibt klar, der Fashion-Fokus geht nicht verloren.

Was funktioniert hervorragend:

  • Models wirken natürlich und realistisch – in den meisten Fällen nicht sofort als KI-generiert erkennbar
  • Single-Shot-Fähigkeit: Erster Versuch lieferte in jedem Test brauchbare Ergebnisse
  • Model-Features bleiben über mehrere Bilder identisch (Tattoos, Vitiligo, Sommersprossen)
  • Automatische Optimierung: Schiefe oder unebene Produkte von Ausgangsbildern werden im Output gerade dargestellt und optimiert, ungünstige Perspektiven korrigiert
  • Format-Verständnis: Hält sich strikt an Prompt-Vorgaben (z.B. Anweisung: Produktbilder auf Shopify müssen quadratisch sein)
  • Mood-Shots: Atmosphärische Inszenierungen, wie z.B. Gewächshaus-Setting überzeugen

Grenzen:

  • Etiketten mit kleiner Schrift oder Typographie auf auf gekrümmten Flächen werden schnell pixelig
  • Sehr glatte Oberflächen wirken manchmal "zu perfekt" (erkennbar KI-generiert)
  • Einige moody Settings wirken ebenfalls zu plastisch und künstlich, wie z.B. das Café-Setting

Empfohlene Use Cases:

Fashion-Brands, deren eine korrigierende Aufbereitung der Ausgangsbilder relevant ist und Wert auf konsistente Models mit entsprechender Inszenierung legen. Wenn die Darstellung von Text, z.B. Infos auf dem Etikett nicht von Bedeutung ist.

4. OpenAI für Fashion: Bessere Details, aber inkonsistente Models

OpenAI liefert bessere Text-Lesbarkeit und realistischere Hautstrukturen bei den Models. Die hohe Inkonsistenz der Outputs und das Kopieren von Input-Fehlern sorgen allerdings für einen höheren Nutzungsaufwand.

Testbeispiele (Auszug):

Strickjacke (Studio: 5/10, Model: 8/10, Mood: 3/10)

Gestreifte Strickjacke KI-Test
Beobachtungen

OpenAI übernimmt den Input-Fehler 1:1 – die Streifen bleiben schief, auch nach explizitem Korrektur-Hinweis im Prompt. Die Etikett-Darstellung funktioniert besser als bei Gemini, das Model wirkt lockerer und natürlicher positioniert. Allerdings zeigt sich bei den Mood-Shots ein grundsätzliches Problem: Statt einer Neuinszenierung wird die Studio-Pose beibehalten und lediglich der Hintergrund ausgetauscht. Zusätzlich wird der Kopf oben abgeschnitten.

Blumenpullover (Studio: 2/10, Model: 2/10, Mood: 5/10)

Blumenpullover KI-Test
Beobachtungen

Das Blumenmuster bleibt schief und wird nicht eigenständig optimiert – selbst ein expliziter Prompt-Hinweis "Muster soll gerade sein" ändert nichts. Zusätzlich ignoriert OpenAI Format-Vorgaben: Statt quadratisch wie geprompted wird beim Model-Bild ein Hochformat ausgegeben.

Die Model-Proportionen wirken unnatürlich (langer Hals, kleiner Kopf). Das Café-Setting leidet auch hier unter übermäßiger Glättung – beide Modelle produzieren in diesem Setting erkennbar AI-lastige Ergebnisse.

Shirt mit Aufdruck (Studio: 3/10, Model: 8/10, Mood: 6/10)

Shirt mit Aufdruck KI-Test
Beobachtungen

Der Shirt-Aufdruck wird ebenfalls gut erfasst, allerdings schief gedruckt (ähnlich dem Input). OpenAI zeigt mehr Realismus bei der Hautdarstellung – Poren und Hautstruktur sind sichtbarer als bei Gemini.

Das kritische Problem zeigt sich bei den Mood-Shots: Die ersten zwei Versuche kopieren exakt die Studio-Pose, trotz Aufforderung zur Neuinszenierung. Versuch drei brachte endlich eine andere Pose – aber: Das Piercing wechselt die Seite, Tattoos ändern Position und Design, das Model sieht anders aus. Für Kampagnen mit mehreren Produkten bei gleichbleibenden Models ein Ausschlusskriterium.

Gestreiftes Shirt (Studio: 1/10, Model: 8/10, Mood: 7/10)

Gestreiftes Shirt KI-Test
Beobachtungen

Die Streifen sind erneut schief (Input-Fehler wird kopiert) und nicht wie bei Gemini korrekt erfasst mit entsprechender Optimierung. OpenAI fügte zudem einen weißen Rahmen hinzu, der im Prompt nicht gefordert wurde – auf Nachfrage verneint das Modell die Existenz dieses Rahmens. Die Vitiligo-Flecken sind nicht konsistent – das Hand-Muster ändert sich zwischen den Bildern.

Was funktioniert gut:

  • Etiketten und Care Labels bleiben lesbarer als bei Gemini
  • Hautstruktur wirkt in den meisten Tests realistischer (Poren, Details sichtbarer)

Kritische Schwächen:

  • Kopiert Input-Fehler 1:1: Schiefe Produkte (z.B. auf dem Bügel) bleiben schief (keine automatische Korrektur)
  • Ignoriert Format-Vorgaben teilweise (Hochformat statt quadratisch trotz spezifischer Anweisung im Prompt)
  • Benötigt durchschnittlich 2-3 Iterationen statt einer bis zum idealen Ergebnis
  • Teilweise unnatürliche Model-Darstellung (Hit or Miss)
  • Mood-Shots: Ändert oft nur Hintergrund, ohne Model und Pose neu zu inszenieren
  • Models über mehrere Bilder inkonsistent: z.B. Piercings wechseln Seite, Tattoos ändern Position, leicht anderer Look

Empfohlene Use Cases:

Einzelne Produktbilder mit Fokus auf Etikett-Lesbarkeit. Nach unseren Tests eher nicht geeignet für Serien mit gleichbleibenden Models. Häufig sind mehrere Iterationen nötig für ein ideales Ergebnis.

5. Unsere Empfehlung: Wann welches Modell für Fashion-Produktbilder einsetzen?

Nach unseren Tests empfehlen wir Google Gemini (Nano Banana Pro) als Hauptlösung für Fashion-Brands, OpenAI eher für spezifische Anwendungsfälle mit Text-Fokus.

Google Gemini als Hauptlösung:

Google Gemini lieferte in den Tests konsistente Produktdarstellungen über mehrere Artikel. Die Single-Shot-Fähigkeit reduziert den Iterationsaufwand – beim ersten Durchlauf entstanden bei allen Beispielen verwendbare Ergebnisse. Die Optimierung des Ausgangsmaterials korrigiert fehlerhafte Inputs: Wenn ein Kleidungsstück auf dem Foto schief hängt, wird es im generierten Bild gerade dargestellt.

Wir empfehlen Google Gemini (Nano Banana Pro) vor allem in diesen Fällen:

  • Saisonale Kollektionen mit mehreren Produkten
  • Kategorie-Header für Collection Pages
  • Mood-Bilder für atmosphärische Kampagnen (jedoch fallspezifische Unterschiede: Gewächshaus- und Industrial-Settings brachten zufriedenstellende Ergebnisse, Café wirkte hingegen nicht authentisch)
  • Fashion-Brands mit begrenztem Budget für Fotoshootings
  • Kampagnen, die konsistente Models über mehrere Produkte benötigen (bei Model-Bildern als Input wird das gleiche Model über mehrere Iterationen konsistent dargestellt)

Nicht geeignet: Produkte mit zwingend lesbaren Care Labels oder Etiketten mit rechtlich relevanten Informationen.

Gemini – Qualitative Bewertung

Kategorie Score (1–5) Begründung (1–2 Sätze)
Nutzen 5 Sehr hoher Nutzen für Fashion-Brands durch konsistente Models und starke Single-Shot-Ergebnisse. Besonders relevant für wiederkehrende Kollektionen mit identischem Model-Setup.
Zeitersparnis / Effizienz 5 Hohe Trefferquote im ersten Versuch reduziert Iterationsaufwand deutlich (klarer Vorteil gegenüber OpenAI im Test).
Umsetzungsaufwand (5 = sehr leicht) 3 Erfordert strukturierten Aufbau (Modelsteckbriefe, getestete Settings, klare Prompts). Danach gut reproduzierbar, aber initiale Systematik notwendig.
Skalierbarkeit 5 Sehr gut skalierbar durch wiederverwendbare Model- und Setting-Struktur. Kein stark wachsender Mehraufwand pro zusätzlichem Produkt.

OpenAI für Produkte mit Text-Fokus:

Generell zeigen auch unsere Tests in anderen Branchen, dass das Modell Text besser und zuverlässiger verarbeitet als Google Gemini. Der Iterationsaufwand bis zum zufriedenstellenden Output war in unseren Tests jedoch höher (durchschnittlich 2–3 Versuche). Die fehlende Optimierung bzw. hohe Treue zum Originalfoto erfordert zudem eine bessere Input-Qualität.

  • Brands mit Fokus auf Etikett-Darstellung
  • Studio-Shots, bei denen Text-Lesbarkeit kritisch ist

OpenAI – Qualitative Bewertung

Kategorie Score (1–5) Begründung (1–2 Sätze)
Nutzen 3 Stark bei Textdetails und bestimmten Bildaspekten, aber weniger konsistent bei Model-Wiederholbarkeit im Vergleich zu Gemini. Zudem fehlende Optimierung und geringeres Verständnis der Physik der Ausgangsbilder.
Zeitersparnis / Effizienz 2 Mehr Iterationen nötig (2–3 Versuche laut Test), dadurch höherer Abstimmungs- und Kontrollaufwand.
Umsetzungsaufwand (5 = sehr leicht) 3 Analog zu Gemini, durch mehr Iterationen und Inkonsistenz aufwendiger
Skalierbarkeit 3 Skalierbar, aber durch Iterationsanfälligkeit weniger stabil.
Zurück zum Blog

Du hast Fragen zu Shopify oder brauchst Unterstützung bei deinem Onlineshop?

tante-e gehört zu den führenden Spezialisten für Shopify & Shopify Plus im deutschsprachigen Raum und realisierte bereits erfolgreiche Projekte mit namhaften Brands, darunter fritz-kola, LFDY, OACE, pinqponq, reisenthel und LeGer by Lena Gercke.

Gerne begleiten wir auch dich auf deinem Weg im Onlinehandel - egal ob Shop-Setups, Migrationen oder individuelle Funktionen.

Wir freuen uns, mit dir ins Gespräch zu kommen.

Beratung vereinbaren