Shopify Sidekick funktioniert zuverlässig beim Erstellen von Flows. Für alle anderen getesteten Bereiche wie Theme-Anpassungen, Datenpflege und KPI-Analysen ist er zu unzuverlässig für den produktiven Einsatz.
KI hält Einzug in immer mehr Bereiche des Shopify-Alltags. Mit Sidekick treibt Shopify das aktiv voran: Der direkt im Admin integrierte Assistent soll alltägliche Aufgaben schneller machen, von der Flow-Erstellung über Theme-Anpassungen bis hin zur Datenanalyse.
Für uns bei tante-e war die Frage von Anfang an konkret: Was kann Sidekick wirklich, und wo erzeugt er mehr Aufwand als er spart? Wir haben ihn in sechs typischen Einsatzszenarien getestet. Die Ergebnisse sind eindeutig.
E-Commerce-Specialist Lara unterstützt zahlreiche E-Commerce Brands bei ihren Shops und testet als Teil des tante-e AI Research Teams regelmäßig neue KI-Features rund um Shopify.
1. Was ist Shopify Sidekick?
Shopify Sidekick ist ein KI-Assistent, der direkt in den Shopify Admin integriert ist. Er soll User-Anfragen verstehen und auf die Daten des jeweiligen Shops zugreifen, um kontextbezogene Antworten und Aktionen zu liefern.
Mit Sidekick sollen Händler:innen Aufgaben erledigen können, ohne sich durch Menüs klicken zu müssen.
Er richtet sich damit sowohl an unerfahrene Händler als auch an erfahrene Teams, die Routineaufgaben beschleunigen wollen.

2. Wie wir Shopify Sidekick getestet haben: 6 Use Cases
Wir haben Shopify Sidekick über mehrere Wochen in sechs konkreten Use Cases getestet: allgemeine Shopify-Fragen, B2B-Kundenanlage, Datenpflege, KPI-Analyse, Flow-Erstellung und Theme-Editor-Anpassungen.
Die Tests wurden an echten Shop-Setups durchgeführt, darunter Shops mit Custom Functions, komplexen Produktstrukturen und individuellen Metafeld-Konfigurationen. Jeder Use Case wurde anhand von drei Kriterien bewertet:
- Zeitersparnis: Reduziert Sidekick den tatsächlichen Aufwand spürbar?
- Qualität: Sind die Outputs korrekt und direkt nutzbar?
- Zuverlässigkeit: Liefert Sidekick konsistente Ergebnisse über verschiedene Anfragen hinweg?
Am Ende jedes Use Cases steht eine Bewertung auf einer Skala von 1 bis 10.
Use Case 1: Allgemeine Shopify-Fragen
Shopify Sidekick ist als erste Orientierungshilfe bei Standard-Shopify-Fragen brauchbar, aber nur dann, wenn ausreichend Vorwissen vorhanden ist, um Fehlinformationen zu erkennen.
Was funktioniert:
- Navigation zu nativen Settings: Fragen wie "Wo finde ich die Steuereinstellungen?" oder "Wie aktiviere ich Shopify Markets?" beantwortet Sidekick zuverlässig. Als Orientierungshilfe für Händler, die sich im Admin noch nicht gut auskennen, ist er hier hilfreich.
- Feature-Erklärungen: Die Erklärung von UTM-Parametern für Influencer-Links hat Sidekick in einem Test so klar und verständlich formuliert, dass wir sie direkt an einen Kunden weiterschicken konnten. Das ist eine der wenigen Situationen, in denen der Output ohne Nachbearbeitung nutzbar war.
- CSV-Vorlagen: Für Standardprozesse wie Steuerüberschreibungen per Bulk Upload kann Sidekick brauchbare CSV-Vorlagen vorbereiten. Das spart Zeit bei repetitiven Aufgaben.
- Einfache Code-Bugs: Kleinere Fehler in Code-Snippets kann Sidekick in manchen Fällen erkennen und beheben.
- Grenzen kommunizieren: Sidekick verweist manchmal korrekt an App-Entwickler weiter, wenn eine Frage zu spezifisch für seinen Wissensstand ist. Dieses Verhalten ist positiv, aber leider nicht konsistent.
Was nicht funktioniert:
- Steuerfragen: Das ist einer der kritischsten Schwachpunkte in diesem Use Case. Antworten zu Steuereinstellungen sind falsch, widersprüchlich oder ohne verwertbare Quellenangaben. Für steuerrelevante Konfigurationen empfehlen wir Sidekick derzeit nicht.
- Shopify Markets: Sidekick hat im selben Gespräch gleichzeitig behauptet, im Plus-Plan seien maximal 50 Markets möglich, und kurz darauf, es gebe keine Begrenzung. Angegebene Quellen stimmten dabei nicht mit den tatsächlichen Inhalten überein.
- App-Empfehlungen: Sidekick empfiehlt Apps auf Basis von App-Store-Bewertungen, nicht auf Basis der tatsächlichen Shop-Anforderungen. Doch eine App mit 5 Sternen ist nicht automatisch die richtige für den jeweiligen Anwendungsfall. Die Empfehlungen weichen regelmäßig von dem ab, was wir als Agentur in der Praxis empfehlen würden.
- Theme-Informationen: Sidekick weiß nicht, dass bestimmte Themes wie das Impact Theme kostenpflichtig sind, obwohl diese Information öffentlich im Shopify Theme Store hinterlegt ist. Themes auf externen Shops identifizieren kann er derzeit ebenfalls nicht.
- Spezifische Kundenimplementierungen: Fragen zu Loyalty-Programmen, Backend-Benachrichtigungen oder Custom Logic bleiben ohne brauchbare Antwort. Sidekick findet im besten Fall zugehörige Meta-Objekte, kann aber weder erklären, wie sie funktionieren, noch wie sie befüllt werden sollten.
Ein Learning aus den Tests ist besonders relevant für den Agentur-Alltag: Umso spezifischer die Frage, desto höher die Fehlerquote. Sidekick ist bei allgemeinen Fragen (auf Niveau des Shopify Help Centers) am stärksten und wird mit zunehmendem Kontext unzuverlässiger. Das macht ihn zu einem Werkzeug, das Vorwissen voraussetzt, nicht ersetzt.
Bewertung: 4/10
Use Case 2: B2B-Kundenanlage & Custom-Logiken
Für einfache Kundenanlage mit Standardfeldern ist Sidekick bedingt nutzbar. Sobald individuelle Rabattlogiken, Custom Functions oder Metafeld-Konfigurationen ins Spiel kommen, können wir ihn nach unserem Test allerdings nicht empfehlen.
Was funktioniert:
- Grundlegende Kundenanlage mit Stammdaten und Standard-Tags klappt zuverlässig
- Erste Vorschläge für internationale Collection Pages, die grob mit einer hinterlegten Knowledge Base übereinstimmen, können als Ausgangspunkt dienen
Was nicht funktioniert:
- Custom Tags und Rabatt-Functions: Wir haben Sidekick gebeten, einen neuen B2B-Kunden mit der korrekten Rabattlogik zu verknüpfen. Sidekick hat dabei den Tag "Apotheker" gesetzt, anstatt des korrekten Tags "Pharmacy", der die hinterlegte Discount Function tatsächlich auslöst. Das Ergebnis: Die Function greift nicht, der Rabatt wird nicht angewendet. Sidekick hat keinen Einblick in die Function-Logik, die im Hintergrund läuft.
- Metafeld-Formulare: Sidekick findet die Verknüpfung zu einem shopspezifisch eingebundenen Formular nicht und ist nicht in der Lage, Metafelder bei der Kundenanlage nach Anweisung auszufüllen. Für Shops, die Metafelder aktiv für Kundensegmentierung oder B2B-Prozesse nutzen, ist das ein klares Ausschlusskriterium.
- Menü-Links je Markt anpassen: Wir haben Sidekick über drei Iterationen hinweg gebeten, Links in der Navigation je nach Markt unterschiedlich zu setzen. Die Antworten waren jedes Mal widersprüchlich. Am Ende gab Sidekick zu, dass diese Art von Linkänderungen gar nicht möglich ist. Eine Information, die von Anfang an klar hätte kommuniziert werden müssen.
- Native Katalog-Daten: Sidekick findet zwar vorhandene Katalog-Daten, kann aber nicht einschätzen, ob und wie sie aktuell im Shop genutzt werden.
Das strukturelle Problem in diesem Use Case ist besonders kritisch: Sidekick antwortet durchgehend selbstbewusst, auch wenn die Antwort falsch ist. Wer die Custom-Logiken des eigenen Shops nicht genau kennt, wird die Fehler nicht erkennen und im schlimmsten Fall fehlerhafte Konfigurationen live schalten.
Bewertung: 2/10
Use Case 3: Datenpflege & Bulk Upload
Für das Anlegen einzelner Kunden ist Sidekick bedingt nutzbar. Für automatisierte Bulk Uploads mit mehr als wenigen Einträgen ist er nicht geeignet.
Was funktioniert:
- Einzelne Kundenanlage: Stammdaten aus einfachen Listen oder CSV-Strukturen übernehmen und die Anlage einzelner Kunden funktioniert zuverlässig. Der Prozess ist intuitiv, auch ohne tiefes Admin-Wissen.
- Validierung von Eingaben: Sidekick erkennt ungültige Telefonnummern, etwa Test-Nummern, und gibt einen entsprechenden Hinweis. Das ist ein kleines, aber nützliches Detail.
Was nicht funktioniert:
- Bricht nach zwei Kunden ab: Das auffälligste Verhalten im Test war konsistent: Sidekick hört nach der Anlage von genau zwei Kunden auf. Jedes weitere Mal muss er manuell aufgefordert werden, weiterzumachen. Für jeden Kunden ist außerdem eine manuelle Bestätigung notwendig, da Sidekick nicht automatisch speichert.
- Kunden löschen: Sidekick kann keine Kunden löschen. Er gibt lediglich Navigationshinweise, die teilweise falsch sind.
- Metafelder: Metafelder können über Sidekick nicht befüllt werden. Für Shops, die Metafelder für Kundensegmentierung, B2B-Prozesse oder individuelle Datenpflege nutzen, ist das ein grundlegendes Ausschlusskriterium.
- Echter Bulk Upload: Ab einer Menge von mehr als zehn Datensätzen ist der direkte CSV-Import im Shopify Admin deutlich effizienter, schneller und fehlerunanfälliger als der Weg über Sidekick.
Das Grundproblem dieses Use Cases ist struktureller Natur: Sidekick ist nicht als Bulk-Werkzeug konzipiert. Er arbeitet sequenziell, benötigt manuelle Bestätigungen und unterstützt keine erweiterten Felder. Unsere Einschätzung: Wer diesen Weg trotzdem versucht, wird mehr Zeit investieren als sparen.
Bewertung: 2/10
Use Case 4: KPI-Analyse & Datenauswertung
Einfache Kennzahlen kann Sidekick zuverlässig auslesen. Sobald Shop-spezifischer Kontext, komplexe Produktstrukturen oder Zeitraumvergleiche ins Spiel kommen, wurden die Ergebnisse in unseren Tests unbrauchbar.
Was funktioniert:
- Einfache Kennzahlen: Conversion Rate, Average Order Value und ähnliche Basiskennzahlen liest Sidekick korrekt aus den Shopify Analytics aus.
- Analyse-Links generieren: In einem Test hat Sidekick eine vollständige Analyseübersicht mit einem direkt aufrufbaren Link zu Shopify Analytics erstellt. Für Händler ohne tiefe Analytics-Kenntnisse ist das ein nützlicher Einstiegspunkt.
Was nicht funktioniert:
- Komplexe Produktstrukturen: Bei einem Shop mit komplexen Produkten, inkl. Fake-Varianten hat Sidekick die Umsatzzahlen völlig falsch berechnet. Das Ergebnis wies ein Plus von 887% aus, während die tatsächliche Entwicklung rückläufig war. Die Produktlogik wurde grundlegend nicht verstanden.
- Session-Daten: Sessions wurden falsch berechnet, weil Sidekick Produktkategorien eingerechnet hat, die explizit ausgeschlossen werden sollten.
- Checkout-Abbrüche: Die Ergebnisse stimmten nicht mit der manuellen Analyse überein.
- Zeiträume: Bei einem weiteren Shop hat Sidekick statt des definierten Analysezeitraums nur zwei einzelne Tage verglichen. Dieser Fehler war im Output nicht direkt erkennbar und wäre ohne Gegenkontrolle unbemerkt geblieben.
- Handlungsempfehlungen: Reine Datenpunkte auslesen funktioniert noch am besten. Sobald Sidekick Kontext interpretieren und Empfehlungen ableiten soll, driftet die Qualität deutlich ab.
Das zentrale Learning aus diesem Test: Je mehr Kontext Sidekick verarbeiten soll, desto unzuverlässiger werden die Ergebnisse. Für Shops mit individuellen Strukturen, Bundles oder Custom-Logiken ist eine KI-gestützte Analyse über Sidekick aktuell nicht vertretbar. Die menschliche Expertise bleibt hier zwingend notwendig.
Bewertung: 3/10
Use Case 5: Shopify Flows erstellen
Shopify Flows erstellen ist der klar stärkste Use Case unseres gesamten Tests. Für einfache bis mittelschwere Automationen liefert Sidekick konsistente, direkt nutzbare Ergebnisse, auch ohne Vorwissen über Flow-Syntax oder Trigger-Logik.
Was funktioniert:
- Einfache und mittelschwere Flows: Anti-Fraud-Flows, Inventory-Alerts, E-Mail-Trigger und ähnliche Automationen werden zuverlässig generiert. Sidekick versteht die Aufgabe und baut den Flow strukturell korrekt auf.
- Selbstständige Erkennung: Sidekick erkennt eigenständig, wenn ein Flow die passende Lösung für eine Anfrage ist, ohne dass das Wort "Flow" explizit im Prompt verwendet werden muss.
- Preview vor Übernahme: Bevor ein Flow übernommen wird, zeigt Sidekick eine Vorschau. Das gibt die Möglichkeit, den Output zu prüfen, bevor er aktiv wird.
- Transparenz bei Grenzen: Wenn ein Flow-Schritt Liquid Code erfordert, weist Sidekick klar darauf hin und zeigt, bis zu welchem Punkt die Umsetzung ohne Entwickler möglich ist.
- Template-basiertes Prompting: Das Herauskopieren einer bestehenden Flow-Beschreibung und deren direktes Eintippen als Prompt funktioniert besonders gut. Wer bereits Flows im Einsatz hat, kann diese Methode nutzen, um ähnliche Automationen schnell zu replizieren.
- Keine eigenständigen Aktivierungen: Sidekick aktiviert und löscht Flows nicht selbstständig. Die finale Kontrolle bleibt beim Menschen.
Was nicht funktioniert:
- Inkonsistente Tags: In einigen Tests wurden Tags nicht konsistent gesetzt, etwa equal statt include, oder ein Tag wurde doppelt hinzugefügt. Outputs sollten vor der Aktivierung geprüft werden.
- Sehr komplexe Flows: Flows mit mehreren verschachtelten Bedingungsebenen sind schwer in natürlicher Sprache zu beschreiben. Der Aufwand für die Formulierung des Prompts kann die Zeitersparnis auffressen.
Gerade für Händler ohne Flow-Kenntnisse ist der Mehrwert real. Die Prompt-Qualität entscheidet dabei stark über den Output: Je konkreter die Anfrage, desto besser das Ergebnis.
Bewertung: 7/10
Use Case 6: Theme Editor
Für globale Standard-Einstellungen in nativen Shopify-Themes ist Sidekick bedingt nutzbar. Alles, was über vordefinierte Theme-Settings hinausgeht, ist fehleranfällig und zeitintensiv.
Was funktioniert:
- Globale Standard-Einstellungen: Änderungen an Farben, Badge-Darstellungen, Button-Stilen oder Produktbildformaten funktionieren zuverlässig, solange es sich um Einstellungen handelt, die das Theme nativ anbietet. Bei Änderungen, die mehrere Schemas gleichzeitig betreffen, spart Sidekick tatsächlich Klicks.
- Verfügbare Sections erkennen: Sidekick kann die Standard-Blocks eines Themes identifizieren und passende Sections vorschlagen.
Was nicht funktioniert:
- Produktspezifische Anpassungen: Den Preis für ein einzelnes Produkt auszublenden ist über Sidekick nicht möglich. Er hat ausschließlich Zugriff auf globale Theme-Optionen, keine produktspezifischen.
- Custom CSS: Sidekick generiert CSS-Code, der in den getesteten Fällen keine Wirkung hatte. Er hat keinen tatsächlichen Einblick in den Theme-Code und rät bei CSS-Anfragen auf Basis von Annahmen.
- Section-Management: In einem Test hat Sidekick eine Section auf der falschen Seite eingebaut, auf der Product Page statt auf der Homepage, obwohl die Homepage explizit im Prompt genannt wurde. Es brauchte vier bis sechs Iterationen, um eine einfache Aufgabe korrekt abzuschließen.
- Navigation: Sidekick weiß nicht, welche Seite im Theme Editor gerade geöffnet ist. Navigationshinweise wie "Klick auf das Zahnrad, dann Farben" sind ungenau und teilweise falsch. Im Unterschied zum Shopify Admin hat Sidekick im Theme Editor kaum Orientierung.
- Link-Generierung: In einem Test hat Sidekick einen Link generiert, der ins Nichts führte. Der Fehler fiel Sidekick selbst nicht auf.
- Custom Themes: Für individuell angepasste Themes, wie ein kundenspezifisch modifiziertes Dawn-Theme, hat Sidekick keinen Einblick in den Code. Auch für Shopify-eigene Themes wie Horizon ist die Unterstützung jenseits von Basis-Settings nicht verlässlich.
Das Fazit aus diesem Use Case lässt sich kurz zusammenfassen: Alles, was Sidekick im Theme Editor erledigen kann, lässt sich in etwa gleich viel Zeit auch manuell erledigen. Was darüber hinausgeht, kostet durch Iterationen und Fehler deutlich mehr Zeit als gespart wird.
Bewertung: 2/10
3. Fazit: Was unser großer Shopify Sidekick Test zeigt
Shopify Sidekick hat einen klar abgrenzbaren Stärkenbereich: das Erstellen von Shopify Flows. Hier liefert er konsistente, brauchbare Ergebnisse und bringt auch unerfahrenen Händlern echten Mehrwert. In allen anderen getesteten Bereichen überwiegen die Schwächen.
| Use Case | Bewertung | Kurzbewertung |
|---|---|---|
| Allgemeine Shopify-Fragen | 4/10 | Als Orientierungshilfe brauchbar, nur mit Vorwissen nutzbar |
| B2B-Kundenanlage & Custom-Logiken | 2/10 | Basis-Anlage möglich, bei Custom-Logiken nicht verlässlich |
| Datenpflege & Bulk Upload | 2/10 | Bricht ab, kann nicht löschen, kein Metafeld-Support |
| KPI-Analyse & Datenauswertung | 3/10 | Einfache Kennzahlen funktionieren, komplexe Strukturen nicht |
| Shopify Flows erstellen | 7/10 | Klar stärkster Use Case, echter Mehrwert ohne Vorwissen |
| Theme Editor | 2/10 | Nur globale Standard-Settings, alles weitere fehleranfällig |
Das größte strukturelle Problem zieht sich durch alle Use Cases: Sidekick kennt den tatsächlichen Shop-Kontext kaum. Theme-Code, geöffnete Seiten, Custom Functions, individuelle Tag-Logiken oder spezifische Metafeld-Strukturen liegen außerhalb seines Zugriffs. Wenn das Wissen fehlt, halluziniert der Shopify KI Assistent lieber, als zuzugeben, dass er es nicht weiß. Diese Unberechenbarkeit ist kein Randproblem, sondern das Kernrisiko beim Einsatz von Sidekick: Man kann nie sicher sein, ob eine Antwort zuverlässige Orientierung oder selbstbewusstes Halbwissen ist.
4. Für wen ist Shopify Sidekick geeignet?
Shopify Sidekick empfehlen wir mit klaren Einschränkungen. Der Einsatz lohnt sich in bestimmten Szenarien, in anderen kostet er mehr Zeit als er spart.
Geeignet für:
- Händler, die Shopify Flows erstellen oder anpassen wollen, insbesondere ohne technisches Vorwissen
- Automationen mit klar beschreibbarem Ablauf: Anti-Fraud-Checks, Inventory Alerts, E-Mail-Trigger
- Händler, die eine erste Inspiration oder Vorlage für Flows suchen
- Einfache, globale Theme-Einstellungen wie Farben oder Bildformate, bei denen man nicht selbst suchen möchte
- Allgemeine Orientierungsfragen zu nativen Shopify-Features, wenn Vorwissen zur Gegenkontrolle vorhanden ist
Nicht geeignet für:
- Shops mit Custom Themes: Sidekick hat keinen Einblick in individuellen Theme-Code
- Bulk-Datenpflege bei Kunden oder Produkten: zu langsam, zu inkonsistent, der direkte CSV-Import im Admin ist effizienter
- KPI-Analysen bei Shops mit komplexen Produktstrukturen, Bundles oder Custom-Logiken: zu fehleranfällig
- Individuelle Theme-Anpassungen jenseits von Standard-Settings: hier ist direkter Entwicklereinsatz effizienter
- Alles, was Custom Functions, spezifische Tags oder Metafeld-Strukturen betrifft: Sidekick kennt diese Logiken nicht
Sidekick ist kein Werkzeug, das Shopify-Expertise ersetzt. Er ist zum heutigen Stand ein Assistent, der einfache, gut definierte Aufgaben beschleunigen kann, aber nur dann, wenn jemand mit ausreichend Vorwissen die Outputs einordnen und gegenkontrollieren kann.