Abstract
Diese Studie untersucht, wie sich LLM-basierte Conversion-Pfade, insbesondere über ChatGPT, Claude, Gemini und Perplexity, im Vergleich zu klassischen Non-LLM-Pfaden über Google Organic Search und Google Ads verhalten. Analysiert werden Reichweite, Post-Click-Conversion-Effizienz, Revenue-Nähe, Trust, Plattformlogik und Messbarkeit. OpenAIGoogleAnthropic
Methodisch folgt die Arbeit einem strukturierten Evidence-Review-Ansatz. Berücksichtigt wurden aktuelle Quellen von Januar 2024 bis März 2026 sowie kanonische ältere Arbeiten zur Suchmaschinenwerbung. Die Evidenzbasis kombiniert peer-reviewte Fachliteratur, offizielle Primärquellen von OpenAI, Google, Anthropic und Adobe sowie großskalige Analytics-Auswertungen von Ahrefs, Similarweb, Seer Interactive, Visibility Labs, Pew, Bain und Semrush.
Das Ergebnis ist kein monokausaler Kanalsieger, sondern ein differenziertes Bild: LLM-Traffic ist derzeit klein, wächst schnell und konvertiert in mehreren Datensätzen effizienter. Google Search und Google Ads bleiben dagegen die dominanten Systeme für Volumen, operative Steuerbarkeit und kurzfristige Nachfrageaktivierung.
Problemstellung und Zielsetzung
Die digitale Customer Journey beginnt 2026 immer häufiger in konversationellen Interfaces. Nutzer fragen ChatGPT nach Produktalternativen, lassen sich von Gemini visuelle Vorschläge machen, nutzen Claude für strukturierte Recherche oder bewegen sich in hybriden Suchumgebungen mit AI Overviews und AI Mode. Für Marken stellt sich deshalb nicht nur die Frage, ob Conversion in andere Oberflächen wandert, sondern ob sich die Effizienz der Journey selbst verändert.
Die Frage ist betriebswirtschaftlich relevant, weil Performance mehrdimensional ist. Ein Kanal kann sehr hohe Reichweite, aber niedrige Conversion-Effizienz haben; ein anderer kann wenig Volumen, aber extrem hohe Abschlusswahrscheinlichkeit liefern. Diese Studie überführt die verfügbare öffentliche Evidenz deshalb in einen belastbaren Entscheidungsrahmen.
Forschungsfragen
- F1. Wie unterscheiden sich LLM-basierte Journeys und klassische Google-Organic- bzw. Google-Ads-Journeys in Reichweite, Conversion-Rate und Revenue-Nähe?
- F2. Wie unterscheiden sich die Kanäle in ihrer Vertrauenslogik, also in wahrgenommener Nützlichkeit, Glaubwürdigkeit und Kaufunterstützung?
- F3. Welche Rolle spielen Plattformarchitektur, Werbelogik und Attributionsprobleme für die beobachteten Unterschiede?
- F4. Welches Forschungsdesign sollte Think11 implementieren, um aus öffentlicher Evidenz eine proprietäre Benchmark zu entwickeln?
Methodik
Die Studie folgt einem strukturierten Narrative-Review-Design mit expliziten Einschluss- und Gewichtungsregeln. Berücksichtigt wurden peer-reviewte Studien und Feldexperimente zu Sponsored Search, Werbevermeidung, AI-Vertrauen und AI-gestützter Shopping-Adoption, offizielle Primärquellen von Plattformen sowie großskalige Analytics- und Clickstream-Auswertungen etablierter Research-Anbieter.
Nicht aufgenommen wurden meinungsgetriebene Blogposts ohne Datengrundlage, unklare Sekundärzitate ohne nachvollziehbare Primärquelle sowie Inhalte ohne transparente Kennzahlen. Eine formale Meta-Analyse wäre für dieses Thema irreführend, weil öffentliche Datensätze stark nach Branche, Attribution, Beobachtungszeitraum und Metrikdefinition variieren.
Markt- und Plattformkontext
Die Plattformlandschaft ist asymmetrisch. OpenAI berichtet für Ende 2025 mehr als 800 Millionen wöchentliche ChatGPT-Nutzer; Similarweb weist ChatGPT zugleich Milliarden Besuche aus. Google meldet AI Overviews für Milliarden Nutzer pro Monat und verknüpft AI Overviews, AI Mode, Shopping Graph und klassische Anzeigenmechaniken in einer einzigen Suchoberfläche. Claude ist in der öffentlichen Evidenz vor allem als research- und citation-orientierte Umgebung sichtbar. OpenAISimilarwebGoogleAnthropic
Diese Plattformen unterscheiden sich nicht nur in Reichweite, sondern auch in ihrer kommerziellen Logik. ChatGPT positioniert Shopping Search aktuell als organische Produktauswahl, Google arbeitet mit hybriden organischen, AI-generierten und bezahlten Oberflächen, und Claude ist besonders für research-intensive High-Consideration-Journeys relevant.
Evidenzsynthese
1. Reichweite und Traffic-Volumen
Auf Reichweitenebene ist die Antwort weiterhin klar: klassische Google-Suche performt deutlich größer. Ahrefs analysierte rund 35.000 Websites und fand im März 2025, dass AI-Referrals nur 0,1 Prozent des gesamten Referral-Traffics ausmachten und Google 345-mal mehr Traffic als ChatGPT, Perplexity und Gemini zusammen sendete. Ahrefs
Gleichzeitig wäre es analytisch falsch, die geringe absolute Referral-Quote als Bedeutungslosigkeit zu deuten. Adobe meldete für Retail im Oktober 2025 einen Anstieg von AI-getriebenem Traffic um 1.200 Prozent gegenüber dem Vorjahr; in der Holiday Season 2025 lag das Plus immer noch bei 693 Prozent. Das Muster lautet also nicht groß, sondern klein, aber schnell wachsend. AdobeAdobe
2. Post-Click-Conversion-Effizienz
Die konsistenteste positive Evidenz für LLMs findet sich nicht bei der Reichweite, sondern bei der Effizienz nach dem Klick. Seer Interactive berichtete in einer Client-Analyse über 15,9 Prozent Conversion aus ChatGPT-Traffic gegenüber 1,76 Prozent aus Google Organic; Visibility Labs fand über 94 E-Commerce-Shops hinweg 1,81 Prozent Conversion aus ChatGPT gegenüber 1,39 Prozent aus non-branded Organic Search. SeerVisibility Labs
Adobe meldet für den US-Retailmarkt, dass AI-Traffic im Oktober 2025 bereits 16 Prozent eher konvertierte als Non-AI-Traffic und in der Holiday Season 2025 sogar 31 Prozent besser konvertierte. Die plausibelste Erklärung dafür ist Intent Compression: Vergleich, Ausschluss und Präferenzklärung finden häufiger schon im AI-Gespräch statt, bevor der erste Site-Besuch überhaupt beginnt. AdobeAdobe
3. AI Overviews, Zero Click und der Druck auf klassische Klickökonomie
Google verändert die Suchökonomie parallel selbst. Pew analysierte 68.879 Google-Suchen und zeigte: Wenn eine AI Summary erschien, klickten Nutzer nur in 8 Prozent der Besuche auf ein traditionelles Suchergebnis; ohne Summary lag dieser Wert bei 15 Prozent. Ahrefs und Seer Interactive berichten zusätzlich von sinkenden CTRs auf informationsnahe Query-Sets, wenn AI Overviews sichtbar werden. PewAhrefsSeer
Für Marken bedeutet das: Google bleibt der dominante Suchraum, absorbiert aber einen wachsenden Teil der klassischen Klickökonomie innerhalb der eigenen Oberfläche. Der Druck trifft damit nicht nur SEO, sondern im Upper Funnel auch Paid Search.
4. Trust, Glaubwürdigkeit und Kaufunterstützung
Vertrauen ist der Bereich, in dem die pauschale Erzählung von der überlegenen AI empirisch am wenigsten tragfähig ist. Pew zeigt für AI-Zusammenfassungen ein gemischtes Bild: 53 Prozent vertrauen den Informationen zumindest etwas, aber nur 6 Prozent sehr stark. Gleichzeitig berichtet Adobe funktionale Akzeptanz: 64 Prozent waren mit den durch AI erhaltenen Links zufrieden und 65 Prozent fühlten sich nach AI-Unterstützung sicherer beim Kauf. PewAdobe
Peer-reviewte Studien machen deutlich, dass Trust in AI-Shopping-Kontexten stark von Interaktivität, Erklärbarkeit, Glaubwürdigkeit, sichtbaren Quellen und dem wahrgenommenen Risiko abhängt. Der LLM-Formfaktor allein erzeugt keinen automatischen Vertrauensvorsprung. Ding/NajafChakrabortyMcGrath
5. Organic Search vs. Paid Search
Für Google Ads bleibt das Evidenzbild komplex. Google-eigene Inkrementalitätsstudien argumentieren für hohe zusätzliche Klickanteile von Search Ads, auch wenn organische Rankings bereits vorhanden sind. Das bekannte eBay-Feldexperiment von Blake, Nosko und Tadelis zeigt jedoch, dass der kurzfristige Zusatznutzen von Paid Search bei starken Marken überschätzt werden kann, vor allem auf Brand-Keywords. ChanChanBlake
Die relevante Implikation lautet deshalb nicht, dass Google Ads nicht funktioniert, sondern dass Paid Search ein hochgradig kontextabhängiger Kanal ist. Qualität und Inkrementalität hängen von Markenbekanntheit, Keyword-Typ, Query-Intent und sauberem Experimentdesign ab.
6. Attribution und Messleckage
Ein zentrales methodisches Ergebnis ist die Diskrepanz zwischen Referral-Traffic und Verhaltensverschiebung. Während Ahrefs nur 0,1 Prozent direkten AI-Referral misst, berichten Surveys deutlich stärkere Verschiebungen in Richtung AI-Suche und AI-Summaries. Visibility Labs beschreibt explizit den Fall, dass ein Nutzer in ChatGPT recherchiert, die Marke danach über Google sucht und der Kauf in Analytics schließlich als Brand Search auftaucht. Semrush ergänzt, dass AI-Plattformen Referrer nicht immer sauber übergeben, sodass Besuche oft als Direct Traffic erscheinen. AhrefsVisibility LabsSemrush
Think11-SITCA-Matrix
| Kanal | Scale | Intent | Trust | Control | Attribution | Primäre Rolle |
|---|---|---|---|---|---|---|
| LLM-Referrals | Niedrig bis noch klein | Hoch | Mittel, stark abhängig von Quellen und Transparenz | Niedrig bis mittel | Niedrig | High-intent Discovery, Vorauswahl, Consideration-Kompression |
| Google Organic | Sehr hoch | Mittel | Historisch hoch | Niedrig | Mittel | Breite Nachfrageabdeckung, Autorität, kontinuierliche Sichtbarkeit |
| Google Ads | Hoch | Mittel bis hoch | Niedriger als Organic, aber transparent gekennzeichnet | Sehr hoch | Hoch | Kurzfristige Nachfrageabschöpfung, Skalierung, kontrollierbares Testing |
Implikationen für Marken und Agenturen
- Keine Substitutionslogik: LLM Visibility sollte nicht gegen SEO oder SEA ausgespielt, sondern als zusätzlicher Layer der Demand Architecture verstanden werden.
- GEO wird operativ: Produktdaten, Vergleichsseiten, FAQ-Strukturen, Preise, Verfügbarkeit und Quellenklarheit gewinnen weiter an Gewicht.
- Brand Search wird zum Leakage-Ziel: Ein Teil des AI-Einflusses materialisiert sich erst in Brand Search und darf nicht blind als rein eigene Leistung verbucht werden.
- Upper-Funnel-Paid muss neu bewertet werden: Informationsnahe Keywords verlieren unter AI-Overviews an Klickökonomie; hochintente Query-Sets bleiben robuster.
- Trust-Design ist ein Performance-Hebel: Quellen, Zitate, Aktualität und glaubwürdige Third-Party-Signale erhöhen die Handlungswahrscheinlichkeit.
Vorschlag für eine primäre Think11-Benchmark-Studie
Aus der Evidenzsynthese folgt direkt ein belastbares Benchmark-Design: Think11 sollte eine panelbasierte Multi-Client-Studie über mindestens zwölf Monate aufbauen, ergänzt um monatliche Reporting-Schnitte und quartalsweise Vertiefungen. Abgedeckt werden sollten mindestens DTC/E-Commerce, B2B Lead Generation, High-Consideration Services und Local/SMB.
Kern der Studie ist eine Messarchitektur, die direkte Referrals, assistierte Journeys und inkrementelle Lift-Effekte gleichzeitig abbildet. Dafür braucht es ein AI-spezifisches Channel Grouping, CRM-Rückführung bis auf Opportunity- oder Umsatzebene, Post-Conversion-Befragungen auf der Thank-you-Page sowie kontrollierte Suchanzeigen- und Content-Experimente.
Fazit
Die verfügbare Evidenz liefert 2026 keinen pauschalen Kanalsieger. Vielmehr entstehen zwei Performance-Ökonomien: Google Search und Google Ads liefern Reichweite, Nachfragefang und operative Steuerbarkeit. LLMs verdichten in vielen Fällen die Journey vor dem Klick und zeigen dadurch auffällig hohe Post-Click-Effizienz.
Für Marken ist deshalb kein Entweder-oder sinnvoll. Wer Search, Paid und LLM Visibility sauber zusammendenkt, gewinnt Reichweite, Vergleichsrelevanz und messbare Nachfrage. Wer dagegen weiter nur in einzelnen Kanal-Silos misst, unterschätzt den AI-Effekt systematisch.
FAQ zur Studie
Konvertiert LLM-Traffic besser als Google Search Traffic?
In mehreren öffentlichen Datensätzen ja, zumindest nach dem Klick. Die Studie zeigt aber auch: Das Volumen von Google Search und Google Ads bleibt deutlich größer. Entscheidend ist deshalb nicht Kanal-Ersatz, sondern die richtige Portfoliologik.
Ist Google Search 2026 trotzdem wichtiger als AI Search?
Für Reichweite, Nachfrageabschöpfung und operative Kontrolle eindeutig ja. AI Search wird jedoch als Discovery-, Consideration- und Vergleichsschicht schnell relevanter und beeinflusst klassische Search-Journeys indirekt mit.
Sollten Unternehmen jetzt Budget von Google Ads in AI Search verschieben?
Nein, nicht pauschal. Der belastbare Ansatz ist ein Modell aus SEO, Google Ads und LLM Visibility. Google Ads bleibt für kontrollierbare Nachfrage und Testbarkeit meist der stärkste direkte Hebel.
Was misst die Think11-SITCA-Matrix?
Die Matrix vergleicht LLM-Referrals, Google Organic und Google Ads entlang von Scale, Intent, Trust, Control und Attribution. Sie dient als Entscheidungsrahmen für Budget, Content und Kanalarchitektur.
Quellenbasis
- Adobe (2025a): Consumers spent $88.7 billion online, with AI-powered shopping continuing to rise
- Adobe (2026): AI traffic surges across industries
- Ahrefs (2025a): AI Makes Up 0.1% of Traffic, but Clicks Aren’t Everything
- Ahrefs (2025b): AI Overviews Reduce Clicks by 34.5%
- Anthropic (2026): Web search tool
- Bain & Company (2025): Consumer reliance on AI search results signals new era of marketing
- Blake, Nosko & Tadelis (2015): Consumer Heterogeneity and Paid Search Effectiveness
- Capgemini Research Institute (2025): 71% of consumers want generative AI integrated into shopping experiences
- Chan et al. (2011): Incremental Clicks: The Impact of Search Advertising
- Chan et al. (2012): Impact of Ranking of Organic Search Results on the Incrementality of Search Ads
- Chakraborty et al. (2024): Enhancing trust in online grocery shopping through generative AI chatbots
- Ding & Najaf (2024): Interactivity, humanness, and trust
- Google (2025a): AI Overviews expansion update
- Google (2025c): AI Mode in Google Search updates
- Google (2026): New sponsored results label in Google Search
- McGrath, Cooper & Duenser (2024): Users do not trust recommendations from a large language model more than AI-sourced snippets
- OpenAI (2025a): Introducing shopping research in ChatGPT
- OpenAI (2026a): Einkaufen mit ChatGPT Search
- OpenAI (2026b): Turn chats into checkouts / ChatGPT merchants
- Pew Research Center (2025a): Google users are less likely to click on links when an AI summary appears
- Pew Research Center (2025b): Americans have mixed feelings about AI summaries
- Seer Interactive (2025a): How traffic from ChatGPT converts
- Seer Interactive (2025b): AIO impact on Google CTR
- Semrush (2025): How to Track, Measure, and Boost AI Referral Traffic
- Similarweb (2025): Top AI Tools
- Visibility Labs (2026): ChatGPT Traffic Converts Better than Non-Branded Organic Search
- Yang & Ghose (2010): Organic and Sponsored Search Advertising
- Lo, Hsieh & Chiu (2014): Clicking and eye movement behaviors on keyword advertising