Wie Google Analytics den Anteil der Suchanfragen schönrechnet
Für Site-Betreiber und Blogger sind die eingehenden Keywords eine der wichtigsten Quellen für direktes Feedback. Wenn jemand mit dem Suchterm “warum werde ich nie zu partys eingeladen” zu qrios kommt, kann ich in Zukunft vielleicht mehr praktische Lebenstipps geben. Oder auch nicht.
Google zählt Keywords immer wieder und wieder und wieder …
Allerdings würde ich erwarten, dass mir diese anonyme Suche nur dann in den Keywords von Google Analytics gezeigt wird, wenn sie auch tatsächlich stattgefunden hat. Leider sieht Google das etwas anders. In der Liste der Keywords schlägt das sogenannte First Cookie Counting zu.
Wenn ein Nutzer beispielsweise im März bei Google nach “nokia analyse” gesucht hat und dabei auf qrios.de gestossen ist, erscheint diese Suche in den Keywords. Findet der Nutzer die Inhalte hier interessant und kommt im April mal wieder vorbei (weil er sich an die URL erinnert oder von seinem Browser daran erinnert wird oder noch Bookmarks verwendet) dann erscheint “nokia analyse” wiederum in der Analyse für den April.
Ein Nutzer von Google Analytics müsste jedoch annehmen, dass nur die Suchbegriffe dargestellt werden, die tatsächlich auch in dem gewählten Analysezeitraum stattgefunden haben. Insbesondere für Sites mit aktuellen Inhalten sind historische Suchanfragen extrem störend und verzerren das Bild erheblich.
Bei sehr unterschiedlich großen Sites ergibt sich bei der genaueren Analyse ein konsistentes Bild der Verzerrung der Daten. Bildet man ein Segment in dem man nur die Nutzer betrachtet, die das erste mal auf der Site waren und die von einer Suchmaschine gekommen sind bleiben nur noch ein Drittel der Einträge übrig: statt durchschnittlich ~35% sind es nun nur noch ~12% der Nutzer. Ein Wert, der übrigens deutlich näher an den Ergebnissen von alexa.com mit ~16% für den Vergleichszeitraum liegt (Werte für eine große deutsche Site mit mehr als 5Mio Visits pro Monat). Die Differenz von 12% zu 16% erklärt sich leicht durch die zu erwartende Anzahl von Usern, die (un)regelmäßig die Cookies löschen. Bei dem Panel-basierten System Alexa werden diese User dennoch gezählt.
Was hat Google davon?
Bei der Frage, warum Google Analytics diese merkwürdige Zählweise verwendet kann man nur spekulieren. Die freundliche Antwort lautet: Google Analytics verwendet das gleiche Verfahren wie es traditionell bei Kampagnenabrechnungen verwendet wird. Derjenige Advertiser, der den Nutzer ursprünglich zu der Seite geführt hat bekommt die Provision (“First-Party-Cookie”).
Die unfreundliche Antwort lautet: Google Analytics rechnet künstlich den Anteil der Nutzer hoch, die über Suchmaschinen auf eine Seite gelangen.
Disclaimer: Der Autor besitzt keine Google-Aktien. Allerdings verdient er sein Geld mit der Nutzungsanalyse von verschiedenen Sites und setzt dafür unter anderem Google Analytics ein. Allerdings nur, wenn es sich nicht vermeiden lässt, da er der Meinung ist, dass Cookie-basierte Analysesysteme evil sind.
Hätte man nicht mal bei Google nachfragen können, warum das so gerechnet wird und ob man das zum Beispiel in den Einstellungen abschalten kann? Zwar wundere ich mich schon was sie da zusammenkummulieren (und kann es bei unseren Sites auch nachvollziehen) aber ich würde Google da erst mal keine böse Absicht unterstellen. Immerhin ist es ja eine übliche Verfahrensweise bei Kampangentracking.
Disclaimer: Ich besitze auch keine Google Aktien, benutze aber intensiv GA
Thomas Carstens
26 Apr 11 at 11:27 am
Das hätte Ihnen allerdings schon vorher auffallen müssen. Denn wenn man sich nur die User ansieht, die über eine Suchmaschine gekommen sind wird man feststellen, dass dabei auch “Returning Users” sind. So bleibt nichts weiter als ein reißerisches “Google is evil”.
Agent S.
26 Apr 11 at 8:44 pm
@Thomas: Ich habe an Google geschrieben und noch keine Antwort erhalten. Wenn die da ist werde ich ein Update nachschieben.
@Agent: Wenn ich einen Monat auswähle und mir die Suchbegriffe ansehe will ich unter keinen Umständen Suchbegriffe aus dem letzten Jahr dabei haben. Und wenn ich mir die User ansehe, die über eine Suchmaschine reingekommen sind erwarte ich darin bitte keinen einzigen Nutzer, der die URL direkt eingegeben hat oder über einen Bookmark zu der Seite kam.
In keiner einzigen Analyse die ich bisher gesehen habe und in der von 30% oder gar 50% Suchmaschinenherkunft gesprochen wurde, wies jemand darauf hin, dass da auch loyale Nutzer bei sind. Auf der Basis dieser Zahlen wird ziemlich viel Geld in SEO gesteckt. Offensichtlich wird dieses Geld auf der Basis falscher Annahmen investiert.
qrios
26 Apr 11 at 9:03 pm
Ich konnte gar nicht glauben, dass GA tatsächlich so zählt und habe getestet… Tatsächlich, es stimmt! Und mit der First Cookie Betrachtung ja auch irgendwie logisch…
Wie ist denn das bei SEM-Kampagnen? Google behauptet ja immer, dass es eine Branding-Wirkung gibt und die Besucher dann später auch selber (direkt oder über SEO) wiederkommen. In diesem Fall könnte man ja nie beweisen, dass es direkte Rückkehrer gibt, denn die würden ja (bis zum Cookie-Tod) zu SEM gezählt werden…
Die Frage ist doch jetzt: wie kann man die Differenz in GA anzeigen?
Also “Zeige die letzte – echte – Quelle ohne Rücksicht auf den First Cookie”…
Gibts dazu Ideen?
David
17 May 11 at 9:06 am
@David: Mit der Segmentierung gibt es nur die Möglichkeit, die Quellen von Neuen Besuchern zu identifizieren. Das heisst, man könnte nicht nur die letzte Quelle identifizieren. Eigentlich ein Unding.
Aus Sicht einer beliebigen Datenbank ist es ja kein Problem. Und auch ein Definitionsinterface für die Abfragen hab ich schon gebaut. Es sieht also so aus, als ob Google und die GA-Nutzer für die Frage nicht sensibilisiert sind.
Ich setze selbst eine Custom Variable ein, die mir eine grobe Typisierung des Referers gibt, die sich möglichst direkt an die von GA hält. Danach kann ich dann segmentieren und habe meistens ca. doppelt so viele User, wie mir die Filterung nur nach New Visitors gibt. Allerdings bleiben dann noch immer die früheren Suchbegriffe drin aber eben wesentlich dünner.
qrios
17 May 11 at 11:08 am
Würdest Du mit uns teilen, wie Dein Filter aussieht, um die custom variable zu bestücken? (ich bin in Regex nicht so fit…) Danke!
David
17 May 11 at 3:30 pm
und noch eine Frage: wenn zwischendurch der gleiche Nutzer einen SEM-Klick auslöst, wie wird der dann gezählt?
Wenn immer noch der gleiche Cookie zählt, dann würde ja auch SEM nicht als Quelle auftauchen, oder?
(ich teste das gerade, habe aber noch keine Ergebnisse)
David
17 May 11 at 3:35 pm