qrios

IT ist kurios!

Fehlerhaftes WebAnalytics: Big Data oder eher Big Fraud?

1 Kommentar

Die Daten von Tracking- und Targeting-Tools sind schon immer falsch. Selbst bei optimaler Implementierung in einer vollkommen kontrollierten Umgebung weichen sie im niederen Prozentbereich von der Realität ab. Dafür sind Effekte im Netz ebenso verantwortlich wie solche auf dem Nutzercomputer. 

In einer heterogenen Umgebung, wie man sie heute mit dutzenden Browsern mit verschiedensten Erweiterungen auf dutzenden Betriebssystemen findet, überschreiten die Abweichungen eine statistisch akzeptable Fehlertoleranzen erheblich. Sehr viele Zahlen dürften eigentlich nicht mehr kommuniziert werden.

Welche Nutzerdaten sind fehlerhaft und warum?

Schaut man durch die Liste der Features von Tracking-Tools wie Omniture SiteCatalyst, Google Analytics, Webtrekk oder Comscore, basieren viele der Angaben auf der Frage, ob die Nutzer über mehrere Sessions hinweg identifizierbar sind. Die Verteilung der technischen Voraussetzungen wie Browserversionen oder Bildschirmgrößen ist eigentlich nur sinnvoll, wenn man User nicht bei jeder neuen Sitzungen jeweils neu zählt. Noch wichtiger ist diese Fähigkeit, wenn man wissen möchte, wie viele Nutzer die Site regelmäßig besuchen, die sogenannten Unique Visitors. Auch die Messungen der Reichweite im Social Media sind davon abhängig.

Rund 2/3 aller Funktionen einer typischen WebAnalytics-Lösung basieren auf der Wiedererkennung der Nutzer. Im Online-Werbe-Business fließt ohne die (Wieder)Erkennung der Nutzer kein Cent.

Als einzige (halbwegs) akzeptierte und praktikable Lösung für die Wiedererkennung eines Nutzers existieren derzeit Cookies. Je nach Anbieter und Vertrag des Publishers mit dem Anbieter werden diese als First- oder Third-Party-Cookie gespeichert.

Sowohl die Desktop- als auch die mobile Variante von Safari und mithin mehr als 15% aller Nutzer verbieten das Setzen von Drittanbieter-Cookies in der Standardeinstellung. Es ist darüber hinaus sehr unwahrscheinlich, dass Nutzer diese Einstellung ändern, weil so gut wie keine Site die Funktion einstellt, wenn kein solches Cookies gesetzt werden kann.

Zu den Safari-Nutzern kommen noch die wahrscheinlich paranoideren Firefox-Nutzer, die beim Beenden ihres Browser die Historie und die Cookies löschen. Bei einer sehr wenig repräsentativen Umfrage im Freundeskreis liefert hier einen Wert von etwa einem Drittel der Nutzer. Eine Funktion, die auch Chrome und Opera bietet.

Einen weiteren und nicht unerheblichen Einfluss auf die Wiedererkennbarkeit hat das inzwischen in allen Browsern verfügbare Feature des “Private Browsings”. Hier wird zwar ein Cookie gesetzt, dieses aber nach schliessen oder Verlassen des letzten Fensters mit der Domain wieder gelöscht wird.

Beim aktuellen mobilen Safari wird beim privaten Surfen auch der Do-Not-Track-Header an den Server gesendet. Eine Untersuchung auf qrios.de hat ergeben, dass etwas über 10% der Nutzer diesen Header setzen. In der Mehrheit der Fälle dürfte es sich um Nutzer handeln, die im privaten Modus unterwegs sind.

Zu den mindestens 15% Safari-Nutzern kommt also nochmals mindestens ein zweistelliger Prozentsatz von Usern, die nach einem Schliessen des Browsers nicht mehr wiedererkennbar sind. Plus die Nutzer, die im privaten Modus surfen dürften es derzeit unter Umständen (je nach publizistischem Angebot) bis zu einem Drittel der Nutzer sein, die bei einem wiederholten Besuch nicht als Wiederkehrer zu erkennen sind.

Sieht man sich jedoch die eben von Webtrekk veröffentlichten Zahlen über die Nutzer des deutschen Netzes an, stellt man überrascht fest, dass lediglich 9% der Systeme Third-Party-Cookies ablehnen. Und die Zahl ist seit der letzten Veröffentlichung auch noch um 0.5% gesunken.

Ein Drittel der Nutzer vs. 9%

Auch bei Omniture und Comscore erhält man je nach Art der Implementierung auf einer Site vergleichbare Daten. Wenn die Daten jedoch fast um Faktor drei abweichen sind auch die darauf basierenden Daten, wie die technischen Informationen, die Wiederkehrer oder die Conversion von Werbemaßnahmen mehr als fragwürdig.

 

 

Wie wenig die Messungen mit der Realität zu tun haben kann jeder selbst überprüfen. Man möge mit verschiedenen Browsern auf den nuggad-Link klicken. Dort wird dem Nutzer dargestellt, welches Profil die DHL-Tochter an Hand der Surfhistorie gespeichert hat.

Da ich normalerweise mit vier verschiedenen Geräten (plus mehrere VMs) unterwegs bin, jeweils mit zwei oder mehr Browsern, bin ich sicher nicht der Archetyp für eine optimale Profilerkennung. Dennoch sind selbst auf den drei Hauptbrowsern mit denen ich mehrere hundert – hauptsächlich deutsche – Sites täglich aufrufe, keine auch nur annähernd stimmigen Profile vorhanden.

Dabei setzt nugg.ad unter anderem bei der Welt-Online eine Technik ein, die man als Cookie-Sharing bezeichnet. Dabei wird das nugg.ag-Script so von der Welt aufgerufen, dass beide Domains eine eindeutige ID kennen und verwenden und so ein gelöschter 3rd-Party-Cookie später wieder hergestellt werden kann, falls er “verloren” gegangen ist.

Wen stören die fehlerhaften Daten?

Die meisten Kunden der Analytics- und Targeting-Anbieter sind sich der Problematik nicht bewusst. In Deutschland sind mir bisher nur zwei Kunden begegnet, die sich der Problematik gestellt haben und von dem Anbieter Erklärungen über die zu erwartenden Abweichungen verlangten. Bei Online-Werbung gibt es üblicherweise noch mindestens einen Intermediate zwischen Werbendem, AdServer und Publisher. Diesen Broker stören die fehlerhaften Daten nicht. Vielmehr gibt es viele Situationen in denen sich dadurch das Budget erhöhen lässt.

 


Written by qrios

March 30th, 2013 at 4:59 pm

Posted in analytics

One Response to 'Fehlerhaftes WebAnalytics: Big Data oder eher Big Fraud?'

Subscribe to comments with RSS or TrackBack to 'Fehlerhaftes WebAnalytics: Big Data oder eher Big Fraud?'.

  1. [...] Eine weitere Quelle sind die Zahlen des Verbandes der deutschen Zeitschriftenverlage, besser bekannt als IVW. Unter pz-online.de findet man (sehr gut versteckt) eine Tabelle mit den Zahlen für Visits und Unique Visitors für fast alle deutschen Online-Angebote die sich über Werbung finanzieren und noch einige mehr. Auch die IVW-Zahlen sind eigentlich nur als Vergleichswerte verwendbar, da die Messmethode, wie bei allen Tracking-Tools überhaupt, verschiedene Fehlerquellen hat (siehe: Fehlerhaftes WebAnalytics: Big Data oder eher Big Fraud?). [...]

Leave a Reply