Wer regelmäßig mit Google Analytics den Datenverkehr seiner Website analysiert, kennt das Problem: Referrer Spam. Dabei handelt es sich um Pseudo-Besuche, die über eine andere Domain wie z.B. buttons-for-your-website.com, darodar.com, free-share-buttons.com, semalt.com uvm., auf die eigene Website geleitet werden. Diese Domains werden dann als „Verweis“ (Referrer) in Google Analytics erfasst. Und nicht selten wollen die Daten suggerieren, es seien gleich mehrere Besucher, die über besagten Verweis kommen. Aber hinter den Domains der Spam-Referrers existieren keine Webseiten und somit auch keine Links, über die „echte“ Internetsurfer den Weg auf Ihre Website finden könnten. Es sind Pseudo-Besuche aus der Welt des Spams.
Referrer Spam als neue Form des Marketings?
Doch was steckt dahinter? Warum der ganze Aufwand Schein-Besuche in den Statistiken von Google Analytics zu platzieren?
Jeder aufmerksame Webmaster oder Webseitenbetreiber verfolgt regelmäßig mit Interesse, woher die Besucher seiner Website kommen. Vor allem neue Verweise machen neugierig. Man ruft auch schon mal die URL des Verweises auf, um zu sehen, welche Website einen Link auf die eigene Seite gesetzt hat. Und eben das beabsichtigen die Referral-Spammer. Gewöhnlich wird man nach Seitenaufruf weitergeleitet auf die Seite eines Online Shops, eines dubiosen Sonderangebots oder anderen Webseiten aus dem Dschungel des Affiliate Marketing. Auf diese Weise versuchen die Spammer Geld zu machen.
Schadet Referrer Spam?
In erster Linie macht Referrer Spam nichts und schadet nicht, zumindest auf den ersten Blick. Abgesehen davon, dass es nervt und in Google Analytics die Datenquelle „Verweis“ vollmüllt.
Allerdings verfälscht es die Website-Daten wie Besucherströme, die Quellen der Verweise oder die durchschnittliche Besuchsdauer. Und spätestens bei der Auswertung von Marketing Kampagnen wird Refrerr Spam aufgrund der verfälschten Werte zum Ärgernis.
Spam-Verweise indentifizieren
Um Referrer Spam in Google Analytics aus der Datenansicht heruaszufiltern sind mehrere Schritte notwendig. Zunächst muss Referrer Spam als solcher identifizieren werden, damit nicht irrtümlich echte Datenquellen auf die schwarze Liste gesetzt werden. Wer unsicher ist, ob es sich bei einem neuen Verweis um Spam handelt, kann auf der Referrer Spam Blacklist von piwik nachsehen. Für die weiteren Schritte ist ein Grundwissen über die Fuktionsweise des Spams von Vorteil.
Wie funktioniert Referrer Spam?
Es gibt hauptsächlich zwei Methoden: Ghost Referrer Spam und Crawler Referrer Spam.
Ghost Referrer Spam
Bei Ghost Referrers handelt es sich um die eingangs angesprochenen Pseudo-Besuche, die im Verweis-Bericht von Google Analytics auftauchen. Tatsächlich aber werden die betroffenen Websites nie wirklich besucht. Der Ghost Referrer benutzt lediglich die Analytics Tracking ID der Website (die ID findet man im Tracking Code im Format: „UA-XXXXXX-X“) und sendet die unechten Besuchsdaten direkt an Google ohne die Seite selbst jemals aufzurufen.
Crawler Referrer Spam
Web Crawler sind Bots und werden u.a. von Suchmaschinen eingesetzt, um Webseiten im Internet zu durchsuchen und zu indexieren. Referrer Spambots sind vergleichbare Programme, nur dass diese nichts indexieren, sondern lediglich ihre Fußabdrücke in den Analytics Daten hinterlassen wollen. Im Unterschied zu Ghost Referrer ruft ein Crawler die betroffene Website tatsächlich auch auf.
Verweise in Google Analytics ausfiltern
Bekannte Bots filtern
Nachdem Referrer Spam identifiziert ist, können Sie in einem ersten Schritt die Spambots ausschließen. Gehen Sie dazu in Google Analytics auf „Verwalten → Spalte Datenansicht → Einstellungen der Datenansicht“ und wählen dort die Option „Bots herausfiltern“ aus. Damit werden bekannte Bots aus den Google Analytics Daten herausgefiltert.
Das schließt allerdings nur die für Google bekannten Bots und Crawler aus. Die unbekannten werden von diesem Filter nicht erfasst und tauchen nach wie vor in der Datenansicht auf.
Spam Referrer ausfiltern – Filter erstellen
Eine einfache Möglichkeit die restlichen Referrers loszuwerden, ist einen Filter anzulegen. Wählen Sie dazu in Google Analytics die Menüpunkte „Verwalten → Spalte Datenansicht → Filter“ und klicken auf die Schaltfläche „Neuer Filter“.
Erstellen Sie einen neuen Filter:
1. Vergeben Sie einen beliebigen Namen für den Filter
2. Wählen Sie Filtertyp „Benutzerdefiniert“
3. Bei Filterfeld „Kampagnenquelle“ einstellen
4. Unter Filtermuster die auszuschließende Domain (z.B. free-share-buttons.com)
5. Speichern Sie den Filter
Es kann etwas dauern, bis der Filter in der Datenansicht Wirkung zeigt und die gefilterten Werte zu sehen sind.
Um weitere Referrers auszuschließen, muss für jede Spam-Domain ein Filter erstellt werden. Alternativ können auch Regular Expressions benutzt werden, um mehrere Spamdomains in einem Filter ausschließen.
Direkte Zugriffe der Crawler ausschließen
Mit den beschriebenen Methoden lassen sich recht zuverlässig die Daten in den Verweisen von Google Analytics ausmisten. Was noch verbleibt, sind die letzten Spuren, die von den Crawlern hinterlassen werden. Durch die gefilterte Datenansicht tauchen sie jetzt im Analytics-Bericht zwar nicht mehr auf, aber dadurch, dass Crawler die betroffenen Websites tatsächlich auch aufrufen, hinterlassen sie weitere Spuren als „direkte Zugriffe“. Wer diese Daten auch noch beseitigen möchte, kann dies durch die Serverkonfiguration mittels htaccess tun.
Ein Beispiel für htaccess Code, das 3 umtriebige Spambots (semalt.com, buttons-for-website.com und buttons-for-your-website.com) von Ihrer Website verbannt:
## SPAMBOTS BLOCKIEREN
RewriteCond %{HTTP_REFERER} semalt.com [NC, OR]
RewriteCond %{HTTP_REFERER} buttons-for-website.com [NC, OR]
RewriteCond %{HTTP_REFERER} buttons-for-your-website.com [NC]
RewriteRule .* - [F]
Ein alternativer Ansatz Referral Spam auszuschließen, geht den umgekehrten Weg. Hier wird zunächst der gesamte eingehende Datenverkehr in einem ersten Schritt blockiert und danach durch eine „Whitelist“ ergänzt. Allerdings ist diese Methode recht zeitaufwändig und setzt fortgeschrittene Kenntisse in der Serverkonfiguation voraus.