• Agentur für Webdesign & Print
  • Internetagentur Köln
  • Screendesign & Webentwicklung

Mehr als nur Klatsch und Tratsch

Aktuelle Meldungen aus der Agentur


Alle Meldungen anzeigen

Schlau gemacht: Referral Spam - was man dagegen unternehmen kann

20.01.2016

Schlau gemacht: Referral Spam - was man dagegen unternehmen kann

Vermutlich jeder, der einmal damit angefangen hat, systematisch Google Analytics zu benutzen, ist früher oder später auf dieses Phänomen gestoßen: man freut sich über eine hohe Zahl an Besuchern, man freut sich wenn diese über andere Webseiten kamen und stellt bei näherer Betrachtung der Liste dann fest, dass es sich hierbei um Spam handelt. Für diese Aufrufe hat sich der Begriff „Referral Spam“ etabliert. Solche Verweise tauchen unter Domainnamen wie z.B. darodar.com oder free-social-buttons.com auf. Damit sollen Webseitenbetreiber wie Sie dazu gebracht werden, diese Domains zu besuchen und dort beworbene Produkte oder Dienstleistungen in Anspruch zu nehmen.

Google Analytics bietet in seinen Einstellungen zwei Funktion zum Ausblenden von Referral Spam an. Zum einen die Einstellung „Alle Treffer von bekannten Bots und Spidern ausschließen“ in den Einstellungen der Datenansicht und zum anderen die „Verweis-Ausschlussliste“ unter den Tracking-Informationen. Beide Funktionen haben aber keinen merklichen Effekt! Es gibt aber mit den von Google bereitgestellten Mitteln durchaus Möglichkeiten den Spam zu bekämpfen. Hierzu gibt es verschiedene Wege, zwei davon wollen wir vorstellen und ihre Vor- und Nachteile kurz beschreiben.

Spam effizient ausschließen: die Datenquellen

Unabhängig davon auf welche Weise wir uns des Problems annehmen möchten, benötigen wir eine gute Grundlage dafür, welche Verweise für uns überhaupt Spam sind. Im Web finden sich verschiedene einschlägige Listen mit URLs von denen der Referral Spam ausgeht: wir haben uns für diese frei auf GitHub verfügbare Liste entschieden. Sie ist recht umfangreich und liegt in verschiedenen einfach weiterzuverarbeitenden Formaten vor.

Von der Domainliste zum funktionierenden Spamfilter

Die als Konfigurationsdateien für verschiedene Webserver vorliegende Form der Daten (z.B. .htaccess für Apache oder .conf für NGINX) nutzt uns leider noch nicht viel: die Verursacher des Referral Spams rufen unsere Webseiten nicht tatsächlich auf. Sie generieren Google Analytics Codes auf Zufallsbasis und führen dann entsprechende Skripte auf dem eigenen Server aus. Diese „Besucher“ waren also nie wirklich auf unserer Webseite!

Um schnell und einfach zu einer in Google Analytics nutzbaren Form unserer Sperrliste zu kommen, haben wir ein Skript geschrieben, welches aus der Liste einen sog. „Regulären Ausdruck“ mit der passenden Syntax generiert. So können wir Updates der verwendeten Liste oder auch eigene individuelle Sperren unkompliziert in das von uns benutzte Segment einfügen.

Variante 1: Ein gefiltertes Segment

Eine Art zur Verhinderung der Anzeige von Bots in Google Analytics ist die Erstellung eines Segments, welcher nur Bots ausschließt und die echten Nutzer weiterhin anzeigt. Das geschieht am besten mit einem Regulären Ausdruck, der die einschlägigen Verweisquellen (bei uns sind es gegenwärtig über 400) aus der Datenansicht herausfiltert.

  • Vorteil: Diese Art von Spamfiltern lassen sich für den Eigenbedarf recht einfach aus vorhandenen Spamlisten ergänzen und um eigene Einträge erweitern.
  • Vorteil: Der Nutzer kann diesen einen Filter in allen seinen Properties (also in Google Analytics angelegten Webseiten) benutzen. Ein solches Segment bietet also eine gute Grundlage um z.B. einem Kunden genau über die Nutzung seiner Webseite berichten zu können.
  • Nachteil: Einem anderen User, der ebenfalls Zugriff auf die Property hat, ist damit nicht geholfen.
  • Nachteil: Man muss dieses Segment bei der Betrachtung der Daten immer wieder manuell auswählen, es lässt sich nicht voreinstellen.

Variante 2: Filter auf Ebene der Datenansicht

Es gibt eine Alternative, die einige der Probleme mit der Benutzung von Segmenten aus dem Weg räumt: ein Filter auf der Ebene der Datenansicht selbst. Bevor wir anfangen auf diese Weise die Daten zu filtern, ist es wichtig, dass wir zunächst eine neue Datenansicht erstellen. So haben wir immer die ursprüngliche Datenansicht mit allen Daten zum Abgleich, ergänzt durch unsere gefilterten Ansichten. Dadurch kann verhindert werden, dass über betroffene Zugriffe überhaupt erst Daten erfasst werden.

  • Vorteil: Die bereinigten Daten stehen allen Nutzern mit Zugriff auf die Datenansicht zur Verfügung.
  • Nachteil: Google beschränkt die Länge dieser Filter. Bei effektiver Nutzung der bestehenden Möglichkeiten ist also die Einrichtung und Pflege von wenigstens zwei bis drei Filtern für eine gute Abdeckung der Spamquellen erforderlich. (Dieser Aufwand ist aber aus unserer Sicht durchaus vertretbar und kann von uns gut für unsere Kunden umgesetzt werden.)
  • Nachteil: Der Filter greift nur für zukünftige Spamaufrufe.

Nach Umsetzung einer oder beider Varianten sollten Sie auf jeden Fall Verweisquellen für Ihre eigene Seite durchschauen. Aller Voraussicht nach finden sich dort weitere Spamquellen.

 

Fazit: Dieses Problem wird uns noch länger beschäftigen

Für uns ist der gegenwärtige Stand im Umgang mit diesem Problem jedenfalls eine Mischform. Wir generieren aus der vorliegenden Sperrliste den Code für ein umfangreiches Segment für unseren eigenen Gebrauch, daneben erstellen wir Datenansichten mit Filtern, die den gröbsten Spam herausfiltern.

Das Fazit zu diesem Thema fällt zurzeit leider noch ernüchternd aus: Referral Spam wird uns leider noch länger „erhalten bleiben“. Im Alltag gibt es Wege mit dem Thema umzugehen, aber wer detailliert und belastbar erfassen möchte, woher die Besucher seiner Webseite kommen, muss hier leider immer wieder Arbeit investieren. Für uns ist auch nicht verständlich, warum Google selbst das Thema nicht intensiver angeht.

Haben Sie Fragen zum Umgang mit Referral Spam auf Ihrer Präsenz? Wir stehen Ihnen gerne mit Rat und Tat bei der Spambekämpfung, bei Fragen zu Google Analytics und vielen anderen Themen zur Verfügung.

profilschmiede
Agentur für Webdesign & Print
die profilschmiede GmbH & Co. KG
Dellbrücker Hauptstra?e 137
Deutschland-51069 Köln

Telefon: +49 (0)221 16 94 12 90
Telefax: +49 (0)221 16 94 12 92
E-Mail:
Internet: www.profilschmiede.de

Aktuellererer

Aktuellererer

Ihr Web-Auftritt ist durchdacht und stimmig. Neuigkeiten finden aber keinen Platz?

Die einfache Lösung: Werden Sie zum Blogger. Google wird das auch gefallen ... Wir helfen Ihnen bei der perfekten Integration.

https://www.profilschmiede.de

die profilschmiede

Ihnen hat die Präsenz gefallen?

Unter Arbeitsproben finden Sie weitere Details zur Aufgabe und Umsetzung.

Kontakt

Kontakt

Wie können wir Ihnen heute weiterhelfen? Noch wissen wir es nicht, wir freuen uns dennoch über einen Anruf unter

0221 16941290

oder eine E-Mail an info@profilschmiede.de.