Zo kun je referral spam in Google Analytics blokkeren

Dit artikel is bijgewerkt op 13 april 2017. Referral spam in Google Analytics is een groeiend blijvend probleem. Bezoek van nep-referrals vervuilt je statistieken en beïnvloedt diverse metrics. Ben je dit ook zat en wil je deze referral spam voor eens en voor altijd blokkeren en verwijderen uit Google Analytics. Lees dan verder hoe je een filter aanmaakt waarmee je alleen nog bezoek ziet dat je website ook daadwerkelijk heeft bezocht.

Het probleem van referral spam in Google Analytics

Referral spam is het verschijnen van ongewenste referrals in je rapport met verwijzend verkeer in Google Analytics. Op het eerste gezicht denk je mooi wat bezoekers te krijgen van verschillende websites. Je kan je niet herinneren dat je je website bij een van deze sites hebt aangemeld, maar elke link is welkom, niet waar? Helaas linken deze websites niet echt naar jouw website.. En die zogenaamde bezoekers die ze je naar je website sturen dan? Dat zijn spookbezoekers, oftewel geautomatiseerde aanroepen van jouw analyticscode, waardoor Google Analytics denkt dat er een bezoeker op de website is. Zo schoppen deze spammers jouw statistieken in de war.

Twee soorten: ghost referrals en crawlers

Deze spamtactieken zijn onder te verdelen in twee categorieën. De eerste categorie is de ghost referral. Dit zijn referrals van websites die in werkelijkheid jouw website nooit bezoeken. Bekende ghost referrals zijn darodar, ilovevitaly, priceg, blackhatworth, hulfingtonpost.com en cenoval. De tweede categorie spam is afkomstig van crawlers, zoals semalt, buttons-for-website en makemoneyonline. Zij bezoeken je website wél.

Het verschil tussen beide is te zien als in je rapport met verwijzingen de hostnaam toevoegt als secundaire dimensie. Ik deed dat bijvoorbeeld voor de website www.mijndomeinnaam.nl:

Voorbeelden van referral spam in Google Analytics die je wilt blokkeren

Hierbij vallen twee zaken op. Ten eerste zijn de ghost referrals nu te herkennen, omdat ze niet daadwerkelijk jouw website bezocht hebben. Daarom is hun hostnaam niet gelijk aan jouw domeinnaam. In dit voorbeeld worden bijvoorbeeld apple.com en co.lumb.co gebruikt om verschillende spam referrals te creëren. Ten tweede valt op dat enkele spam referrals wél de hostnaam van de website gebruiken. Zij hebben wel jouw website bezocht en dit zijn dan ook de crawlers. Nr. 8 is de enige geldige referral in dit overzicht.

Hoe blokkeer je referral spam van ghost referrals?

De beste manier om ghost referrals te voorkomen is het aanmaken van een opneemfilter (include filter) dat alleen verkeer naar de geldige hostnaam toestaat. De spammers veranderen namelijk constant hun eigen domeinnaam die je in analytics ziet, waardoor het ondoenlijk is om elke domeinnaam te gaan filteren.

Inventariseer eerst alle geldige hostnamen die in je analyticsaccount voorkomen. Selecteer bijvoorbeeld een periode van 1 jaar en kijk onder Doelgroep -> Technologie -> Netwerk en kies als primaire dimensie hostnaam. Naast je eigen domeinnaam kom je mogelijk nog andere hostnamen tegen, zoals translate.googleusercontent.com, web.archive.org, youtube.com of namen van payment service providers (psp’s) zoals Paypal. Dit zijn ook allemaal geldige hostnamen en het is aan jou om te beslissen of je deze ook wilt blijven toestaan (ik doe het wel).

Zorg er vervolgens voor dat je minstens één ongefilterde view in je property houdt. In een andere view maak je dan een custom include filter aan op hostnaam met als filterpatroon alle hostnamen die je wilt blijven toestaan, gescheiden door een pipe-teken (|). En aangezien dit een reguliere expressie is, moet je elke punt vooraf laten gaan door een backslash. Mijn filterexpressie ziet er bijvoorbeeld zo uit:

mijndomeinnaam\.nl|translate\.googleusercontent\.com|web\.archive\.org|youtube\.com

Hoe blokkeer je referral spam van crawlers?

Na bovenstaande resteren nog de crawlers. Gelukkig wisselen deze niet zo vaak van domeinnaam, waardoor we ze vrij effectief met filters kunnen blokkeren. Maak een custom exclude filter aan en filter op het veld campagnebron. Geef weer alle bekende domeinen van crawlers op, gescheiden door een pipe-teken. Bijvoorbeeld:

7makemoneyonline\.com|buttons-for-website\.com|semalt\.com

Helaas werken filters niet met terugwerkende kracht. Dus als je oudere data wilt filteren, zul je een segment moeten toepassen.

Gebruik geen verwijzingsuitsluitingen

Sommigen hebben geopperd om alle domeinnamen van spammers toe te voegen aan de lijst met verwijzingsuitsluitingen (Beheerder -> Trackinginfo -> Lijst met verwijzingsuitsluitingen). Dit is een absolute NO-GO! Dit verwijdert weliswaar de verwijzende site uit je lijst met verwijzingen, maar het verkeer van die site wordt omgezet naar direct verkeer en blijft dus aanwezig in je statistieken. Deze functie is bedoeld om third-party websites op te geven die bij jouw website horen, zoals websites van payment providers bij een e-commerce website.

Als je deze methodes gebruikt, zou het moeten lukken om alle referral spam vanaf nu uit je Analyticsaccount te weren.

 

12 thoughts on “Zo kun je referral spam in Google Analytics blokkeren”

  1. Ik zou graag alleen verkeer van Nederland en een paar andere landen willen toestaan in Google Analytics, maar ik weet niet hoe ik dat moet doen. Filters aanmaken om andere landen uit te sluiten lukt wel. Kun je uitleggen hoe ik alleen verkeer uit een paar gekozen landen kan toestaan?

    Alvast bedankt!

    1. Hoi Marieke,

      Goed nieuws. Als je al weet hoe je verkeer uit bepaalde landen moet uitsluiten, dan ben je er al bijna 🙂 Maak een zelfde soort filter aan, maar kies voor Opnemen in plaats van Uitsluiten. Let op dat namen van landen in het Engels worden opgegeven. Dus als je alleen verkeer uit Nederland zou willen toestaan, maak je een Aangepast filter aan, kies je voor Opnemen, Filterveld = Land en vul je Netherlands in. Als je meerdere landen wilt opnemen, voer dan de landnamen gescheiden door een pipe-teken (|) in. Bijv. Netherlands|Belgium

      Succes!

  2. Ik was ook op zoek naar deze oplossing en heb het gelijk ingesteld!
    Ook bedankt voor de goede uitleg!!

  3. Top! Hier was ik voor onze webshop naar opzoek. Hopelijk krijgen wij zo een beter en schoner overzicht van onze bezoekers in Analytics.
    Bedankt!

    1. Hoi Boudewijn,

      Dat is gek. Heb je bij het aanmaken van een nieuw filter wel het filtertype op ‘aangepast’ gezet? Want daarna zie je onmiddellijk een lijst met mogelijkheden en daar staat ‘opnemen’ ook zeker tussen.

  4. “aangezien dit een reguliere expressie is, moet je elke punt vooraf laten gaan door een backslash”

    als ik maar 1 site toevoeg b.v. semalt.com diet hij het dan niet? of moet je per se semalt\.com doen? in YT videos zie ik dat ze gewoon .com doen, zonder \.com.

  5. Hoi Aad,

    Google Analytics gaat wat losjes om met de syntax voor reguliere expressies. Officieel moet er een backslash voor de punt, daarom leg ik het ook zo uit. Maar het klopt dat het bij een enkele domeinnaam ook werkt zonder backslash. Waarschijnlijk omdat veel gebruikers moeite hebben met reguliere expressies en daarom vaak gewoon een domeinnaam hier invullen zoals semalt.com. Google Analytics wil dan niet dat dit niet zou werken en helpt je dus door dit ook toe te staan. Als je maar onthoudt dat je normaal gesproken wel een backslash moet gebruiken 🙂

  6. Beste Michel,

    Over de referral spam van crawlers. Waarom moet ik om deze uit te sluiten bij ‘Filterveld’ de campagnebron selecteren en niet ‘Verwijzende URL’?

    1. Hoi Machiel,

      Goede vraag, dat heb ik me eerder ook afgevraagd toen ik verwijzende URL gebruikte zonder het gewenste resultaat. Door trial en error erachter gekomen dat ik hiervoor campaign source moest gebruiken. Analytics is helaas niet erg consistent in de naamgeving van zaken.

      Volgens hun handleiding is verwijzende URL in het geval van deze filters “de externe verwijzende URL, indien aanwezig. Dit veld wordt alleen ingevuld voor de eerste externe verwijzende URL aan het begin van een sessie.” En campagnebron “wordt gedefinieerd door de zoekopdracht van de getagde pagina.” Dat klopt niet, want campagnebron als filter bevat altijd de verwijzende URL en is dus vergelijkbaar met het begrip bron (source) in Analytics.

      Ik beschouw het dus als een irritante inconsistentie.

      Bron: https://support.google.com/analytics/answer/1034842?hl=en

Leave a Reply

Your email address will not be published. Required fields are marked *