Hoe ga je om met duplicate content op je webshop?

Wat is duplicate content? Duplicate content is de benaming voor content die in dezelfde, of soortgelijke, vorm op meerdere URL's bestaat. In de meeste gevallen gebeurt dit zonder opzet, echter komt het voor dat men dezelfde content op verschillende domeinen plaatst met als doel om de zoekresultaten te manipuleren. Omdat dit voor een slechte gebruikerservaring zorgt, proberen zoekmachines duplicate content zoveel mogelijk tegen te gaan. Een zoekmachine die sterk gelijkende pagina’s ziet zal bepalen welke van deze pagina’s de originele of juiste is. Dit doet het bijvoorbeeld door te kijken naar de hoeveelheid links die naar iedere pagina leiden. Op basis hiervan zal de zoekmachine er voor kiezen om een pagina wel hoog te ranken, en de andere niet. Desalniettemin wordt in veel gevallen niet duidelijk welke pagina gerankt moet worden, in zulke gevallen zullen alle pagina’s slechter scoren. Dit komt niet doordat Google penalties uitdeelt voor duplicate content, maar omdat de content als minder waardevol wordt gezien en de linkwaarde wordt verspreid.

Hoe ontstaat duplicate content?

Duplicate content kan op veel verschillende manieren ontstaan. In de meeste gevallen gebeurt dit zonder voorbedachte rade en komt het voort uit de techniek van de shop. Webmasters houden niet bij hoeveel URL’s er worden gecreëerd en geïndexeerd terwijl duplicate content al snel ontstaat. Naar schatting is hierdoor 25% van het internet duplicate content, in de meeste gevallen zijn dit de boosdoeners voor webwinkels:

HTTP en HTTPS URL’s

Het is tegenwoordig bijna standaard om je website via een beveiligde verbinding te presenteren. Heel ingewikkeld om je website hiernaar om te zetten is het ook niet, het meeste werk ligt tenslotte bij de hosting. Bovendien heeft het een positief effect op je organische resultaten. Echter wil het nog wel eens voorkomen dat een website vervolgens niet wordt geredirect naar de nieuwe versie. Hierdoor zijn de URL’s toegankelijk via zowel HTTP als de HTTPS, en laat je dus de volledige website tweemaal indexeren.

Aangeleverde content

Dit is een vorm van duplicate content die we in onze dagelijkse praktijk vaak tegenkomen. Webwinkels publiceren producten samen met de teksten die ze standaard vanuit de fabrikant aangeleverd krijgen. Veel concurrenten doen dit vervolgens ook, waardoor dezelfde tekst vaak terugkomt op pagina’s met betrekking tot dat bepaalde product. Google zal altijd proberen om gebruikers geen twee pagina’s aan te leveren met dezelfde content. Dus als een webwinkel en zijn concurrent dezelfde tekst gebruiken, dan zullen ze daardoor beide slechter scoren. De lachende derde is in dit geval de webwinkel die zijn eigen productteksten maakt, of de aangeleverde tekst herschrijft.

URL opbouw en parameters

Maar veruit de meest voorkomende reden dat duplicate content ontstaat is de de manier waarop URL's zijn opgebouwd, en met name de toevoeging van parameters daarin. Een gebruiksvriendelijke webwinkel maakt vaak gebruik van verschillende filters die het vinden van het juiste product vereenvoudigen voor de bezoeker. Ieder filter en iedere filter optie kan een parameter toevoegen aan de URL. Daarbij zijn ook combinaties van alle filters mogelijk, en vaak is de volgorde van het inzetten van een filter ook nog van belang. Dit alles is mogelijk op iedere categoriepagina van de webwinkel. In potentie heb je hier dus duizenden URL’s die qua content nauwelijk van elkaar verschillen. Daarnaast kunnen ook nog toevoegingen aan een URL ontstaan doordat iedere sessie zijn eigen ID krijgt, of doordat gebruik wordt gemaakt van paginering zonder dat de juiste tags (rel=”next” en rel=”prev”) zijn toegepast.

De oplossing voor duplicate content

Duplicate content kan dus op verschillende manieren ontstaan. Gelukkig is in de meeste gevallen ook een passende manier te bedenken hoe we kunnen aangeven welke URL de originele content bevat en dus in de zoekresultaten moet verschijnen.

301 Redirects

De meest voor de hand liggende oplossing voor het hebben van twee pagina’s met dezelfde content is een 301 “permanente” redirect. Deze zorgt ervoor dat alle bezoekers van een pagina direct worden doorgestuurd naar een andere pagina. Daarbij worden ook crawlers van zoekmachines doorgestuurd, en wordt alle linkwaarde die de pagina heeft opgebouwd doorgestuurd naar de andere pagina. Wanneer je simpelweg twee pagina’s met dezelfde content hebt, en je er maar een wilt houden, is dit de beste oplossing voor duplicate content. Het is echter wel belangrijk om dit voorzichtig toe te passen. Pagina’s met een 301 redirect zijn niet meer te bereiken, en dus onbruikbaar voor een bezoeker. Voor een webwinkel met filters zou dit dus geen geschikte oplossing zijn.

Rel=”canonical” tags

De rel=”canonical” tag is in het leven geroepen wegens duplicate content en is hierdoor in veel gevallen toepasbaar om duplicate content tegen te gaan. De tag bestaat uit een klein stukje code dat in de HTML wordt geplaatst. De canonical tag stuurt gebruikers en zoekmachines niet door naar een vervangende pagina, maar geeft een signaal aan zoekmachines dat de content op een pagina vergelijkbaar is met die op een andere pagina. De pagina met de canonical tag zal niet worden geïndexeerd, en linkwaardes zullen worden doorgestuurd. Het voordeel van een canonical tag is dat een pagina met een tag beschikbaar blijft voor gebruikers. Hierdoor kun je bijvoorbeeld vergelijkbare producten met grotendeels gelijke content behouden zonder dat duplicate content ontstaat in de ogen van zoekmachines.

Meta robots noindex tag

De noindex tag is, net als de canonical tag, een klein stukje HTML die op een pagina kan worden geplaatst en een signaal geeft aan zoekmachines. In dit geval wordt het signaal gegeven dat de pagina niet geïndexeerd dient te worden. Let wel op: een noindex tag betekent niet dat een pagina niet gecrawld wordt, hiervoor zou je de robots.txt moeten gebruiken. Door een pagina met duplicate content een noindex tag te geven kun je er eenvoudig voor zorgen dat content slechts één keer wordt geïndexeerd. De pagina blijft wel zichtbaar voor bezoekers, en bereikbaar voor zoekmachines en andere bots. Vaak gaat een index/noindex tag gepaard met een follow/nofollow tag, deze tag geeft aan of eventuele links op de pagina wel of niet gevolgd moeten worden. Zelfs al wordt gebruik gemaakt van een noindex tag raden we, in bijna alle gevallen, aan om wel een follow tag te gebruiken. Dit is beter voor het totale indexatieproces van de shop. Een nofollow tag kan het beste op individuele links binnen een pagina worden toegepast wanneer de betreffende bestemmingspagina geen linkwaarde mag ontvangen.

Paginering

Ten slotte een tag die vaak wordt vergeten: de paginering tags (rel=”next”, rel=”prev”). Door middel van deze tags kan worden aangegeven wanneer een pagina content heeft die in een logische volgorde thuis hoort, zoals een tweede pagina met producten. De paginering tag is ontwikkeld voor blogs en webwinkels omdat deze vaak tegen het probleem aanlopen dat een categoriepagina verschillende versies heeft wegens het hebben van meerdere pagina’s met producten of posts. Door het opnemen van paginering tags in de HTML geef je de volgorde van de pagina’s aan. Een zoekmachine die de tags leest zal begrijpen dat het hier gepagineerde content betreft, en zal alleen de eerste pagina indexeren. Wanneer je paginering tags gebruikt in combinatie met canonical tags, wordt aangeraden om de canonical tags zelfverwijzend te laten zijn in plaats van ze te leiden naar pagina 1.

Ieder geval is uniek

Hopelijk kun je door middel van deze tips duplicate content op je webwinkel tegengaan. Onthoud echter dat bijna ieder geval uniek is, en dat er vaak specifieke redenen zijn voor het ontstaan van duplicate content op jouw site of shop. Probeer altijd de kern van het probleem te vinden alvorens actie te ondernemen, zo weet je zeker dat je aanpassingen effect gaan hebben. Veel succes!
job-image
10 Manieren om je webshop sneller te maken
27 February 2020
Read More
job-image
50 conversie tips: verbeter je conversiepercentage
19 February 2020
Read More
job-image
Webwinkel Vakdagen 2020
23 January 2020
Read More

Newsletter

Questions? Reach out to us!

+31 85 2100 818 info@evoworks.nl