9 Manieren om duplicate content te ontdekken

[fullwidth background_color="" background_image="" background_parallax="none" enable_mobile="no" parallax_speed="0.3" background_repeat="no-repeat" background_position="left top" video_url="" video_aspect_ratio="16:9" video_webm="" video_mp4="" video_ogv="" video_preview_image="" overlay_color="" overlay_opacity="0.5" video_mute="yes" video_loop="yes" fade="no" border_size="0px" border_color="" border_style="" padding_top="20" padding_bottom="20" padding_left="0" padding_right="0" hundred_percent="no" equal_height_columns="no" hide_on_mobile="no" menu_anchor="" class="" id=""][fusion_text]Duplicate content is identieke content die op meer dan één plek (URL) op het internet te vinden is. Wanneer er identieke content op verschillende plekken op het internet te vinden is, kan dit op verschillende manieren vervelend zijn:
  • Zoekmachines weten niet welke van deze pagina’s geïndexeerd moeten worden.
  • Zoekmachines weten niet welke van deze pagina’s moeten ranken in de zoekresultaten.
  • Zoekmachines weten niet of de gegevens van de verschillende pagina’s met identieke content (autoriteit, anchor teksten, etc.) geredirect moeten worden naar één pagina, of dat dit gescheiden moet blijven.
Duplicate content moet je dus zoveel mogelijk uit de weg gaan, maar hoe kom je erachter of jouw website of webshop duplicate content bevat? Lees snel verder, dan geef ik je 9 manieren om duplicate content te ontdekken!
  1. Http vs. https URL’s
Http en https URL’s worden gezien als twee verschillende sites. Wanneer je voor dezelfde content een http én https URL hebt, zien zoekmachines dit als duplicate content. Wanneer één en dezelfde content getoond wordt op http://www.voorbeeld.nl/ en https://www.voorbeeld.nl/, wordt dit dus gezien als duplicate content. Wanneer jouw website is overgegaan op https, is het dus aan te raden om te controleren of je URL’s niet ook nog via http te bereiken zijn. Is dit het geval? Zorg er dan voor dat deze URL’s geredirect worden naar https.
  1. WWW vs. Non-WWW
Het komt regelmatig voor dat één en dezelfde content pagina getoond wordt voor https://www.voorbeeld.nl en https://voorbeeld.nl. Ook WWW en non-WWW URL’s worden gezien als twee verschillende sites en dus als duplicate content. Hiervoor geldt hetzelfde als hierboven. Kies met je hele webshop voor WWW of non-WWW URL’s en redirect alle overige URL’s.
  1. Scraper sites
De meeste duplicate content wordt veroorzaakt door eigen toedoen, of door de website zelf. Toch kan het zo zijn dat andere websites, met of zonder toestemming, jouw content gebruiken. Wanneer ze deze content één op één overnemen en publiceren, ontstaat er ook duplicate content. Neem als voorbeeld een blog die je hebt geschreven. Een website kopieert de inhoud van deze blog en publiceert deze zelf. Wanneer er vervolgens in dit identieke stuk content geen link geplakt wordt naar de originele bron (jouw blog), ziet Google dit als een op zichzelf staande pagina. Hierdoor krijg je duplicate content die veroorzaakt wordt door een ander. Om het scraper sites lastig te maken je content te kopiëren, is het belangrijk dat je gebruik maakt van absolute URL’s en géén relatieve URL’s. Absolute URL: https://www.voorbeeld.nl/cadeaus/kerstcadeau-tips Relatieve URL: /cadeaus/kerstcadeau-tips Een relatieve URL bevat enkel het pad en de bestandsnaam en hierdoor neemt een zoekmachine aan dat er verwezen wordt naar een bestand op het domein waarop je je op dat moment bevindt. Een absolute URL geeft aan waar het bestand zich moet bevinden, namelijk op het domein dat voor het pad staat.
  1. ‘Vergeten’ subdomeinen
Een subdomein maakt deel uit van een groter domein en is het gedeelte van het adres dat voor (of na) de domeinnaam staat. Zo is www.en.voorbeeld.nl het subdomein van www.voorbeeld.nl. Deze subdomeinen wordt gezien als losstaande sites en dus als duplicate content. Maak je gebruik van subdomeinen en heb je hierdoor duplicate content? Zet dan een canonical URL op de URL’s van het root domein, om te laten zien wat de oorspronkelijke pagina is. Zet vervolgens de subdomein pagina’s op no-index, zodat enkel de oorspronkelijke pagina door de zoekmachines wordt meegenomen bij de indexering.
  1. De ‘geheime’ staging site
Een staging site is een platform waar je je website kunt bouwen en wijzigen, zonder dat je wijzigingen direct te zien zijn voor de bezoekers. Het is dus een apart ontwikkelplatform op je website (vaak een subdomein) met beperkte toegang. Een voorbeeld van een URL voor een staging site is: https://www.staging.voorbeeld.nl. Wanneer je het staging platform niet hebt geblokkeerd voor crawlers van de zoekmachine, kan deze staging site in de zoekresultaten terechtkomen. Wil je dit voorkomen? Zet deze staging omgeving dan op no-index en blokkeer hem in je robots.txt.
  1. Dynamisch gegenereerde parameters in de URL’s
Parameters zijn variabelen die aan een URL worden toegevoegd en bestaan uit een naam en een waarde. Deze naam en waarde geven informatie over de desbetreffende pagina. Dynamisch gegenereerde parameters zijn parameters waarvan de waardes veranderlijk zijn. Een dynamische parameter wordt bijvoorbeeld aan een URL toegevoegd wanneer je een zoekopdracht uitvoert op een website of de sorteringsoptie van producten aanpast op prijs. Een voorbeeld van een dynamisch gegenereerde URL kan zijn: https://www.voorbeeld.nl?sorteer=laagste-prijs In bovenstaande URL is er een dynamische parameter toegevoegd voor de sorteringsoptie. Wanneer er nog een sorteringsoptie wordt aangevinkt voor bijv. kleur kan er een volgende URL ontstaan: https://www.voorbeeld.nl?sorteer=laagste-prijs&kleur=groen Op deze manier kunnen er heel veel verschillende URL’s worden gegenereerd middels dynamisch gegenereerde parameters. Echter, de content die op deze verschillende pagina’s staat, is vaak (grotendeels) gelijk. Hierdoor ontstaat er duplicate content. Dit kun je voorkomen door een canonical tag in te stellen voor de oorspronkelijke URL of door deze parameters in je robots.txt te blokkeren met een asterix(*). Lees hier meer over hoe je robots.txt instelt.
  1. Gespiegelde subdomeinen
Wanneer je website gericht is op verschillende landen, wordt er regelmatig gekozen voor een landingspagina waarop bezoekers hun locatie / taal kunnen kiezen. Dit leidt de bezoekers vervolgens naar een ‘gespiegeld subdomein’, zoals bijvoorbeeld https://www.voorbeeld.com/de en https://www.voorbeeld.com/nl. Qua inrichting (content, invulling, producten, etc.) lijken deze subdomeinen bijna exact op die van het hoofddomein. Dit geeft een issue als het gaat om duplicate content. Kijk dus of jouw domein een gespiegeld subdomein heeft. Is dit het geval? Zorg er dan voor dat je in Google Search Console het juiste land hebt ingesteld bij ‘internationale targeting’.
  1. Sterk gelijkende content
Heb je op verschillende plekken van je website content staan die erg op elkaar lijkt? Ook dit kan worden beschouwd als duplicate content. Stel jezelf de volgende vraag: ‘Kan een bezoeker op deze twee verschillende pagina’s dezelfde informatie verzamelen?’. Is het antwoord ‘ja’, dan zal een zoekmachine deze twee verschillende pagina’s zien als duplicate content. Je kunt dit probleem op een aantal manieren oplossen: pas de informatie op één van de pagina’s aan, verwijder één van de pagina’s wanneer deze geen unieke bijdrage levert, of plaats een canonical tag op de oorspronkelijke pagina.
  1. Herposten op nieuwe platfora
Een herpost is wanneer je nieuwe platfora toestemming geeft om jouw content te plaatsen op hun platfora. Dit kan een één op één of gedeeltelijke kopie zijn van de content op je eigen website. Hiermee kun je duplicate content veroorzaken. Gelukkig kan dit eenvoudig voorkomen worden door een canonical tag in te laten stellen op de pagina van de herpost naar oorspronkelijke pagina. Een andere optie is de pagina van de herpost op no-index te laten zetten. Wil je achterhalen of jouw website duplicate content bevat? De bovenstaande manieren zullen je genoeg handvatten geven om hiermee aan de slag te gaan en jouw website ‘duplicate content proof’ te maken. Toch liever je duplicate content issues en SEO werkzaamheden uitbesteden? Ga dan voor de professionele aanpak door contact met ons op te nemen.[/fusion_text][/fullwidth]
job-image
10 Manieren om je webshop sneller te maken
27 February 2020
Read More
job-image
50 conversie tips: verbeter je conversiepercentage
19 February 2020
Read More
job-image
Webwinkel Vakdagen 2020
23 January 2020
Read More

Newsletter

Questions? Reach out to us!

+31 85 2100 818 info@evoworks.nl