Duplicate content


Zoekmachines beschikken over een beperkte capaciteit om elke mogelijke pagina op het internet te indexeren. Daarom wordt niet standaard elke pagina opgenomen in de index. Een standaard webshop kan al snel bestaan uit duizenden pagina’s. Wanneer een pagina weinig onderscheidend is van een andere pagina heeft dit weinig meerwaarde en zal een zoekmachine er voor kunnen kiezen om deze niet op te nemen in de index. Duplicate content kan optreden wanneer dezelfde pagina te benaderen is via verschillende URL’s, pagina’s inhoudelijk onderling te veel op elkaar lijken of wanneer content rechtstreeks wordt overgenomen van andere websites of webshops.

Indicatie van duplicate content

Pagina te benaderen via verschillende URL’s


Om het probleem dat een pagina te benaderen is via verschillende URL’s op te lossen kan een ”canonical tag” gebruikt worden. Dit probleem treedt al snel op zoals te zien in het volgende voorbeeld.
Voorbeeld:
http://www.voorbeeld.nl/product1
http://www.voorbeeld.nl/product1/
https://www.voorbeeld.nl/product1
https://www.voorbeeld.nl/product1/
http://voorbeeld.nl/product1
http://voorbeeld.nl/product1/
https://voorbeeld.nl/product1
https://voorbeeld.nl/product1/

Bovenstaande pagina’s zijn inhoudelijk exact gelijk aan elkaar maar beschikken allemaal over een andere URL. Dit kan echter nog verder gaan.

Voorbeeld:
http://www.voorbeeld.nl/product1/
http://www.voorbeeld.nl/product1/?SID=48274ffds8f4
http://www.voorbeeld.nl/product1/?utm_source=google&utm_medium=cpc
http://www.voorbeeld.nl/product1/?affiliate_id=10
http://www.voorbeeld.nl/product1/?affiliate_id=11
http://www.voorbeeld.nl/product1/?tracker=456

Wanneer een URL over parameters beschikt geldt dit ook als weer unieke pagina. Op deze manier kan één pagina benaderd worden via een groot aantal unieke URL’s. Deze pagina’s zijn duplicate. Een ander probleem dat optreedt, is dat de linkwaarde van het domein uitgesplitst wordt over verschillende URL’s. Eigenlijk wil je alle binnenkomende linkwaarde voor een URL samenvoegen.

De oplossing voor dit probleem is het toevoegen van een ”canonical tag” op elke pagina versie, waarmee de voorkeurspagina kan worden aangegeven. Dit is een stuk code dat aan de bron van de pagina wordt toegevoegd. Deze pagina zal worden geïndexeerd door de zoekmachine’s en zichtbaar zijn in de zoekresultaten.

<link rel="canonical" href="http://www.voorbeeld.nl/product1/" />

Het effect van een canonical tag de oplossing van duplicate content