Duplicaat teksten zijn fout!

Maar is dat eigenlijk wel zo?

Google is inderdaad niet dol op dubbele teksten. Maar dat is op zich best logisch,
want welke tekst moet je dan kiezen om laten zien aan je bezoekers?

Dus wat doet Google?
Om te beginnen Google straft niet af.

Google handelt als volgt:

Als alle teksten op de website zijn gekopieerd.
Wat wil zeggen dat er geen tijd of inspanning is gestoken
in het maken van unieke waardevolle teksten.
Dan zal Google de pagina zo laag mogelijk beoordelen. Het maakt dan
niet uit of de pagina de bron van de teksten bekend heeft gemaakt.

Maar er zit wel verschil tussen duplicaat teksten en gekopieerde teksten.


Wat dan, zou je zeggen?
Het is toch hetzelfde?

Duplicaat content is geen penalty zegt Google.

Er zijn websites die zo vaak hetzelfde publiceren.
Denk aan vacature sites of vakantie sites.
Deze sites hebben regelmatig duplicaten op de site staan.


Maar gekopieerde teksten dan?

Dat is een heel ander verhaal.
Gekopieerde teksten kunnen opzettelijk veroorzaakt zijn. Er zijn mensen die graag hoger in
Google willen komen met manipulatie, door teksten te kopiëren.
Hierdoor ontstaat er een slechte gebruikerservaring. En een slechte
gebruikerservaring rankt niet. De gebruikerservaring zorgt er dus voor of de pagina
wel of niet rankt.

 Gekopieerde teksten kunnen zijn:

Teksten die volledige gekopieerd zijn op een ander domeinnaam.
Of teksten die enigszins aangepast zijn van het origineel maar wel erg dicht in de buurt komen.

Duplicaat

Plaats op je website unieke teksten. Heb je dezelfde teksten op eenzelfde domeinnaam,
dan zal Google je hiervoor NIET afstraffen. Natuurlijk is het niet de bedoeling dat je
over de hele website dezelfde tekst hebt staan.
Dat zou dan weer bij de uitzonderingen horen. Je website wordt dan wel gestraft.


Wat maken duplicaat teksten eigenlijk uit?

Voor zoekmachines kan het 3 problemen opleveren:

  1. Een zoekmachine weet niet welke versie moet worden geïndexeerd.
  2. Een zoekmachine weet niet of pagina’s aan elkaar gekoppeld zijn of dat deze gescheiden zijn.
  3. Een zoekmachine weet niet welke versie er als eerste gerankt moet worden in de zoekresultaten (SERPS).

Voor website-eigenaren is het belangrijk om te weten dat Google de beste zoekervaring
wil bieden aan haar bezoekers. Een reden waarom Google nooit of
zeer zelden dubbele content wil laten zien.

Maar staat er wel dubbele content op een site.
Dan wordt Google gedwongen om te kiezen welke versie het beste resultaat zal opleveren,
of welke versie de beste gebruikerservaring voor haar bezoekers zal bieden. Het gevolg is dat het duplicaat
tekst minder snel rankt.
 

Hoe ontstaan duplicaat teksten?

Het overgrote deel van de website-eigenaren hebben niet de intentie om
duplicaat teksten te maken.

Maar ze zijn er toch.

Laten we een kijken naar de meest gangbare manier waardoor duplicaat teksten ontstaan.

URL
URL-parameters, kunnen leiden tot duplicaat teksten.

Dit hoeft niet alleen door de parameters zelf te komen,
het kan ook door de URL zelf komen.

Een voorbeeld:

  • www.voorbeeld.nl/hoi-voorbeeld?test=hoi
    is een duplicaat van;
    www.voorbeeld.nl/hoi-voorbeeld
  • www.voorbeeld.nl/hoi-voorbeeld?test=hoi&hallo=3
    is een duplicaat van;
    www.voorbeeld.nl/hoi-voorbeeld?test=3&test=hoi

HTTP vs. HTTPS of WWW vs.
Geen-WWW pagina’s

Als de site afzonderlijke versies heeft op ‘www.site.nl en ‘site.nl
(met en zonder het voorvoegsel “www”)
en dezelfde inhoud heeft op beide pagina’s, heb je een duplicaat versies gemaakt.

Hetzelfde geldt voor sites die zowel http: // als https: // gebruiken.
Als beide versies van de pagina zichtbaar zijn voor Google.
Dan heb je een duplicaat aangemaakt.

Een website heeft niet alleen artikelen en blogs op de site staan.
Er kan bijvoorbeeld ook productinformatie op de site staan.
Scrapers die de blogteksten op eigen site opnieuw publiceren, zijn duplicaat teksten.

Scrapen is ongestructureerde data omzetten gestructureerde data.
Daarna kan de data geanalyseerd en opgeslagen worden in databases of spreadsheets.

Ook voor e-commercesites is dit zo. Veel websites verkopen dezelfde producten.
Als er op e-commercesites dezelfde teksten staan, dan zijn dit duplicaten.

Hoe kun je duplicaat
teksten oplossen

Je kunt bijvoorbeeld een 301- redirect gebruiken als er iets aan de structuur van je website is veranderd.
Hiermee kun je Googlebots en spiders omleiden naar de juiste website.

Gebruik één type link.

Een voorbeeld:

http://www.voorbeeld.nl/pagina/
http://www.voorbeeld.nl/pagina
http://www.voorbeeld.nl/pagina/index.html

Duplicaat URL

Voorkeur domein in
Google Search Console

Laat Google weten welk domein je wilt gebruiken.
Is dit www of http://. Gebruik je beide domeinen dat zijn het duplicaat teksten.
Je hebt dan immers twee websites.

Voorbeeld:

http://www.voorbeeld.nl
http://voorbeeld.nl

In het Google Search Console heb je de mogelijkheid om je voorkeur van domainnaam op te geven.

Daarnaast het je in de searchconsole van Google de mogelijkheid om de crawlsnelheid aan te passen.
Doe hier wel voorzichtig mee. Blokkeer de crawlertoegang tot dubbele inhoud van de website niet.
Als Google een pagina niet kan crawlen en niet kunnen zien of er
duplicaat teksten zijn, worden de pagina’s ‘anders’ behandeld dan unieke pagina’s.

Beter is om de pagina te markeren als duplicaat met de HTML code rel=”canonical”.
Dit is een parameter waarmee je laat zien waar de oorspronkelijk tekst staat.

Het rel=’canonical’ parameter is een HTML code en staat altijd bovenaan in de head.

Het ziet er zo uit:

<head>
…[hier kan andere HTML code staan]…
<link href=”URL VAN OORSPRONKELIJKE SITE” rel=”canonical” />
…[andere HTML tekst in de HEAD]… </head>

Het rel = canonical parameter wordt toegevoegd aan de HTML-kop
van elke dubbele versie van een pagina, waarbij het gedeelte
“URL VAN ORIGINELE PAGINA” hierboven wordt vervangen door een link naar de originele
(canonieke) pagina (de aanhalingstekens zijn deel van de formule).

Conclusie

Dubbele inhoud op de tekst is niet erg, het is geen reden tot paniek.
Paniek is alleen nodig als je bewust de beslissing hebt genomen op de tekst te kopiëren, om te misleiden.
Je website zal dan uit de zoekresultaten van Google verwijderd worden.

Als je duplicaat content op je website hebt en je geeft niet aan waar
het oorspronkelijke artikel vandaan komt, zal Google kiezen welke site ze laten zien.
De andere site wordt beoordeeld als een site met een slechte gebruikerservaring.

Ik hoop dat het je met deze uitleg duidelijk is geworden wat duplicaatteksten
doen met je website en hoe je moet handelen als je deze op je website hebt staan.