INTERNET WORLD Business Logo Abo
Vervielfältigte Texte

Ranking-Faktoren

Duplicate Content erkennen und vermeiden

shutterstock.com/blan-k
shutterstock.com/blan-k

Inhalt, der an verschiedenen Stellen auftaucht, wird von Google nicht gern gesehen - einige Tipps wie sich Duplicate Content erkennen und vermeiden lässt.

von Stephan Sigloch

Unter vielen SEO-Experten gilt Duplicate Content als Schreckgespenst, denn Google straft aufgeblähte oder ­kopierte Inhalte im Ranking ab. Von ­Duplicate Content (= doppelter Inhalt), Near Duplicate Content oder abgekürzt "DC" wird gesprochen, wenn verschie­dene Seiten einer Website oder eines Shops gleiche oder sehr ähnliche Texte und Elemente enthalten.

Wie stark Duplicate Content tatsächlich das SEO-Ranking ­beeinträchtigt, ist umstritten. Klar ist jedoch: DC kann dem Google-Crawler das rich­tige Indexieren der eigenen Seite erschweren - und das gilt es zu vermeiden.

Doppelte Inhalte können auch bei normalen Corporate Websites auftreten, stellen jedoch bei Online-Shops in höherem Maße ein Problem dar. Folgende Unterscheidungen werden vorgenommen:

- Interner Duplicate Content - identische oder ähnliche Inhalt können innerhalb einer einzelnen Domain aufgerufen werden.
- Externer Duplicate Content - identische oder ähnliche Inhalte sind auf verschiedenen Domains zu finden.

Meist wird dieses Thema im Rahmen von Suchmaschinenoptimierung (SEO) betrachtet, da Duplicate Content häufig eine direkte (negative) Auswirkung auf das Ranking der Seite hat.

Weshalb kann Duplicate Content schädlich sein?

Suchmaschinen - allen voran Google - bevorzugen einzigartigen und qualitativ hochwertigen Content. An erster Stelle steht hier der User mit seiner Erwartung, die bestmöglichen, passenden Suchergebnisse zu seiner Anfrage zu erhalten. Um diesem Anspruch gerecht zu werden, analysiert, bewertet und indexiert Google tagtäglich Millionen von Webseiten.

Wenn es nun mehrere Seiten mit demselben oder einem beinahe identischen Inhalt gibt, dann kann nicht mehr ermittelt werden, welche dieser Seiten die höchste Relevanz besitzt - die Seiten müssen sich somit die Relevanz teilen und verlieren im Ranking der Suchtreffer an Bedeutung. Je mehr Seiten von Duplicate Content betroffen sind, desto schlechter wird meist das Ranking. Duplizierungen, die notwendig sind (etwa sich wiederholende rechtliche Angaben), wirken sich jedoch nicht negativ aus.

Man sollte im Idealfall der Erste sein, der Content publiziert, denn der Veröffentlichungshistorie kommt ein wichtiger Stellenwert zu: Suchmaschinen analysieren, wer als Erster einen Content publiziert hat oder eben, wo er auf der eigenen Plattform publiziert wurde.

Für jede Webseite ist festgelegt, wie viel Zeit die Suchmaschine dort verbringen wird, um einzelne Unterseiten in den ­Index aufzunehmen. Dies ist das sogenannte Crawl Budget. Ist nun aber auf ­bestimmten Unterseiten eines Webauftritts häufig Duplicate Content zu finden, kann es passieren, dass Google einen ­großen Teil der anberaumten Zeit damit verbringt, diese doppelten Seiten zu überprüfen.

Das Crawl Budget kann also aufgebraucht sein, obwohl die Suchmaschine einige wichtige Seiten noch gar nicht ­besucht hat. So kann es passieren, dass einzelne Seiten nicht mit in den Index aufgenommen werden. Durch Duplicate Content werden also möglicherweise wichtige Ranking-Potenziale verschenkt, da die Seiten in Konkurrenz zueinander stehen und sich somit gegenseitig schwächen.

Häufige Ursachen für internen Duplicate Content

Neben technischen Ursachen können auch inhaltliche Aspekte der Grund für eine Bewertung als Duplicate Content sein. Im Folgenden werden die Fälle vorgestellt, bei denen es zu Duplicate Content kommen kann. Das beste Gegenmittel folgt unittelbar im Anschluss

Probleme beim Aufruf der Seite

- Eine Website ist mit und ohne "www" ­erreichbar, Beispiel: http://www.ihredomain.de und http://ihredomain.de

- Eine Website ist per http und https ­erreichbar, Beispiel: http://www.ihredomain.de und https://www.ihredomain.de

Diese Probleme lassen sich durch eine 301-Weiterleitung vermeiden. Das bedeutet: Eine URL-Variante ruft keine Website auf, sondern wird weitergeleitet auf die ­andere URL-Variante, die dann die Web­site aufruft.

- Die Website ist mit und ohne Slash "/" am Ende der URL aufrufbar.
- Die Website ist mit und ohne ".html" oder anderes Dateiformat am Ende der URL aufrufbar.
- Groß- und Kleinschreibung in URLs. Beispiel: /produktkategorie und /Produkt­kategorie

Hier ist ebenfalls eine 301-Weiterleitung sinnvoll. Außerdem kann durch den Einsatz eines Canonical Tag eine Beziehung zwischen verschiedenen Seiten hergestellt werden.

- Print-Versionen einzelner Seiten
- Filter- und Sortierfunktionen eines ­Online-Shops
- Mehrfachzuordnung: Bestimmte Seiten sind bewusst in mehrere Kategorien der Website eingebunden (zum Beispiel ein Produkt unter der jeweiligen Produkt­kategorie sowie unter "Sale" oder "Neuheiten")

Dies lässt sich durch den Einsatz von ­Canonical Tags vermeiden.

- Relaunch: Die alte Website ist noch im Index von Google und hat eventuell ein gutes Ranking aufgebaut, die neue Seite bietet nun jedoch denselben Inhalt unter einer neuen URL an (gleiche Domain, jedoch neue URL-Struktur)

Dies lässt sich durch eine 301-Weiter­leitung von der alten zur neuen URL vermeiden.

Beide Methoden, also die 301-Weiterleitung und das Canonical Tag, haben Vor- und Nachteile. Bei einer 301-Weiterleitung wird immer dieselbe URL aufgerufen, wohingegen bei einem Canonical Tag beide URLs von Nutzern aufgerufen werden können. Das hat den Nachteil, dass unterschiedliche URL-­Aufrufe in Webanalyse-Tools wie etwa Google Analytics einfließen, was eine ­exakte Auswertung erschwert.

Mobile Version einer Website

Seit dem Google-Algorithmus-Update Ende April dieses Jahres ist die Relevanz einer für Mobile optimierten Website ­eigentlich jedem Webmaster bekannt. Websites können auf drei unterschied­liche Arten für Mobilgeräte optimiert werden:

- Als Responsive Website
- Per dynamischer Bereitstellung
- Mit unterschiedlichen URLs

Bei der dritten Variante mit den unterschiedlichen URLs (z. B. m.ihredomain.de als mobile Version und www.ihredomain.de als Desktop-Version) kann ebenfalls ­Duplicate Content entstehen. Hier sollte eine Beziehung zwischen diesen zwei Versionen per Canonical Tag und Alternate Tag hergestellt werden.

Duplicate Content in Texten

- Sehr ähnliche oder identische Produkt-Beschreibungen
Abhilfe: Für Top-Produkte einzigartige Beschreibungen verfassen

- Paginierung - sich wiederholende Texte bei Seitennummerierungen, z. B. bei News-Archiven
Abhilfe: Per "prev/next"-Auszeichnung eine Beziehung schaffen

- Interne Suchergebnisseiten
Abhilfe: Tag "noindex" verwenden

- Unterschiedliche Sprachversionen einer Website: Viele Corporate Websites oder Online-Shops sind in unterschiedlichen Sprachen verfügbar, wobei sich die ­Inhalte teilweise nur minimal unterscheiden. Die geografische Ausrichtung der Seite sollte Google mitgeteilt werden, damit nicht mehrere Sprachversionen in der Suche erscheinen und sich gegenseitig schwächen.
Abhilfe: Einbindung des Alternate Href­lang Tag.

Im zweiten Teil der Serie informieren wir darüber, wie es zu externem Duplicate Content kommen kann und mit welchen Tools doppelte ­Inhalte erkannt werden können. Zudem stellen wir am Beispiel von Produktbeschreibungen und Pressemitteilungen das Problem von externem Duplicate Content konkret vor.

Das könnte Sie auch interessieren