Blog

Duplicate Content finden und vermeiden

Sorgen Sie für individuelle Inhalte

Wege zur Ermittlung, Bewertung und Bearbeitung für Unternehmen, die ihre Suchmaschinen-Optimierung verbessern wollen. In diesem Artikel erklären wir die Risiken, die Duplicate Content mit sich bringt.

Werden im Web unter verschiedenen URLs identische Inhalte gefunden, so handelt es sich um Duplicate Content. Das mag nicht nur für User verwirrend sein, sondern „stört“ in erster Linie die Suchmaschine. Bei der Berücksichtigung des Google Rankings können diese kopierten Inhalte negativ auf die Positionierung wirken. Dennoch gibt es im Web noch eine Vielzahl von Websites, die Duplicate Content beinhalten. 

Was ist Duplicate Content?

Duplicate Content bezeichnet doppelte Inhalte, die im Web zu finden sind. Befinden sich auf zwei unterschiedlichen URLs also identische Textabschnitte, so handelt es sich um Duplicate Content. Dabei müssen nicht die gesamten Texte 1:1 übernommen werden – auch einzelne Passagen reichen für diese Definition vollkommen aus.

Zu unterscheiden ist, ob die identischen Inhalte auf zwei unabhängigen Websites zu finden sind (externer Duplicate Content), oder innerhalb einer Domain (interner Duplicate Content). Interner Duplicate Content kann beispielsweise auftreten, wenn ein gleichbleibender Text in der Seitenleiste einer jeden URL erscheint. Ein Beispiel für externen Duplicate Content wäre das Abschreiben von einer anderen Website, wie beispielsweise Wikipedia. Haben Sie einen Artikel zum Thema „Kölner Dom“ geschrieben und dabei Inhalte von Wikipedia 1:1 kopiert, dann haben Sie auf Ihrer Website externen Duplicate Content geschaffen.

Externer Duplicate Content Wikipedia
Inhalte 1:1 übernehmen = Externer Duplicate Content / Bildquelle: https://de.wikipedia.org/wiki/K%C3%B6lner_Dom

Der Grund, weshalb Kopieren aus SEO-Sicht (abseits von rechtlichen Gründen) nicht empfohlen wird: Suchmaschinen legen großen Wert auf Einzigartigkeit (Uniqueness) und eine positive Nutzererfahrung. Hierzu gehören, neben vielen weiteren Faktoren, auch einmalige Inhalte mit Mehrwert. Das Ergebnis: Die Kopie wird nicht angezeigt, denn Google möchte seine Nutzer nicht mit doppelten Inhalt langweilen. 

Ab wann handelt es sich um Duplicate Content?

Zunächst ist zu unterscheiden, ab wann Google von Duplicate Content ausgeht. Haben Sie eine Website in verschiedenen Sprachversionen, so handelt es sich nicht um Duplicate Content. Auch Zitate oder zitierte Textpassagen, die Sie 1:1 übernehmen, werden nicht als doppelter Inhalt gewertet – vorausgesetzt, Sie haben diese im Quellcode semantisch entsprechend ausgezeichnet. 

Kein Duplicate Content: Semantische Auszeichnung Zitat

Sind Metadaten identisch, werden bereits diese in Googles Search Console als doppelt angemahnt. Dies ist auch sinnig – unterschiedliche Inhalte sollten auch unterschiedliche Zusammenfassungen in Form des Titles und der Description erhalten.

Ähnlich sieht es bei gleichen Inhalten auf mehreren URLs einer Domain aus. Hier reichen auch schon größere Teile gleichen Inhalts aus, ohne komplett identisch zu sein, um als Duplikate zu gelten. Dasselbe gilt selbstverständlich auch für den Content auf Subdomains oder URIs.

Was tun bei Content-Klau von meiner Website?

Was aber nun, wenn nicht Sie auf Ihrer Website kopierte Inhalte von anderen Urhebern publizieren, sondern von Ihnen kopiert wurde? Auch wenn Content-Klau nur in den wenigsten Fällen zu Abstrafungen der Urheber-URL führt, ist diese Tatsache durchaus ärgerlich für den Texter, da sich hier eine andere Person unerlaubterweise mit fremden Federn schmückt. Hier haben Sie drei Möglichkeiten:

  1. Nichts tun. Das ist allerdings nur empfehlenswert, wenn die andere Seite Ihrer Seite um ein Vielfaches unterlegen ist und zudem von Google bereits als Duplikat entlarvt wurde. Dies ist bei Spam-Projekten teilweise sinnvoll, da bei solchen häufig kein Besitzer ausfindig zu machen ist. Dennoch können Sie eine Meldung an Google unter www.google.com/webmasters/tools/spamreport machen, um ein Ranken der Spam-Seite zu verhindern.
Meldung von Duplicate Content an Google
Meldung an Google: So können Sie Duplicate Content melden
  1. E-Mail an Website-Besitzer. Handelt es sich um keine Spam-Seite und der Besitzer hat Kontaktdaten hinterlegt, so sollten Sie eine Mail schreiben. In der Mail können Sie den Betreiber der Website auf die begangene Urheberrechtsverletzung hinweisen. Nennen Sie hierzu das konkrete Beispiel und bitten um die Entfernung der entsprechenden Passage – bestenfalls innerhalb einer bestimmten Frist. Die meisten Website-Besitzer kommen diesem Hinweis nach, insofern Sie ihn freundlich formulieren, da häufig gar keine böse Intention vorhanden ist. Dadurch sparen Sie den Gang zum Anwalt.

  2. Rechtsanwalt einschalten. Haben Sie bereits eine E-Mail an den Website-Betreiber geschickt, aber nichts ist passiert und die gesetzte Frist ist verstrichen? Da Sie der Urheber Ihrer Inhalte sind, ist ungefragtes Duplizieren in der Regel rechtswidrig. Hier kann Sie ein Anwalt über Ihre Möglichkeiten aufklären und gemeinsam mit Ihnen gegen den Textdieb vorgehen.

Schutz vor Content-Klau

Kopierschutz einrichten

Möchten Sie Ihre eigenen Inhalte schützen, können Sie bestimmte Vorkehrungen treffen. Selbstverständlich sind Sie nie komplett vor Content-Diebstahl geschützt – Sie können es den Dieben jedoch schwerer machen.

Kennen Sie sich selbst gut in der Programmierung aus oder haben einen Programmierer im Bekanntenkreis, dann können Sie Ihren Content mit einem Kopierschutz ausstatten. Mithilfe von CSS und Javascript können Sie die Inhalte Ihrer Website „unkopierbar“ machen. Nutzer können dann den Text entweder gar nicht erst markieren, beim Rechtsklick auf die Maus erscheint kein Fenster oder beim Kopierversuch ploppt ein Pop-Up mit einem Hinweis auf das unerlaubte Kopieren auf. Nutzen Sie WordPress, so können Sie zum Kopierschutz auch ein Plugin nutzen, welches Sie nur installieren und aktivieren müssen.

Jedoch besteht in einem Kopierschutz auch immer ein großer Nachteil, denn: Die Nutzererfahrung wird leiden. User die sich für den privaten Gebrauch, wie Schule, Uni oder Arbeit, Inhalte zusammentragen wollen, werden Ihre Website schnell wieder verlassen. Womöglich werden diese User beim nächsten Mal gar nicht erst Ihre Website besuchen – auch wenn die Inhalte noch so ansprechend und informativ sind. User, die sich ein wenig besser auskennen, können den Schutz zudem einfach umgehen, indem Sie den Text direkt aus dem Quellcode kopieren. Gleiches gilt für maschinelles Kopieren, wie es bei Spam-Projekten der Fall ist – hier wird diese Methode nicht helfen.

Hinweis auf Urheberrecht/Copyright auf der Website

Neben der weniger eleganten Lösung des Kopierschutzes gibt es noch eine andere Möglichkeit, der Entstehung von Duplicate Content durch Textklau vorzubeugen. Hierzu platzieren Sie einen Hinweis auf das Copyright gut sichtbar auf Ihrer Website, beispielsweise im Footer oder der Sidebar. Im Copyright deklarieren Sie genau, was im Zusammenhang mit Ihren Inhalten erlaubt ist und was nicht. Auch weisen Sie hier auf die rechtlichen Konsequenzen hin. Meist stehen auf einer Website auch bereits im Disclaimer Informationen zum Urheberrecht, dennoch ist der kurze Hinweis zum Copyright auf jeder URL (Achtung: Canonical-Tag nutzen! – Erklärung weiter unten) präsenter. Das deutsche Urheberrecht und das US-amerikanische Copyright weisen zwar Ähnlichkeiten auf, unterscheiden sich jedoch in ihrem Ansatz. Wo Urheberpersönlichkeitsrechte nicht übertragbar sind, können lediglich Nutzungsrechte eingeräumt werden (meist durch Verkauf). Das Copyright hingegen kann als Ganzes verkauft werden.

Zwar ist ein Hinweis auf Copyright oder Urheberrecht kein Schutz, dennoch bleibt die Hoffnung, dass mögliche Textdiebe abgeschreckt werden – allerdings kann auch dieser Hinweis einen negativen Beigeschmack für die Besucher Ihrer Webseite erzeugen.

Halten Sie diese Info zudem recht kurz – denn hierbei handelt es sich um internen Duplicate Content. Längere Erklärungen lagern Sie einfach, falls notwendig, auf eine eigene Seite aus, die Sie entsprechend verlinken.

So erkennen Maschinen Duplicate Content

Suchmaschinen, wie Google, setzen zur Erkennung von doppelten Inhalten einen speziellen Algorithmus ein. Wie Google hier genau vorgeht, ist ein Betriebsgeheimnis. Möglich ist jedoch ein Vorgehen nach dem Shingle Algorithmus, der oft zur Identifizierung von Duplicate Content genutzt wird. Haben Sie einen kompletten Text vor sich, so wird dieser in einzelne Shingles (Schindeln) eingeteilt und verglichen. Der Algorithmus vergleicht also einzelne Wortpakete miteinander – in der Praxis bieten sich Level-3-Shingles an, die aus 3 Worten bestehen. Hier ein Beispiel:

„Sommerliche Boots für Damen in Gelb.“

  • „Sommerliche Boots für“
  • „Boots für Damen“
  • „für Damen in“
  • „Damen in Gelb“

„Schöne Boots für Damen in Grün.“

  • „Schöne Boots für“
  • „Boots für Damen“
  • „für Damen in“
  • „Damen in Grün“

Bei einem Vergleich beider Sätze wird deutlich, dass zwei der vier Shingles identisch sind (Schnittmenge). Die Vereinigungsmenge beträgt vier (Anzahl der Shingles, die entweder zu A oder B gehören).

Das bedeutet, der Satz gleicht sich zu 50,00 %. 

Duplicate Content: Formel zur Berechnung

Welche Gefahren stecken in Duplicate Content?

Ist Ihr Inhalt nicht der originale Inhalt, wird er in der Regel gar nicht erst Rankings erzielen. Insofern Ihr Text allerdings von Ihnen stammt, kann es – wenn auch unwahrscheinlich – passieren, dass nicht Ihre Website als Urheber und somit Originalquelle angesehen wird, sondern die Website mit den geklauten Inhalten. In diesem Fall rankt die fremde Website mit dem duplizierten Content höher und Ihre Site fällt deutlich ab, oder ist möglicherweise gar nicht mehr indexiert. Dies konnten wir in der Praxis vor allem bei solchen Domains feststellen, deren Historie SEO-Spamtechniken aufweist, oder die technisch mangelhaft und veraltet sind.

Zur Einstufung nutzt Google spezifische Signale für die Wertigkeit für User. Hierzu gehören beispielsweise das Alter der Inhalte, die Qualität des Contents (umfassender/qualitativ hochwertiger Text), die Relevanz des Inhaltes für die Suchphrase und noch viele weitere Faktoren. Haben nun zwei oder mehr Webseiten die gleichen Inhalte, dann orientieren sich die Suchmaschinen an genau diesen Signalen, um schließlich die beste und vertrauenswürdigste Quelle höher für ein Keyword ranken zu lassen.

Kopierte Inhalte zeigt Google erst auf Klick des Users. Wenn Sie nach Eingabe eines Suchbegriffs folgende Nachricht in der SERP angezeigt bekommen (siehe Abbildung 4), dann hat Google während des Suchvorgangs Duplicate Content identifiziert und herausgefiltert.

Google Screenshot: Duplicate Content
Google Screenshot: Weniger relevante Inhalte

Da ein hoher Prozentsatz der User über die organische Suche und somit über die Suchmaschine kommt, bedeutet dies oftmals einen großen Einbruch der Besuchszahlen und somit letzten Endes auch Einbußen in Sachen Umsatz.

Anders sieht es aus mit Internem Duplicate Content, hier unterscheiden sich die Folgen je nach dem Umfang der doppelten Inhalte. Bei nahezu identischen Inhalten auf mehreren Seiten können diese als Spam deklariert werden, oder sich gegenseitig im Ranking behindern. Dies ist insbesondere der Fall, wenn die Inhalte einzelne Begriffe austauschen, aber sonst identisch bleiben.

Wie lässt sich Duplicate Content vermeiden?

Wie sich externer Duplicate Content vermeiden lässt, ist schnell erklärt: Übernehmen Sie keine Inhalte von fremden Websites! Seien Sie kreativ und schreiben Ihre eigenen SEO-Inhalte.

Zudem sollten Sie Ihre Website regelmäßig auf externe doppelte Inhalte überprüfen. Weiter unten stellen wir Ihnen nützliche Tools vor, die Sie hierzu nutzen können.

Doch wie sieht es jetzt mit dem Internen Duplicate Content aus? Lässt sich dieser (teilweise) nicht vermeiden, dann können Sie sich folgende Methoden zu Hilfe nehmen:

Nutzen Sie das Canonical-Tag

Besonders Online Shops haben häufige Probleme mit Duplicate Content. Manche Artikel gleichen sich und daher werden Beschreibungen nicht groß abgeändert und ohne besondere Vorkehrungen unter mehreren URLs veröffentlicht – ein Fehler. Hier dient das Cononical-Tag als nützliche Hilfe. Das Tag dient dazu, Duplicate Content entsprechend auszuzeichnen – dabei kann dieses auf einer Domain oder domainübergreifend als Verweis agieren.

Möchten Sie Duplicate Content entsprechend mit dem Cononical-Tag auszeichnen, so fügen Sie dieses als Meta-Tag im Headerbereich des Quelltextes innerhalb eines Link-Elements ein. Nutzen Sie hierzu das Attribut rel=“canonical“. Das Tag verweist nun auf die Originalquelle des Contents, die als „kanonische“ Seite bezeichnet wird.

Crawler der Suchmaschinen erkennen dieses Tag und stufen den entsprechenden Inhalt nicht als Duplicate Content ein. Zudem rankt die Originalquelle in der SERP – es entsteht keine Ranking-Konkurrenz untereinander.

Unique Content bevorzugen

Das Canonical-Tag ist zwar ein guter Kompromiss für doppelte Inhalte, jedoch gehört in erster Linie das Erstellen von hochwertigem Unique Content zu den wichtigen OnPage-Arbeiten der Suchmaschinenoptimierung (SEO). Im besten Fall publizieren Sie erst gar keine doppelten Inhalte. Bei einem Online Shop ist es natürlich unrealistisch, für jedes Produkt einen eigenen Inhalt auf hohem Niveau zu erstellen. Konzentrieren Sie sich hier auf solche Produkte, die besonders relevant für Sie sind.

An Weiterleitungen denken

Müssen Inhalte aus bestimmten Gründen umziehen, wie es beispielsweise bei einem Relaunch der Fall ist, dann denken Sie an die Weiterleitungen. Für eine dauerhafte Weiterleitung nutzen Sie den Statuscode 301 – für temporäre Weiterleitungen den Statuscode 302. Bedenken Sie bei der Wahl der passenden Weiterleitung: In der Regel sind Weiterleitungen permanenter Natur.

Wie kann ich Duplicate Content finden?

Hier gibt es verschiedene Möglichkeiten – je nachdem, ob Sie vor der Content-Erstellung und -Veröffentlichung aktiv werden, oder nachträglich eine Überprüfung starten. Wenn Sie einen neuen Text verfasst haben und diesen mit einem bereits bestehenden Artikel – der als Quelle diente – auf die Einzigartigkeit vergleichen wollen, dann lesen Sie beide Texte noch einmal und prüfen Sie kritisch, ob Sie tatsächlich einen inhaltlich anderen Schwerpunkt gesetzt haben. Hier ist das Vier-Augen-Prinzip durchaus sinnvoll: lassen Sie im Zweifel eine zweite Person vergleichend über die Inhalte lesen.

Ein gutes Tool, um Ihre Website nach internem Duplicate Content zu durchsuchen, ist Siteliner – hier können Sie Ihre Website in gewissen Rahmen sogar kostenlos checken. So erfahren Sie nicht den aktuellen Duplicate Content Anteil, sondern erhalten auch einen Performance-Vergleich mit anderen gescannten Sites. Hier werden beispielsweise Ladezeiten, Wörter pro Seite, Interne und Externe Links sowie ähnlicher Content aufgezeigt.

Tool für internen Duplicate Content
Scan-Ergebnis interner Duplicate Content / Quelle: siteliner.com

Duplicate Content können Sie auch ganz leicht über die Google-Suche finden. Hierzu geben Sie einfach den zu testenden Textabschnitt in Anführungszeichen in die Suchleiste ein. Erscheint in der Ergebnisliste nur ein Suchergebnis, so können Sie beruhigt sein. Gibt es allerdings den exakt gleichen Textteil an anderer, externer Stelle, so hat jemand ungefragt von Ihnen dupliziert. Jetzt sollten Sie Gegenmaßnahmen ergreifen. Dabei lohnt es sich übrigens auch, auf „Suche unter Einbeziehung der übersprungenen Ergebnisse wiederholen“ zu klicken. So wird keine Kopie übersehen, die Google in den Suchergebnissen listet.

Auch das kostenfreie Tool Copyscape ist hilfreich. Dieses hilft, identische Texte im Netz zu identifizieren. Hierzu müssen Sie nur die URL Ihrer Website eingeben und die Suche starten. Nun werden Ihnen – sollte das Tool fündig werden – die URLs angezeigt, an denen sich gleiche Texte befinden.

Arbeiten Sie gerne mit Google-Tools, dann nutzen Sie doch auch den Google Alert. Hier können Sie einen Alert für einzelne Textabschnitte erstellen – selbstverständlich müssen Sie die eigene Domain vorher ausschließen. Sobald Google die Inhalte an anderer Stelle im Netz findet, erhalten Sie eine Nachricht. 

Google Alert für Duplicate Content
Alert-Einstellungen für Alarme bei Duplicate Content

Die häufigsten Duplicate Content Quellen – so finden Sie diese

Duplicate Content finden Sie nicht nur auf einer Seite mit einem Artikel, sondern dieser kann auch an unauffälligeren Stellen auftreten. Womöglich haben Sie auf Ihrer Site doppelte Textinhalte – und wissen nichts davon. Hier zeigen wir Ihnen, an welchen Stellen sich Duplicate Content besonders gerne versteckt.

Seitenleisten und Footer – Tummelplatz für Duplicate Content

Besonders häufig findet sich Duplicate Content in der Seitenleiste und/oder im Footer wieder. Hier befinden sich oftmals allgemeine Informationen zum Shop/Unternehmen, Versandbedingungen oder die allgemeine Seitenbeschreibung von Website/Blog. Da die Seitenleiste und der Footer auf jeder URL angezeigt werden, befindet sich demnach Duplicate Content auf jeder einzelnen dieser URLs.

Lösung: Selten sind Inhalte so wichtig, dass sie in Prosa-Form auf wirklich jeder Seite vorhanden sein müssen. Viel häufiger ist es so, dass solche Texte den Besucher von der eigentlich gewünschten Aktion (dem Kauf) ablenken. Infos in der Seitenleiste sollten Sie also möglichst knapp (Stichworte!) halten, oftmals bringen hier schön gestaltete Grafiken sogar einen gewissen Mehrwert. Für alle ausführlichen Infos sollte eine Unterseite speziell für das Thema bereitstehen, auf die im Footer oder der Seitenleiste verlinkt wird.

Mehrere Domains eines Betreibers

Besitzen Sie zwei oder mehrere Domains, die identische Inhalte anbieten? Dann befinden Sie sich in einem Konkurrenzkampf mit Ihrem eigenen Duplicate Content.

Lösung: Die einfachste Lösung ist es, die Inhalte nur auf einer Domain verfügbar zu machen, und alle anderen Domains per Weiterleitung mit dem Statuscode 301 auf diese weiterzuleiten. Wenn andere Gründe hiergegen sprechen, darf trotzdem nur eine Version für Suchmaschinen erreichbar sein. Alle anderen Domains müssen Domainweit das folgende Tag im Header tragen:

Tag Duplicate Content mehrere Domains

Die einzige Ausnahme hierzu stellen länderspezifische Domains dar (siehe nachfolgender Punkt).

Länderspezifische Domains

Aufgrund unterschiedlicher Portokosten und Steuersätze ist es für Shops teilweise sinnvoll, eigene Domains oder Verzeichnisse für unterschiedliche Länder zu unterhalten. Übersetzungen werden, wie Sie oben schon erfahren haben, nicht als Duplicate Content gewertet. Anders sieht es bei Ländern aus, die dieselbe Landessprache aufweisen. Gleicher deutscher Content, wie beispielsweise auf Domains wie Schweiz, Deutschland und Österreich, beinhalten in diesem Fall Duplicate Content.

Lösung: Google selbst empfiehlt in dieser Situation, die Inhalte für jede Version mit dem Tag „hreflang“ auszuzeichnen. Wenn es neben der deutschen Version noch eine für die Schweiz gibt, erhält die schweizer Version folgendes Tag im Header:

Tag länderspezifische Domain Duplicate Content

WordPress – doppelte Artikel

WordPress ist ein sehr beliebtes Content Management System. Aufgrund der einfachen Installation und Nutzung sowie der kostenlosen Anschaffung ist dieses bei vielen Website- und Blog-Betreibern die erste Wahl. Bei Nutzern, die sich nicht mit Duplicate Content auseinandersetzen, finden sich daher meist alle Beiträge komplett auf der Startseite – und dann noch einmal als eigener Beitrag.

Lösung: WordPress bietet von Haus aus den Code <!--more--> an, um Beiträge auf der Startseite und in anderen Übersichten (Kategorien, Tags) abzukürzen. Dies eliminiert zwar nicht den kompletten Duplicate Content, aber reduziert diesen schon einmal erheblich.

E-Shop: Gleiche Beschreibungen auf mehreren Portalen

Viele Betreiber eines Online Shops nutzen zum Verkauf nicht nur die eigene Domain, sondern verkaufen auch auf eBay, Amazon Marketplace oder ähnlichen Portalen. Werden hier die Produktbeschreibungen dupliziert, so haben Sie Duplicate Content geschaffen. Zudem arbeiten zahlreiche Shops mit Produkt- und Preisvergleichsseiten zusammen, denen Sie ebenfalls neue Daten über einen Feed zukommen lassen. Vielfach sind diese Inhalte identisch auf der eigenen Domain zu finden.

Lösung: In diesem Fall lässt es sich leider nicht vermeiden: Sie müssen auf der eigenen Domain individuellen Inhalt erstellen. Gerade, wenn der Text zuerst auf dem großen Portal veröffentlicht und von Google indexiert wurde, sind Ihre Chancen extrem gering, mit dem identischen Text Rankings zu erzielen.

Gleiche Beschreibungen auf einer Domain

Nicht nur auf unterschiedlichen Portalen finden sich gleiche (Produkt)Texte, sondern oftmals auch auf der eigenen Domain. Diese Art von Duplicate Content ist vornehmlich in Shops zu finden: Ein Artikel passt zu mehreren Kategorien. Daher ist er in jeder Kategorie auffindbar, und hat dementsprechend verschiedene URLs. Alternativ gibt es zwei ähnliche Artikel in einer Kategorie, die sich nur gering unterscheiden – auch hier werden oft identische Texte genutzt.

Lösung: Bestimmen Sie, auf welcher URL das Produkt bei Google gefunden werden soll. Alle anderen Versionen erhalten das oben vorgestellte Canonical-Tag, um auf das „Original-Produkt“ zu verweisen.

Druckseiten – praktische Duplikate

Viele Websites, wie Informationsportale, Dienstleitungsanbieter oder Shops bieten Usern Informationen nicht nur direkt auf der Seite an, sondern oftmals auch zum Ausdrucken. So eine Übersicht zum Ausdrucken ist schon praktisch, sind die Textinhalte identisch mit der Web-Version, handelt es sich jedoch um Internen Duplicate Content, was zu vermeiden ist.

Lösung: Für solche identischen Inhalte bietet sich ebenfalls die Einrichtung des Canonical-Tags an. Dieses muss für die URL der Druckseite im Header eingerichtet werden.

Grobe Fehler beim Relaunch

Bei Relaunchs oder für Tests wird oft auf einer anderen (Sub-)Domain eine Kopie der kompletten Website erstellt. Machen Sie diese für Crawler der Suchmaschinen erreichbar, werden die Inhalte doppelt indexiert. Fatalerweise beinhaltet die Testdomain häufig neue Inhalte zuerst – ein Zeichen für Google, die Testdomain und nicht die richtige Version ranken zu lassen!

Lösung: Eine Testdomain sollte niemals für Außenstehende erreichbar sein! Aus diesem Grund müssen Sie einen Passwortschutz über die .htaccess einstellen.

Doppelte Erreichbarkeit

Je nach Einstellung kann es sein, dass eine Domain sowohl unter www.website-xy.de als auch unter website-xy.de erreichbar ist.

Lösung: Auch hier müssen Einstellungen in der .htaccess-Datei vorgenommen werden. Hier können Sie einstellen, dass die eine Version auf die identische URL der anderen URL weiterleitet (Statuscode 301). Die Weiterleitung sähe dann folgendermaßen aus:

RewriteEngine On

Options +SymLinksIfOwnerMatch

RewriteCond %{HTTP_HOST} ^website-xy.de

RewriteRule (.*) www.website-xy.de/$1 [R=301,L]

Parameter durch Filter-Einstellungen

Durch Filterungen sowie Sortier- und Darstellungsoptionen entstehen URLs, die Parameter (Beispiel: ?sort=highest, ?mode=list) beinhalten. Sind diese Inhalte für Google sicht- und somit indexierbar, so handelt es sich um Duplicate Content.

Lösung: Je nach Domain müssen Sie andere Schritte ergreifen, um den Duplicate Content zu eliminieren. Meist werden die parametrisierten URLs jedoch mit einem Canonical-Tag oder mit einem „noindex“-Zusatz im Header des Dokuments ausgezeichnet.

Fazit: Kontrolle – Sorgfalt – Technik

Bei Duplicate Content handelt es sich um ein großes Problem für die SEO: Rankings werden behindert und so bleiben Traffic und Umsatz aus. Um die eigene Website vor Duplicate Content zu schützen, müssen Sie an vielen Stellen aktiv werden.

  • Schreiben Sie nicht von anderen Websites ab (Content Plagiate)
  • Publizieren Sie keine eigenen doppelten Inhalte auf Ihrer Site (doppelte Produkttexte etc.)
  • Kontrollieren Sie regelmäßig die eigene Website auf Internen Duplicate Content
  • Nutzen Sie Tools, um Externen Duplicate Content aufzuspüren
  • Zeichnen Sie doppelte Inhalte technisch entsprechend aus (Canonical-Tag, Änderungen .htaccess, „noindex“-Zusatz etc.)
  • Bleiben Sie stets wachsam!
Nehmen Sie mit uns Kontakt auf. Wir beraten Sie gerne.