Was ist Duplizierter Content?

Was sind Duplicate content (Oder Duplizierter Content)? Wenn Ihre Website mehrere Seiten mit dem gleichen Inhalt hat (oder wenn eine andere Website Informationen von Ihrer Website kopiert hat), sprechen wir von doppeltem Inhalt. Die englische Übersetzung ist doppelter Inhalt. Duplicate content sind für die Suchmaschinenoptimierung sehr ungünstig, da sie Ihren Seiten weniger Wert verleihen. Für Google hat nur eine der beiden „gleichen“ Seiten einen Wert. Google kann dies auf verschiedene Weise messen.

Duplikate von Inhalten und SEO: Es war noch nie eine glückliche Kombination. Seit dem Panda-Update von Google im Jahr 2011 und den Penguin-Updates in den Jahren 2012 und 2013 haben sich die Folgen doppelter Inhalte jedoch erhöht.

Früher waren es vor allem die Rankings der Seiten mit doppeltem Inhalt, die betroffen sein könnten, aber nach Panda/Pinguin könnten die Rankings Ihrer gesamten Website gefährdet sein.

Dies ist ein guter Zeitpunkt, um einen genaueren Blick auf Duplicate content zu werfen.

Was sind Duplicate content?

Doppelter Inhalt tritt auf, wenn zwei oder mehr Seiten den gleichen oder fast den gleichen Inhalt haben.

Leider veröffentlichen Suchmaschinen keine genauen Prozentsätze, aber es wird geschätzt, dass Seiten, die zu mehr als 70% gleich sind, als Duplicate content gelten.

Das Einzige, was hier zählt, ist der Text der Seite: Die Kodierung ist nicht wichtig.

Wenn Sie also zwei Websites mit identischem Design (gleiche Vorlage, Menüstruktur, etc.), aber unterschiedlichem Text haben, müssen Sie sich um nichts kümmern.

Wenn es um Duplicate content geht, sollten Sie auch bedenken, dass eine „Seite“ nicht einfach nur eine Datei oder ein Dokument auf dem Webserver ist.

Eine Suchmaschine betrachtet jede eindeutige URL als eine separate Seite. Wenn zwei verschiedene URLs auf genau den gleichen Inhalt verweisen (was auf einer Website sehr schnell passieren kann), dann sieht Googlebot sie als zwei separate Seiten mit doppeltem Inhalt.

Beispiele für duplicate content

Doppelte Inhalte (duplicate content) können auf ein und derselben Domäne oder auf zwei (oder mehreren) Domänen auftreten.

Die gleiche Domain

Duplicate content ist ein häufiges Problem auf Websites. Zunächst einmal ist eine Domain „““, wenn Sie nichts dagegen unternehmen „“ immer über zwei verschiedene URLs erreichbar: die http- und die www-Version.

Für Standorte mit einer sicheren Umgebung wird eine dritte hinzugefügt: https. Googlebot sieht alle URLs, die auf den gleichen Inhalt verweisen wie einzelne Seiten, was zu doppelten Inhalten führt.

Andere häufige Probleme (insbesondere bei dynamischen Websites auf CMS-Basis, wie WordPress oder Joomla) sind mehrere URLs für die Homepage und PDF- oder Druckversionen einer Seite mit einer separaten URL.

Auf einer Website können daher z.B. duplicate content in der Praxis so aussehen:

  • http://seite.de
  • www.seite.de
  • http://seite.de/index.html
  • www.seite.de/artikel
  • www.seite.de/artikel.pdf
  • www.seite.de/print/artikel

Verschiedene Domains

Doppelte Inhalte auf verschiedenen Domänen können erstellt werden, z.B. wenn der Autor seinen Artikel mehreren Seiten anbietet. Manchmal werden Artikel auch ohne Zustimmung des Autors auf anderen Seiten platziert, was eine Urheberrechtsverletzung darstellt.

Ein weiterer häufiger Fall von doppelten Inhalten auf verschiedenen Domains ist, wenn Affiliate-Seiten automatisch alle Produktbeschreibungen eins zu eins vom Anbieter übernehmen.

Folgen duplicate content

Bevor wir uns mit der Frage beschäftigen, wie man doppelte Inhalte erkennt und was man dagegen tun kann, werfen wir einen Blick auf die drängendste Frage: Was sind die Folgen und wie schlimm sind duplicate content überhaupt?

Google ignoriert doppelten Inhalt

Google ist stets bestrebt, den Nutzern die relevantesten Suchergebnisse zur Verfügung zu stellen. Natürlich wartet ein Benutzer nicht darauf, dass derselbe Inhalt mehrmals in den Suchergebnissen erscheint.

Wenn Google also doppelte Inhalte findet, wird nur eine Seite in die Suchergebnisse aufgenommen. In den Suchergebnissen sehen Sie die folgende Meldung:

Was duplicate content auf Ihrer eigenen Domain betrifft, ist das an sich gar nicht so schlecht. Solange Google natürlich Ihre bevorzugte URL zur Anzeige wählt.

Etwas, das leider nicht immer der Fall ist.

Duplicate content auf zwei verschiedenen Domänen können ebenfalls Probleme verursachen. Manchmal kann Google nicht feststellen, was der Originalartikel ist, so dass die Website des Originalautors zurückgelassen wird und nur die Website, die den Artikel kopiert hat, in den Suchergebnissen angezeigt wird.

Wenn Google Recht hat und das Original zeigt, wird die Seite, die den Artikel übernommen hat, nicht von SEO profitieren. Wenn die erwerbende Website ihren Nutzern einfach nur wertvolle Inhalte anbieten will, ist das kein Problem. Wenn die erwerbende Website jedoch nichts anderes tut, als Inhalte zu veröffentlichen, die sich bereits auf anderen Websites befinden, sind die Folgen (wie wir unten sehen werden) ärgerlich.

Verlust von Link-Saft und Rankings

Über Links wird der Wert auf eine Seite übertragen, auf die verlinkt wird. Dieser Wert wird Linkjuice genannt und je mehr Wert eine Seite erhält, desto höher wird sie in Google eingestuft.

Angenommen, Sie haben doppelten Inhalt auf Ihrer Website in Form eines Artikels, der über zwei URLs zugänglich ist: www.seite.de/artikel und www.seite.de/Datei.pdf.

Es gibt 5 Websites, die auf die erste URL verweisen und 5 Websites, die auf die zweite URL verweisen. Infolgedessen wird der Link-Link auf zwei verschiedene URLs aufgeteilt, anstatt dass der gesamte Wert zu einer URL/Seite fließt.

Die Rankings Ihres Artikels in Google sind jetzt niedriger, als wenn alle 10 Links auf die gleiche URL verwiesen hätten.

Weniger Crawlzeit für Ihre Website

Wenn Googlebot auf Ihrer Website landet, beginnt es, alle Ihre Seiten zu durchsuchen. Wenn es auf viele URLs/Seiten mit dem gleichen Inhalt trifft, wird Googlebot bald aufhören, ihn zu verwenden.

Eine Website mit vielen doppelten Inhalten ist einfach nicht interessant. Wenn Googlebot weniger Zeit damit verbringt, Ihre Website zu durchsuchen, laufen Sie Gefahr, dass wichtige Seiten auf Ihrer Website nicht mehr durchsucht werden und daher in den Suchergebnissen nicht sichtbar sind.

Es werden weniger Seiten indiziert.

Basierend auf dem PageRank/Behörde Ihrer Website setzt Google ein Limit dafür, wie viele Seiten indiziert werden.

Wenn Hunderte von Seiten mit duplicate content von Ihrer Website bereits im Google-Index aufgeführt sind, besteht die Gefahr, dass das Limit erreicht wird und andere wichtige Seiten Ihrer Website nicht aufgeführt werden.

Eine Strafe für die gesamte Website.

In einigen Fällen können doppelte Inhalte zu einer Strafe für die gesamte Website führen. Google sagt dazu folgendes auf seinen Webmaster Supportseiten:

In den seltenen Fällen, in denen wir annehmen müssen, dass duplizierter Content mit der Absicht angezeigt wird, das Ranking zu manipulieren oder unsere Nutzer zu täuschen, nehmen wir die entsprechenden Korrekturen am Index und Ranking der betreffenden Websites vor. Infolgedessen werden diese Websites unter Umständen in den Suchergebnissen niedriger eingestuft oder sogar aus dem Google-Index entfernt und damit nicht mehr in den Suchergebnissen angezeigt.

Eine ziemlich schwere Strafe…

Glücklicherweise verteilt Google nicht nur eine solche „standortweite Strafe“: Damit das passieren kann, muss eine Website mit doppeltem Inhalt ziemlich bunt gestaltet werden.

Die größten Verlierer der Panda- und Pinguin-Updates waren Websites, die hauptsächlich aus mittelmäßigen und doppelten Inhalten bestanden. Solche Seiten haben keinen oder nur geringen Mehrwert für die Nutzer und werden daher von den Suchergebnissen ausgeschlossen.

Ist doppelter Inhalt immer schlecht?

Wenn Sie Rankings in Suchmaschinen mögen, ist Duplizierter Content ein wichtiges Thema.

Auf Ihrer eigenen Domain ist Duplizierter Content nie gut und Sie sollten ihn so weit wie möglich vermeiden.

Google kann sich dafür entscheiden, eine andere URL als Ihre bevorzugte URL in den Suchergebnissen anzuzeigen, in vielen Fällen verbreiten Sie unnötigerweise Link-Saft und es kann vorkommen, dass weniger Seiten auf Ihrer Website gecrawlt und indiziert werden.

Duplizierter Content auf zwei oder mehr verschiedenen Domains sollten in den meisten Fällen vermieden werden.

In einem Fall spielt es jedoch keine Rolle und kann sogar Ihnen zugute kommen. Wenn Sie einen Artikel schreiben, ihn auf Ihre eigene Website stellen und dann einer anderen Website anbieten, ist nicht so viel los wie Google den Artikel auf Ihrer Website als Original betrachtet und in den Suchergebnissen anzeigt.

Mit dem Artikel auf der anderen Seite werden Sie nicht nur Ihre Leserschaft erhöhen, sondern auch einen schönen Link zu Ihrer Seite verdienen. Duplizierter Content können sich manchmal positiv auswirken!

Wie kann man Duplizierter Content aufspüren?

Sie können doppelte Inhalte auf die folgenden Arten finden:

Google Webmaster-Tools

Gehen Sie in Google Webmaster Tools (GWT) zu Erscheinungsbild der Seitensuche > HTML-Verbesserungen. Hier können Sie sehen, ob Google auf Ihrer Website Doppel-Meta-Beschreibungen und/oder Titel-Tags gefunden hat, die auf doppelte Inhalte auf Ihrer Domain hinweisen könnten.

Google

Wenn Sie überprüfen möchten, ob es Kopien Ihres Artikels an anderer Stelle im Web gibt, können Sie ein Stück Text aus Ihrem Artikel kopieren und ihn in doppelten Anführungszeichen in Google eingeben.

Durch die Verwendung von doppelten Anführungszeichen sucht Google nach Stellen, an denen dieser ganze Textblock im Internet in der gleichen Reihenfolge erscheint.

Wenn Sie nach Duplizierter Content auf Ihrer eigenen Domain suchen, verwenden Sie den Befehl „site:“. Dieser Befehl kann in Kombination mit anderen Suchbefehlen verwendet werden.

Wenn Sie z.B. vermuten, dass es mehrere Kopien Ihrer Homepage auf Ihrer eigenen Domain gibt, dann suchen Sie in Google unter „site:seite.de intitle: „the title of my homepage““

Copyscape

Eine nützliche Möglichkeit, um zu überprüfen, ob Ihr Artikel von einer anderen Website ohne Genehmigung kopiert wurde, ist Copyscape. Geben Sie einfach die URL der Seite ein, die Sie überprüfen möchten, und Copyscape sucht im Web nach möglichen Duplikaten Ihres Artikels.

Lösungen für doppelte Inhalte

Wenn Sie auf doppelte Inhalte gestoßen sind, ist es wichtig, diese wieder zu lösen. Nachfolgend finden Sie verschiedene Möglichkeiten, dies zu tun.

Wählen Sie die Lösung, die für Sie am einfachsten ist und duplizieren Sie keine Dinge. Wenn Sie beispielsweise eine 301-Umleitung wählen, müssen Sie nicht zusätzlich ein kanonisches Tag anwenden.

Löschen doppelter Inhalte: 404

Der einfachste Weg, mit doppelten Inhalten umzugehen, ist, sie einfach zu löschen. Die gelöschte URL liefert dann einen 404-Code (Seite nicht gefunden).

Hat die alte Seite eingehende Links und Besucheraufkommen? Dann wählen Sie eine 301 Umleitung.

301 Umleitung

Mit einem 301-Redirect geben Sie an, dass die Seite dauerhaft an einen anderen Ort verschoben wurde. Ein Benutzer, der die doppelte URL in seinem Browser eingibt, wird dann automatisch auf die richtige URL umgeleitet.

Der Vorteil eines 301 Redirect ist, dass der Link Jice der doppelten Seite zum Original durchläuft. Benutzer, die die alte URL in ihren Favoriten gespeichert haben, werden automatisch auf die neue URL umgeleitet und erhalten keine 404-Fehlermeldung.

Verwenden Sie immer eine 301-Umleitung (permanent bewegt) und keine 302-Umleitung (vorübergehend bewegt). Ein 302 Redirect verursacht keinen Link-Sprung.

Umleitung von http auf wwww

Um sicherzustellen, dass alle Seiten auf Ihrer Website über eine einzige Art von URL zugänglich sind, müssen Sie einen 301-Redirect von http nach www (oder umgekehrt) erstellen. Wenn Ihre Website auf einem Apache-Server gehostet wird, können Sie die 301-Umleitung erstellen, indem Sie Ihre.htaccess-Datei bearbeiten.

Wenn Ihre Website auf einem Microsoft IIS-Server läuft, können Sie die erforderlichen Anpassungen mit dem Internet Services Manager vornehmen. Wenn Sie dies nicht selbst tun möchten, bitten Sie Ihren Hosting-Provider, die Umleitung für Sie durchzuführen.

Legen Sie dann auch Ihre bevorzugte Domain in den Google Webmaster Tools fest. Klicken Sie dazu auf das Zahnradsymbol in GWT und dann auf Standorteinstellungen. Wenn Sie beispielsweise die www-Version hier als Ihre bevorzugte Domäne festlegen, betrachtet Google alle Links, auf die sie mit der http-Version Ihrer Website trifft, als Link zur www-Version.

Der canonical tag

Mit dem canonical tag können Sie Google mitteilen, welche Ihre bevorzugte URL (auch kanonische URL genannt) ist.

Wenn Sie ein solches kanonisches Tag verwenden, werden Sie den Link-Amendment wie bei einem 301 Redirect weitergeben. Sie können Suchmaschinen über die kanonische Seite informieren, indem Sie dem Abschnitt der nicht-kanonischen Version der Seite ein kanonisches Tag hinzufügen.

Wenn Ihre Homepage beispielsweise über die nicht-kanonische URL http://www.seite.de/index.html zugänglich ist, fügen Sie den folgenden Code in den Abschnitt dieser Seite ein, um Google mitzuteilen, dass http://www.seite.de Ihre bevorzugte URL ist:

<link rel="canonical" href="/seite-name/">

Robots.txt und Meta-robots

Mit einer robots.txt-Datei in Ihrem Stammverzeichnis können Sie Suchmaschinen mitteilen, welche Seiten oder Ordner sie durchsuchen dürfen und welche nicht. Wenn Sie doppelten Inhalt auf einer Seite und in einem Ordner haben, blockieren Sie diese Seite und diesen Ordner für Googlebot, indem Sie sie wie folgt in Ihre robots.txt aufnehmen:

User-agent: *
Disallow: /doppelte-seite.html
Disallow: /doppelte-verzeichnis/

Sie können dies auch auf Seitenebene tun, indem Sie dem Teil der Seite ein Meta-Roboter-Tag hinzufügen.

Du kannst einen Noindex, Follow oder Noindex, nofollow wählen. In beiden Fällen wird die Seite nicht indiziert, aber mit einem Follow-Befehl folgt die Suchmaschine allen Links auf der Seite im Gegensatz zum Befehl nofollow.

<meta name="robots" content="noindex, follow">

oder

<meta name="robots" content="noindex, nofollow">

Google rät von der Verwendung von robots.txt ab und zieht es vor, eine andere Lösung zu verwenden. Wenn Googlebot die blockierten Seiten nicht mit doppeltem Inhalt durchsuchen kann, kann es nicht feststellen, ob sich diese URLs auf doppelten Inhalt beziehen und die blockierten URLs als eindeutige und separate Seiten betrachten.

Schreiben Sie einzigartige und wertvolle Inhalte.

In der Post-Panda- und Post-Pinguin-SEO-Landschaft ist es wichtiger denn je, einzigartige und wertvolle Inhalte zu schreiben. Google gelingt es zunehmend, die Wünsche der Nutzer in die Suchergebnisse umzusetzen.

Die Benutzer sind in erster Linie an einzigartigen, wertvollen Informationen interessiert, die ihnen helfen, Fragen zu beantworten und Probleme zu lösen. Schreiben Sie also Inhalte, die Menschen wirklich helfen und kopieren Sie nicht nur Teile aus anderen Artikeln.

Seien Sie clever mit der On-Page-Optimierung.

Der erste Schritt in der SEO-Arbeit für Ihre Website ist die Durchführung einer umfangreichen Keyword-Suche.

Basierend auf den von Ihnen gefundenen Keywords können Sie dann an der On-Page-Optimierung arbeiten, indem Sie gezielte SEO-Texte schreiben. Google ist noch nicht in der Lage, die Bedeutung von Keywords wirklich zu verstehen.

Was Sie also oft sehen, ist, dass Websites separate Seiten für alle Arten von Variationen von Keywords erstellen, um in der Lage zu sein, auf all diesen Variationen Rang zu halten.

Zum Beispiel erstellt eine Website, die Autoversicherungen verkauft, verschiedene Seiten für die Schlüsselwörter „billige Autoversicherung“, „billige Autoversicherung“, „billige Autoversicherung“, „billige Autoversicherung“, „billige Autoversicherung“, etc.

Google möchte nicht, dass Sie zusätzliche Seiten, Subdomains oder Domains mit nahezu identischem Inhalt erstellen. Stellen Sie sicher, dass Sie so viele dieser Keyword-Variationen wie möglich auf einer Seite verarbeiten. Dies ist möglich für Keywords, die nicht sehr wettbewerbsfähig sind und die die gleiche Suchabsicht der Benutzer haben.

Gibt es viel Konkurrenz bei den Keywords und/oder ist die Suchabsicht nicht ganz gleich? Erstellen Sie dann separate Seiten, aber stellen Sie sicher, dass Sie für jede dieser Seiten eigene Inhalte schreiben.

Natürlich braucht es mehr Zeit und Geld, aber wenn Sie jedes Mal den gleichen Text kopieren und nur die Keywords ändern, werden die Seiten als doppelter Inhalt betrachtet und sind in den Suchergebnissen sowieso nicht sichtbar.

Wenn Sie viele dieser Seiten mit fast gleichem Inhalt auf Ihrer Website erstellen, laufen Sie auch Gefahr, eine standortweite Strafe zu erhalten.

Stellen Sie sicher, dass Ihre internen Links in Ordnung sind.

Viele Webmaster, die doppelte Inhalte auf ihrer Domain mit 301 Redirects und kanonischen Tags bearbeitet haben, vergessen oft, die internen Links der Website zu überprüfen und zu bearbeiten. Wenn viele interne Links noch auf die nicht-kanonischen Seiten verweisen, gibt dies verwirrende Signale an Googlebot. Achten Sie daher immer darauf, dass alle Ihre internen Links auf kanonische Seiten verweisen.

Tipps für Affiliate-Websites

Es ist ein häufiges Problem für viele Affiliate-Websites: Wie werden Sie in Google eingestuft?

Die meisten Affiliate-Seiten beziehen alle Produktbeschreibungen und Werbetexte direkt vom Lieferanten. Google sieht dies als doppelten Inhalt und zeigt nur die Inhalte des Anbieters an, so dass die Affiliates in Google kaum sichtbar sind.

Der Weg, dies zu lösen, ist, einzigartige Inhalte für alle Produkte zu schreiben, die Sie anbieten. Für große Websites bedeutet dies eine erhebliche Investition. Aber als Affiliate, wenn Sie Geld mit Verkäufen und Leads verdienen wollen, müssen Sie normalerweise in den sauren Apfel beißen.

Eine weitere, kostenlose Möglichkeit, Ihren Produktbeschreibungen einzigartige Inhalte hinzuzufügen, besteht darin, dass Benutzer Text durch „user generated reviews“ hinzufügen.

Wenn Ihre Nutzer Bewertungen und Erfahrungen auf Ihrer Website hinterlassen können, werden einzigartige Inhalte sofort auf der Seite hinzugefügt, so dass Sie langfristig wieder in Google sichtbar sind.

Inhalte anderen Seiten anbieten

Hast du einen Artikel geschrieben und möchtest ihn einer anderen Seite anbieten? Stellen Sie sicher, dass der Betrieb, der den Artikel veröffentlicht, einen Link zurück zum Ursprungsartikel enthält. Auf diese Weise kann Google in den meisten Fällen überprüfen, ob der Artikel auf Ihrer Website der ursprüngliche ist, so dass Ihre Website auch in den Suchergebnissen erscheint.

Möchten Sie absolut sicher sein, dass Google den Artikel auf Ihrer Website als Original betrachtet? Dann kannst du es:

  1. Bieten Sie den Artikel nur an, wenn Google den Artikel bereits auf Ihrer Website indiziert hat;
  2. Bitten Sie die erwerbende Website, der Seite, die sich auf Ihre Website bezieht, ein kanonisches Tag hinzuzufügen;

und/oder

  1. Fordern Sie die erwerbende Website auf, einen Roboter noindex-Meta-Tag auf der Seite zu platzieren.