Duplicate Content: Text, Bilder und Videos
Nach neuerlichen Änderungen der Algorithmen der Suchmaschinen werden viele Shopbetreiber oder Informationsportale im Internet entweder seitenweise aus dem Index genommen oder schlechter gelistet. Der Grund hierfür ist meist Duplicate Content: Eine oder mehrere Unterseiten einer Domain weisen gleichen oder ähnlichen Inhalt in Text, Bildern und Videos auf oder die gleiche Seite wird über verschiedene Adressen erreicht.
Doppelte oder ähnliche Webseitentexte werden mit einem „Canonical Link“ vermieden
Besonders in Internet-Shops findet sich auf vielen Seiten Duplicate Content in Form von Artikel- und Produktbeschreibungen, Produktbildern und Videos. Betreiber dieser Shops können dies mit einem Link im Header-Bereich der Webseite beheben. Der sogenannte Canonical-Link weist die Suchmaschine an nur die Hauptseite, in der die Webseitentexte erscheinen, zu indizieren. Vielen Webseitenbetreibern ist zudem nicht bekannt, dass es sich bei einer „www“ Domain um eine Subdomain handelt, die mit dem gleichen Inhalt auf die Hauptseite verweist. Auch diese Seiten sind von Duplicate Content betroffen. Durch Einfügen des Links wird eine kanonische Seite erzeugt und den Suchmaschinen angezeigt, welche als Hauptseite zu indizieren ist.
Bilder und Videos als Duplicate Content
Bilder und Videos sind bei der Prüfung auf Einzigartigkeit derzeit noch nicht im gleichen Maße betroffen wie Webseitentexte, da die Crawler der Suchmaschinen Bildmaterial noch nicht vollkommen zuverlässig indizieren können. Auf einem großen Videoportal wurden jedoch schon Filter erprobt, um Dubletten aufzuspüren. Da hier eine weitere Entwicklung der Prüfungsmöglichkeiten zu erwarten ist und eine Webseite einzigartig sein soll, ist es von Vorteil, wie beim Verfassen der Webseitentexte auch bei Bildern und Videos darauf zu achten, Duplicate Content zu vermeiden.
Umleitungen verhindern Duplicate Content in Domains
Werden Domains umgezogen oder neu eingerichtet, sind die Seiteninhalte oft für längere Zeit unter verschiedenen Adressen zu erreichen. Das bedeutet, dass die Webseite auch unter der IP-Adresse erreicht werden kann und die gleichen Webseitentexte, Grafiken und gegebenenfalls Videos beinhaltet wie die Hauptseite der Domain. Während zwar davon auszugehen ist, dass auch Bilder und Videos in Zukunft mitgeprüft werden dürften, fallen sie bisher nicht annähernd so sehr ins Gewicht wie duplizierte Textinhalte: In vielen Fällen werden gerade Webseitentexte unbewusst doppelt ins Internet gestellt und daher von den Suchmaschinenbetreibern nur mit schlechteren Platzierungen auf den Suchergebnisseiten bestraft. Mit einer .htaccess-Datei oder einem Eintrag in der robot.txt-Datei werden die Suchmaschinen darüber informiert, welche Adresse der Domain in den Index genommen werden soll. Webmaster, die mit Umleitungen oder Dateien die Suchmaschinen über Duplicate Content in ihren Texten informieren, können nach einiger Zeit mit einer besseren Platzierung der Webseiten oder Domains rechnen.