Canonical Tag

Das Canonical Tag ist eine Angabe im Quellcode einer Website. Es verweist auf eine Standardressource – eine kanonische URL – bei Websites mit gleichen oder fast gleichen Inhalten. Wird eine kanonische URL korrekt ausgezeichnet, so wird nur diese Quelle zur Indexierung der Suchmaschinen herangezogen. Suchmaschinen bewerten Duplicate Content negativ, da kein Mehrwert für den Internetnutzer besteht. Um Duplicate Content zu erkennen, kann ein Duplicate Content Checker verwendet werden.

Video Erklärung

Anwendungsfälle

Angewendet wird das Canonical Tag immer dann, wenn Inhalte mehrfach verwendet werden oder eine eindeutige URL technisch nicht möglich ist:

  • Die Startseite ist über verschiedene URLs erreichbar (www.domain.de, domain.de, www.domain.de/index.html u.s.w.).
  • Seiten sind mit und ohne Trailing Slashes (“/”) oder mit Klein- und Großschreibung aufrufbar (Case sensitivity).
  • Der Server achtet durch Rewriting der URL nur auf eine ID, lässt also Variationen der Adresse zu.
  • Es werden IDs (z. B. Session-ID oder Produktfilter) verwendet, die den Inhalt nicht ändern.
  • Der Inhalt wird in verschiedenen Ansichten dargeboten (z. B. in einer Druckversion, als PDF u.s.w.).
  • Es gibt https-Varianten der Seiten.
  • Inhalte werden auf anderen, externen Websites zusätzlich veröffentlicht.

Grundsätzlich ist es sinnvoll, das Canonical Tag auf jeder Unterseite einzubauen, sodass jede Seite auf sich selbst zeigt. Damit werden unerwartete Fehler und falsche Verlinkungen korrigiert oder vorgebeugt.

Zwei Varianten, eine kanonische URL anzugeben

Es gibt grundsätzlich zwei Möglichkeiten, eine kanonische URL anzugeben. Bei beiden Varianten empfiehlt Google die Angabe von absoluten URLs – d.h. der gesamten Internetadresse.

  • Die Syntax der ersten Variante sieht folgendermaßen aus:
<link rel=“canonical“ href=“http://www.beispiel.de/beispielseite.htm"/>

Das <link/>-Element mit dem Attribut canonical wird im <head/>-Element des Quellcodes platziert und ergänzt die Meta-Angaben eines Dokumentes. Es verweist auf die Standardseite, wird aber nur dort verwendet, wo Seiten, die nicht als Originalressource behandelt werden sollen, identische Inhalte aufweisen.

Nehmen wir an, wir haben zwei Webseiten:

 http://www.beispiel.de/beispielseite.htm
 http://www.beispiel.de/beispielseite/?session_id=xyz.htm

Die erste soll die Standardressource sein. Die zweite ist eine Session, wie sie bei Onlineshops oft üblich ist, um benutzerbezogene Daten speichern zu können, z.b. hinterlegte Artikel in einem Warenkorb. Nun wird das Canonical Tag in das Head-Element der zweiten Seite integriert. Es enthält einen Verweis auf die Standardressource, die erste Seite. So wissen Google und Co., welche Seite bevorzugt behandelt und in den Index aufgenommen werden soll.

  • Wenn die Standardressource eine PDF-Datei oder ein anderer Dateityp ist, der von Google unterstützt wird, dann muss das Canonical Tag in den Header der Seite integriert werden. Die Syntax unterscheidet sich und die Einbindung erfordert Kenntnisse des Hypertext Transfer Protokolls (HTTP):
Link: <http://www.beispiel.de/beispielseite.pdf>; rel=“canonical“

Dies ist keine Angabe im Dokument, sondern vielmehr eine Anweisung für die Antwort des HTTP-Protokolls: Kommt eine Anfrage vom Client (z.b. Browser oder eine Suchmaschine), sendet der Server die Antwort, dass diese Seite die kanonische URL ist. Mitunter ist eine neue Konfiguration des Servers notwendig.

Angenommen wir haben diese beiden Webseiten:

 http://www.beispiel.de/beispielseite.htm
 http://www.beispiel.de/beispielseite.pdf

Die zweite Seite soll die Standardressource sein. Da es eine PDF-Datei ist, muss das Canonical Tag in den Header der Seite integriert werden. Es verweist auf sich selbst und gibt Google den Hinweis, dass das PDF-Dokument als Standard zur Indexierung dienen soll.

Hintergrund

Mithilfe von Canonical Tags können Webseitenbetreiber den Suchmaschinen mitteilen, welche der Seiten mit identischen Inhalten als Standardressource zu behandeln sind. Um dem Problem des Duplicate Contents Herr zu werden, ist ein korrekt verwendetes Canonical Tag die erste Wahl. Dadurch nehmen Webmaster auch Einfluss auf die Linkpopularität bestimmter Seiten mit identischen Inhalten und bündeln gleichzeitig die Reputation dieser Seiten auf einer kanonischen URL. Das Canonical Tag ist also ein wichtiges Gestaltungselement, um gezielt Seiten für Suchmaschinen zu optimieren.

Häufige Fehler

Allerdings ist es auch ein mächtiges Werkzeug, denn wird es falsch eingesetzt, können Webseiten von Google komplett ignoriert werden. Der Webseitenbetreiber sollte sich zunächst fragen, ob es sich wirklich um identische oder nahezu identische Inhalte handelt. Dann und nur dann sind Canonical Tags sinnvoll.

Häufige Fehler sind:

  • Bei paginierten / nummerierten Seiten durch rel="next", rel="prev" sind Canonical Tags nicht sinnvoll, da es sich genau genommen nicht um identische Inhalte handelt.
  • Die ausgezeichnete Webseite sollte zudem erreichbar sein: Ein 404-Fehler ist unbedingt zu vermeiden.
  • Die Kombination von „noindex“, „disallow“ oder „nofollow“- Tags und kanonischen URLs ist von Google ausdrücklich nicht erwünscht.
  • Das Canonical Tag hat im Body-Bereich eines Dokumentes nichts verloren und es darf auch nicht in den Meta-Angaben mehrmals verwendet werden.

Weblinks