Sprechende URL’s sind immer große Leckerbissen für Google und Co. Es gibt allerdings noch eine Untiefe in Bezug auf Suchmaschinen: “Duplicate content”.
Wenn unter verschiedenen URL’s gleiche Inhalte vorgefunden werden, betrachtet zumindest Google das als doppelten Inhalt, der zur Abwertung führt.
Zunächst wäre da das Thema mit “www.” oder ohne. In der Regel lassen sich alle Seiten eines Internetauftrittes sowohl mit vorangestelltem “World Wide Web” als auch ohne erreichen, so dass diese Seite hier sowohl unter
- http://www.nsah.de/node/17
als auch unter
zu finden wäre.
Die Lösung bringt Drupal schon in der Grundinstallation in Form einer vorbereiteten .htaccess Datei mit. Diese liegt im Hauptverzeichnis und wenn man sie öffnet finden sich zwei auskommentierte Abschnitte. Je nachdem für welche Variante man sich entscheidet, sind die entsprechenden Abschnitte anzupassen.
Wenn man möchte, dass die Seiten nur mit dem “www.” angezeigt werden, dann sind die Rauten der letzten beiden Zeilen zu entfernen und “example” ist durch den eigenen Domainnamen zu ersetzen und “.com” durch die eigene Domainendung:
# To redirect all users to access the site WITH the 'www.' prefix,
# (http://example.com/... will be redirected to http://www.example.com/...)
# adapt and uncomment the following:
# RewriteCond %{HTTP_HOST} ^example\.com$ [NC]
# RewriteRule ^(.*)$ http://www.example.com/$1 [L,R=301]
Falls kein “www.” in der URL auftauchen soll, dann ist mit dem folgenden Abschnitt der .htaccess Datei genau wie oben beschrieben zu verfahren:
# To redirect all users to access the site WITHOUT the 'www.' prefix,
# (http://www.example.com/... will be redirected to http://example.com/...)
# adapt and uncomment the following:
# RewriteCond %{HTTP_HOST} ^www\.rausgebloggt\.de$ [NC]
# RewriteRule ^(.*)$ http://nsah.de/$1 [L,R=301]
Die veränderte .htaccess Datei ist nur noch zu speichern und ggf. hochzuladen. Anschließend werden alle Seitenaufrufe bei Bedarf auf die gewünschte Form umgeändert, so dass immer nur eine Seite mit bzw. ohne “www.” existiert. Das war allerdings noch nicht alles was zu irrtümlich erzeugten Duplicate content führen kann.
Das Pathauto Modul stellt zwar die schönen sprechenden und konfigurierbaren URL’s zur Verfügung, aber leider sind auch alle anderen Möglichkeiten ein und dieselbe Seite zu erreichen noch gültig. So führten folgende URL Varianten alle auf diese Seite:
- http://nsah.de/?q=node/17
- http://nsah.de/?q=node/17/
- http://nsah.de/node/17
- http://nsah.de/node/17/
- http://nsah.de/doublicate-content-drupal-vermeiden.htm
Dies Problem lässt sich mit dem Global Redirect Modul lösen. Es sorgt dafür, dass der Aufruf aller o.g. URL’s per 301 Redirect immer auf die gleiche eine URL
- http://nsah.de/duplicate-content-unter-drupal-vermeiden.htm
umgeleitet werden. So ist man vor der Duplicate content Falle geschützt.
Achtung 1: Vielleicht ist dies mittlerweile behoben, aber als ich das Modul installieren wollte, tauchte es erstaunlicherweise nicht in der Modulverwaltung auf. Ich fand einen Hinweis in den Supportanfragen zu dem Modul. Dort gibt es die wichtige und merkwürdigerweise im Modulordner fehlende Datei “globalredirect.info_.txt” herunterzuladen. Nachdem man diese in den Ordner des Moduls ablegt und in “globalredirect.info” umbenennt, steht einer Aktivierung des Moduls in der Modulverwaltung nichts mehr im Wege.
Achtung 2: Ich hatte bei der aktuellen Version 5.x-1.0 (am 28.03.2007) des Global Redirect Moduls Probleme mich nach dem Ausloggen wieder in Drupal einzuloggen. Ich landete nach Absenden der Anmeldedaten einfach wieder auf der Startseite (ohne irgendwelche Fehlermeldung) und war weiterhin ausgeloggt. Nach langem Suchen kam ich auf die Idee das Global Redirect Modul zu deaktivieren und sofort war das Einloggen kein Problem mehr. Ich habe es dann mit der Entwicklerversion 5.x-1.x-dev probiert und siehe da … keine Probleme mit aktiviertem Global Redirect
. Netter Nebeneffekt das unter Achtung 1 beschriebene Probleme tritt mit der Entwicklerversion ebenfalls nicht auf!
Jetzt produziert Drupal nicht nur schöne sprechende URL’s sondern alle Seiten sind jeweils nur unter einer einzigen individuellen URL zu finden.
(Foto: “mirror mirror on the wall” © Madzik @ Flickr)
Sprechende URL's sind immer große Leckerbissen für Google und Co. Es gibt allerdings noch eine Untiefe in Bezug auf Suchmaschinen: "Duplicate content".
Wenn unter verschiedenen URL's gleiche Inhalte vorgefunden werden, betrachtet zumindest Google das als doppelten Inhalt, der zur Abwertung führt.
Zunächst wäre da das Thema mit "www." oder ohne. In der Regel lassen sich alle Seiten eines Internetauftrittes sowohl mit vorangestelltem "World Wide Web" als auch ohne erreichen, so dass diese Seite hier sowohl unter
http://www.nsah.de/node/17
als auch unter
http://nsah.de/node/17
zu finden wäre.
Die Lösung bringt Drupal schon in der Grundinstallation in Form einer vorbereiteten .htaccess Datei mit. Diese liegt im Hauptverzeichnis und wenn man sie öffnet finden sich zwei auskommentierte Abschnitte. Je nachdem für welche Variante man sich entscheidet, sind die entsprechenden Abschnitte anzupassen.
Wenn man möchte, dass die Seiten nur mit dem "www." angezeigt werden, dann sind die Rauten der letzten beiden Zeilen zu entfernen und "example" ist durch den eigenen Domainnamen zu ersetzen und ".com" durch die eigene Domainendung:
# To redirect all users to access the site WITH the 'www.' prefix,
# (http://example.com/... will be redirected to http://www.example.com/...)
# adapt and uncomment the following:
# RewriteCond %{HTTP_HOST} ^example\.com$ [NC]
# RewriteRule ^(.*)$ http://www.example.com/$1 [L,R=301]
Falls kein "www." in der URL auftauchen soll, dann ist mit dem folgenden Abschnitt der .htaccess Datei genau wie oben beschrieben zu verfahren:
# To redirect all users to access the site WITHOUT the 'www.' prefix,
# (http://www.example.com/... will be redirected to http://example.com/...)
# adapt and uncomment the following:
# RewriteCond %{HTTP_HOST} ^www\.rausgebloggt\.de$ [NC]
# RewriteRule ^(.*)$ http://nsah.de/$1 [L,R=301]
Die veränderte .htaccess Datei ist nur noch zu speichern und ggf. hochzuladen. Anschließend werden alle Seitenaufrufe bei Bedarf auf die gewünschte Form umgeändert, so dass immer nur eine Seite mit bzw. ohne "www." existiert. Das war allerdings noch nicht alles was zu irrtümlich erzeugten Duplicate content führen kann.
Das Pathauto Modul stellt zwar die schönen sprechenden und konfigurierbaren URL's zur Verfügung, aber leider sind auch alle anderen Möglichkeiten ein und dieselbe Seite zu erreichen noch gültig. So führten folgende URL Varianten alle auf diese Seite:
http://nsah.de/?q=node/17
http://nsah.de/?q=node/17/
http://nsah.de/node/17
http://nsah.de/node/17/
http://nsah.de/doublicate-content-drupal-vermeiden.htm
Dies Problem lässt sich mit dem Global Redirect Modul lösen. Es sorgt dafür, dass der Aufruf aller o.g. URL's per 301 Redirect immer auf die gleiche eine URL
http://nsah.de/duplicate-content-unter-drupal-vermeiden.htm
umgeleitet werden. So ist man vor der Duplicate content Falle geschützt.
Achtung 1: Vielleicht ist dies mittlerweile behoben, aber als ich das Modul installieren wollte, tauchte es erstaunlicherweise nicht in der Modulverwaltung auf. Ich fand einen Hinweis in den Supportanfragen zu dem Modul. Dort gibt es die wichtige und merkwürdigerweise im Modulordner fehlende Datei "globalredirect.info_.txt" herunterzuladen. Nachdem man diese in den Ordner des Moduls ablegt und in "globalredirect.info" umbenennt, steht einer Aktivierung des Moduls in der Modulverwaltung nichts mehr im Wege.
Achtung 2: Ich hatte bei der aktuellen Version 5.x-1.0 (am 28.03.2007) des Global Redirect Moduls Probleme mich nach dem Ausloggen wieder in Drupal einzuloggen. Ich landete nach Absenden der Anmeldedaten einfach wieder auf der Startseite (ohne irgendwelche Fehlermeldung) und war weiterhin ausgeloggt. Nach langem Suchen kam ich auf die Idee das Global Redirect Modul zu deaktivieren und sofort war das Einloggen kein Problem mehr. Ich habe es dann mit der Entwicklerversion 5.x-1.x-dev probiert und siehe da ... keine Probleme mit aktiviertem Global Redirect :). Netter Nebeneffekt das unter Achtung 1 beschriebene Probleme tritt mit der Entwicklerversion ebenfalls nicht auf!
Jetzt produziert Drupal nicht nur schöne sprechende URL's sondern alle Seiten sind jeweils nur unter einer einzigen individuellen URL zu finden.
(Foto: "mirror mirror on the wall" © Madzik @ Flickr)
Tagged as:
Drupal,
Duplicate content,
SEO,
Tipp
{ 1 comment… read it below or add one }
Danke für den Tipp! Global Redirect funktioniert inzwischen (natürlich) ohne Probleme.