Apr 05
5.thumbnail Webseitenstruktur und Paginierung für SEO

Über Nikolas Schmidt-Voigt

Nikolas Schmidt-Voigt setzt den technischen Kawumba-Effekt in der Suchmaschinen-Optimierung um und geht dabei immer einer Frage nach: "Wie holen wir aus unseren Online-Shops noch mehr SEO raus?"

neigh graph klein Webseitenstruktur und Paginierung für SEOPaginierungen stellen für die Struktur vieler Webseiten ein Problem dar, das häufig unterschätzt wird. In der Regel begnügen sich Webmaster damit, Duplicate-Content auf Folgeseiten zu vermeiden (wie man das macht, habe ich in einem früheren Artikel beschrieben). Sie übersehen aber die massiven Strukturprobleme, die jede Paginierung mitbringen kann und die Googles Crawler unnötig ausbremsen.

Die Probleme, die durch Paginierungen auftreten können, lassen sich leicht an einem Beispiel verdeutlichen:

Stellen wir uns vor, ein Blog besteht seit fünf Jahren. In jeder Woche wurden zwei Artikel veröffentlicht. Dann befinden sich mittlerweile 520 Artikel in dem Blog. Wenn auf jeder Übersichtsseite 5 Artikel angeteasert werden, besteht die Paginierung mittlerweile aus 104 Folgeseiten. Per Default verlinkt WordPress immer nur auf die nächste und auf die vorige Seite. Solange diese Standardeinstellung nicht angepasst wurde, finden Crawler die ältesten Artikel erst auf der 104. Ebene dieser Webseite! So tief crawlt Google selbst Webseiten, die extern bestens verlinkt sind, nur selten.

Die übliche Empfehlung lautet, eine größere Anzahl von Folgeseiten zu verlinken. Das kann man aber auf mehrere unterschiedliche Arten tun, und für welche man sich entscheidet, hat starken Einfluss auf die Struktur der Webseite. Ich möchte deshalb drei geläufige Arten vorstellen und sie in Hinblick auf die Tiefe der Verlinkungen und die Verteilung des Page-Ranks innerhalb der Liste vergleichen.

Bessere Paginierungsmethoden

Für den Vergleich der verschiedenen Paginierungsmethoden, habe ich mich an folgende Rahmenbedingungen gehalten:

  • Jede Seite verlinkt immer die erste Seite der Liste, die letzte Seite, sich selbst, ihren direkten Vorgänger und ihren direkten Nachfolger.
  • Die Liste besteht insgesamt aus 100 Folgeseiten.
  • Auf jeder Seite werden Links zu insgesamt 12 der 100 Seiten  angezeigt.

Zusätzlich zu den genannten Seiten werden in den Paginierungen noch weitere Seiten verlinkt. Für die Auswahl dieser Seiten habe ich drei verschiedene Methoden verglichen:

  • Verlinkung der direkten Nachbarn: Ich verlinke auf jeder Seite so viele direkte Vorgänger und Nachfolger, bis die Anzahl von insgesamt 12 Links erreicht ist. Dabei versuche ich – soweit möglich – dieselbe Anzahl an Vorgängern und Nachfolgern zu verlinken. Auf der zwölften Seite führt dies beispielsweise zur Verlinkung dieser Folgeseiten:
    1, … 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, … 100
  • Verlinkung in gleich großen Schritten: Bei der Verlinkung in gleich großen Schritten verteile ich die Links in jeweils gleichem Abstand über sämtliche Seiten der Liste. Die 29. Seite verlinkt dadurch auf diese Seiten:
    1, … 13, … 26, … 28, 29, 30, … 38, … 51, … 63, … 75, … 88, … 100
  • Verlinkung in logarithmischen Schritten: Die Verlinkung in logarithmischen Schritten bedeutet, dass ausgehend von der aktuellen Seite weitere Seiten im Abstand von x^0, x^1, x^2, … x^n verlinkt werden. Die Anzahl der Links in der ersten und der zweiten Hälfte der Liste wähle ich so, dass das x vor und nach der aktuellen Seite möglichst dieselbe Größe hat. In der logarithmischen Paginierung verlinkt die 43. Seite beispielsweise auf diese Seiten:
    1, … 27, … 37, … 40, … 42, 43, 44, 45, … 48, … 54, … 68, … 100

Vergleich der Paginierungsmethoden

Nachdem ich für jede Methode die Links von allen Folgeseiten der Liste erzeugt hatte, habe ich zuerst berechnet, wie viele der Seiten jeweils durch wie viele  Klicks von der Startseite entfernt sind. In dem oberen der beiden folgenden Diagramme findet ihr die absolute Anzahl von Seiten pro Klickebene, im Unteren die Anzahl der Seiten, die jeweils weiter als eine bestimmte Menge von Klicks von der Startseite entfernt sind (zum Vergrößern auf das Bild klicken):

distanz vergleich verschiedener paginierungen 254x300 Webseitenstruktur und Paginierung für SEO

Die  Diagramme offenbare deutliche Unterschiede zwischen den verschiedenen Paginierungsmethoden: Bei der logarithmischen Paginierung liegt die Hälfte aller Seiten auf der zweiten Ebene und keine liegt tiefer als in der dritten Ebene. In der Paginierung mit Verlinkung der direkten Nachbarn liegt dagegen eine einzelne Seite sogar erst auf der 11. Ebene, während sich die anderen Seiten relativ gleichmäßig auf die anderen Ebenen aufteilen. Die Verlinkung in gleich großen Schritten ist zwar immer noch besser als die der direkten Nachbarn, reicht aber nicht an die Effizienz der logarithmischen Paginierung ran.

Die folgenden drei Diagrammen zeigen die Verteilung des Page-Ranks über die verschiedenen Folgeseiten (klicken zum Vergrößern):

page rank verteilung paginierung 245x300 Webseitenstruktur und Paginierung für SEO

Wieder sieht man, wie effizient die logarithmische Paginierung ist: Bis auf die erste und letzte Seite (die beide von jeder einzelnen Seite aus verlinkt sind) bekommen alle Seiten der Liste etwa dieselbe Menge Page-Rank ab.

Auffällig ist jetzt aber, wie schlecht die Paginierung in gleich großen Schritten gegenüber den anderen beiden Paginierungen abschneidet. Neben der ersten und der letzten Seiten haben auch noch sieben weitere Seiten einen äußerst hohen Page-Rank, während ein Großteil der Seiten einen sehr schlechten Page-Rank hat. Damit schafft es die Paginierung in gleich großen Schritten noch schlechter als die Verlinkung der direkten Nachbarn, den Page-Rank gleichmäßig über alle Seiten zu verteilen.

Zum Abschluss noch etwas Eye-Candy: Die folgenden beiden Diagramme (klicken zum Vergrößern), die in Gephi erstellt wurden, zeigen die Verlinkungen einmal in einer Paginierung mit Verlinkung der direkten Nachbarn und einmal in logarithmischer Paginierung.

neigh graph 300x300 Webseitenstruktur und Paginierung für SEO

Die vielen reziproken Verlinkungen benachbarter Seiten sind auf dem ersten Bild deutlich in dem “Kranz” zu erkennen, der sich um die erste und letzte Seite windet. Auf dem zweiten Bild, das die logarithmische Paginierung zeigt, führen die vielen Querverbindungen dagegen zu einer komplexen, eng geschnürten Struktur:

log graph 300x300 Webseitenstruktur und Paginierung für SEO

Wer die Daten aus den Paginierungen selbst in Gephi auswerten möchte, kann sich hier ein Zip-Archiv mit drei CSV-Dateien herunterladen. Jede Datei enthält alle Nodes und Edges für jeweils eine Paginierungsmethode und lässt sich direkt in Gephi importieren:

Zip-File mit Verlinkungsdaten herunterladen

Die Daten lassen natürlich noch eine ganze Reihe weiterer Auswertungen zu. Die Auswertung nach Page-Rank und Verlinkungstiefe, die ich in diesem Artikel betrachtet habe, zeigen aber schon deutlich, welchen Einfluss verschiedene Paginierungsweisen auf die Webseitenstruktur haben können.