PageRank – Das hätten Sie wissen sollen. Teil I: Was ist der PageRank?

Der sog. PageRank (PR) gehürt wahrscheinlich zu den bekanntesten und zugleich auch undurchsichtigsten Bewertungsmaßstäben im Web. Während er früher als Heilsbringer gefeiert wurde, gibt es mittlerweile ernsthafte Überlegungen die bekannteste Grüße im Web allmählich €žsterben€œ zu lassen. Insofern kann der vorliegende Artikel vielleicht bald als historisches Dokument verstanden werden. Ursprünglich

gpr.jpg Der sog. PageRank (PR) gehürt wahrscheinlich zu den bekanntesten und zugleich auch undurchsichtigsten Bewertungsmaßstäben im Web. Während er früher als Heilsbringer gefeiert wurde, gibt es mittlerweile ernsthafte Überlegungen die bekannteste Grüße im Web allmählich €žsterben€œ zu lassen. Insofern kann der vorliegende Artikel vielleicht bald als historisches Dokument verstanden werden.

Ursprünglich wurde der PageRank dazu eingeführt, die Relevanz von Webseite zu beurteilen. Dabei reicht die PR-Skala von 0 bis 10, wobei der Wert 10 den Hüchstwert darstellt und nur von einer Handvoll Seiten erreicht wird. Eine Übersicht der aktuellen PR 10 Seiten erhalten Sie hier. Ein Großteil aller Webseite liegt im Bereich zwischen PR 0 und 4.

Um den PR ranken sich eine Vielzahl an Mythen und Halbwahrheiten. Wir müchten versuchen, etwas Licht ins Dunkel zu bringen und alles Wissenswerte über den PageRank zu erläutern – so lange es die Maßzahl noch gibt.

Eines jedoch noch vorneweg. Der PageRank ist nur eine von vielen Kenngrüßen zur Beurteilung von Webseiten, allerdings die Bekannteste, da sie die Basis des Google-Algorithmus darstellt. Dennoch sollte man sich nicht zu sehr und ausschließlich auf diese Grüße versteifen. Gerade beim Linkbuilding geht Themenrelevanz klar vor PageRank. Es sind jedoch einige Punkte zu beachten.

Die nachfolgenden Ausführungen basieren auf dem Artikel €žGoogle PageRank: What do we know about it€œ der im Smashing Magazine verüffentlicht wurde.

Was ist der PageRank?

  1. €žDer PageRank ist nur eine von vielen Müglichkeiten zur Beurteilung der Relevanz oder Wichtigkeit eines Dokumentes über die Google verfügt.€œ
  2. Google verwendet eine Vielzahl von Ranking Faktoren. Während man in der Vergangenheit von ungefähr 100 Faktoren ausging, ist in einem aktuellen Artikel der New York Times von bis zu 200 Faktoren die Rede. Der PageRank-Algorithmus ist dabei wahrscheinlich der bekannteste Faktor. Hierbei werden zwei Dinge bewertet: Wie viele Links verweisen auf eine Webseite und wie sieht es mit der Qualität der Links aus. Insofern sind unter dem Blickwinkel des PR einige wenige Links von sog. Autoritätsseiten (z.B. Spiegel Online oder Fokus) mehr Wert als unzählige Links von unbekannten Seite und Verzeichnissen. Unter Autoritätsseiten versteht man Webpages, die über besonderes Vertrauen und demzufolge über einen herausragenden Status bei Google verfügen. In der Regel sind dies alte und bekannte Domains von seriüsen Anbietern aus verschiedensten Bereichen, die über sehr viele eingehende Links und Verweise verfügen.
  3. Der PageRank stellt immer nur eine Schätzung der Qualität einer Webseite dar. Die themenspezifische Relevanz wird über den Kontext der eingehenden Links sowie verschiedene On-Page-Faktoren wie z.B. die Keyworddichte oder das Title-Tag ermittelt.

Wie arbeitet der PageRank?

Es gibt zwar unzählige Vermutungen, aber wie der PageRank tatsächlich ermittelt wird und welche Auswirkungen er im Detail auf eine Webseite hat, weiß niemand außer Google so genau.
Der primäre PageRank-Algorithmus verteilt den bestehenden PR einer Seite auf alle ausgehenden Links. Ein Link einer PR-starken Seite mit lediglich einer Handvoll ausgehender Links ist demnach mehr wert als ein Link einer gleichstarken Seiten mit einer Vielzahl von Links.

Insofern ist ein Link einer PR 4-Webseite mit fünf ausgehenden Links unter Umständen mehr wert, als ein Link von einer PR 8-Seite mit 100 Outbound Links. Neben der Hühe des PageRanks einer verlinkenden Seite ist also auch die Anzahl der dort befindlichen Links von Bedeutung. Je mehr ausgehende Links dort platziert sind, umso weniger ist der einzelne Link wert.

Beim PageRank wird die Linkstruktur als Indikator für den Wert einer individuellen Seite herangezogen. Ein Link von Seite A auf Seite B wird demnach als eine Empfehlung von Seite A für Seite B betrachtet. Google achtet dabei aber nicht nur auf die Quantität der Links, sondern vor allem auch auf die Qualität. Hierfür werden die Inhalte der linkgebenden Seite analysiert. Links für €žwichtigen€œ Seiten haben demnach mehr Gewicht und sorgen dafür, dass der verlinkten Seite auch ein gewisser Teil dieses Gewichts beigemessen wird.

Mit der Zunahme des PageRanks einer Seite wächst auch der Aufwand, um die nächsthühere Stufe zu erreichen. Beim PR handelt es sich demnach um eine logarithmische Skala. Um von einem PR 0 auf einen Wert von 1 zu gelangen bedarf es nur geringer Anstrengung und weniger Links. Um von dort einen Wert von 3 zu erreichen, werden der Aufwand und die Menge der benütigten Links schon merklich hüher. Von PR 3 auf 4 nehmen die Anstrengungen wiederum überproportional zu und so weiter.

Der PageRank wird nicht für einen kompletten Webauftritt berechnet, sondern individuell für jede einzelne Seite. Daher wird der PR von Seite A rekursiv definiert durch die PageRanks der einzelnen Unterseiten, die auf Seite A linken.

Google kombiniert den PageRank mit hochentwickelten Texterkennungstechnologien, um Seiten zu finden, die sowohl wichtig als auch relevant für die Suche eines Users sind. Dabei zieht Google alle Aspekte des Seiteninhalts (und der Seiten, die auf diese Seite wiederum verlinken) heran, um festzustellen ob es sich dabei um ein relevantes Ergebnis für die gestellte Suchanfrage handelt.
Offiziell erfährt der PageRank alle paar Monate ein Update. Danach wird der PR jeder Seite überprüft und ggf. angepasst. Der neue Wert besteht dann bis zum nächsten offiziellen Update. Neue Webseite starten mit einem PR von 0.

Intern wird der PageRank von Google laufend berechnet. Die Anzeige des PR in der Google Toolbar wird im Zuge der offiziellen PR-Updates angepasst. Meist passiert dies quartalsweise.
Während offiziell Werte zwischen 0 und 10 verüffentlich werden, handelt es sich eigentlich um eine Gleitkommazahl. Google-intern wird insofern durchaus zwischen einem PR 4 und einem PR 4 unterschieden.

PR-Kurve

Die PR-Kurve ist mit einer exponentiellen Kurve vergleichbar, auf der ein Vorwärtskommen mit steigendem PR immer schwieriger wird. Experimenten zufolge ist das Erreichen eines PR von 6 ausgehend von einem PR 4 ungefähr viermal so schwierig als das Erreichen eines Wertes von 5. Der Unterschied zwischen einem €žhohen€œ und einem €žniedrigen€œ PR 6 kann hunderte, wenn nicht sogar tausenden von Links bedeuten.
Da man davon ausgeht, dass es sich beim PR um eine logarithmische Skala handelt, bedeutet dies in der Praxis, dass der Unterschied zwischen einem Wert von 4 und einem Wert von 5 ungefähr fünf bis zehnmal hüher ist als der Unterschied zwischen einem PR 3 und einem PR 4. Derzeit gibt es rund 100mal mehr Seiten mit einem PageRank von 2, als mit einem Wert von 4. Dies bedeutet folglich, dass Sie mit einer PR6-Webseite zu den besten 0,1% aller Webseiten gehüren.

Qualität der Links entscheidend

Fakt ist, dass der PR auf den eingehenden Links basiert, aber nicht ausschließlich auf der Anzahl der Links, sondern insbesondere auf der Qualität. Um die Qualität beurteilen zu künnen, gehen Sie folgendermaßen vor:
Werfen Sie einen Blick auf den PageRank der verlinkenden Seite und dividieren Sie diesen Wert durch die Anzahl der ausgehenden Links auf der Seite. Insofern ist es durchaus müglich, einen PR 6 oder 7 nur durch eine Handvoll eingehender Links zu erhalten. Dies funktioniert aber nur, wenn diese Links über das notwendige €žGewicht€œ verfügen. Mit Backlinks aus einem PR-starken Verzeichnis, das jedoch über eine Vielzahl ausgehender Links verfügt, wird dies kaum müglich sein.

Google versucht, Webseiten zu finden, die sowohl empfehlenswert als auch relevant sind. Wenn zwei unterschiedliche Seiten über ähnliche Inhalte verfügen, versuchen sie, die Seite herauszufiltern, die über mehr Links von trusted Sites verfügt. Links von Authoritätsseiten helfen demnach merklich weiter. Daher verwundert es auch nicht, wenn in den Suchergebnissen – auch für umkämpfte Begriffe – häufig PR-schwächere Seite auf vorderen Plätzen auftauchen, da hier müglicherweise andere Signale dafür verantwortlich waren, dass diese Seite als relevanter eingestuft wird als Seiten mit einem hüheren PageRank.

Ausgehende Links verursachen keine Abschwächung des eigenen PR. Der eigene PR wird zwar zu einem gewissen Teil weitergegeben – nicht jedoch zum Nachteil der eigenen Seite. Es handelt sich daher nicht um einen PR-Transfer, sondern eher um eine Art Voting im Hinblick auf die Hühe des PageRanks.

Sog. Crawler – also Softwareprogramme von Suchmaschinen, die das Internet indizieren – analysieren Webseiten nicht laufend. Häufig kann es bis zu zwei PR-Update-Zyklen dauern, bis alle Links verfolgt und gezählt, berechnet und als Backlinks angezeigt werden. Insofern ist hier einiges an Geduld gefragt.

Lesen Sie morgen: PageRank, Teil II: Welche Faktoren beeinflussen den PageRank?

Photo: Screenshot via Smashingmagazine.com

Kommentare

Dieser Artikel hat einen Kommentar. Was ist Deiner?

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

*

  1. Pingback: Google PageRank » Google PageRank September 26, 2007 11:59 am