PageRank Algorithmus

Was ist eigentlich PageRank?

PageRank ist ein Bewertungs-Verfahren für die Webinhalte (Internetseiten/Dokumente/Bilder/Audiodateien/Links/etc.) und basiert auf einem Algorithmus, der für alle online verfügbaren Elemente berechnet und festgelegt wird. Die Berechnungsmethode ist kompliziert und von vielen Faktoren abhängig. Prinzipiell könnte man aber behaupten, dass PageRank aus

  • Gewichtung der einzelnen Elemente
  • Verlinkungs-Faktor auf andere Seiten
  • Verlinkungs-Faktor von anderen Seiten
  • Gesamtanzahl der zur verlinkenden Seiten
  • Dämpfungs-Faktor

gebildet wird.

Definition des PageRank-Algorithmus als rekursive Formel:

Definition des PageRank-Algorithmus als rekursive Formel

PRi - PageRank eigener Seite
PRj - PageRank der verlinkenden Seite
d - ein Dämpfungsfaktor (zwischen 0 und 1)
n - Anzahl der eigenen Seiten
c - Anzahl der verlinkenden Seiten

Die Grundprinzipien

  • Je mehr Links auf eine Seite verweisen, umso höher ist das Gewicht dieser Seite.
  • Je höher das Gewicht der verweisenden Seiten, desto größer ist der Effekt.

 

Das Ziel des Verfahrens

Die Links dem Gewicht entsprechend zu sortieren, um so eine Ergebnisreihenfolge bei einer Suchabfrage herzustellen und so die Links zu wichtigeren Seiten weiter vorne in der Ergebnisliste anzuzeigen.

 

Und wer hat's erfunden?

Nein, nicht die Schweizer... Lawrence "Larry" Edward Page (*26.03.1973) und Sergei Michailowitsch Brin (*21.08.1973) entwickelten den Algorithmus an der Stanford University und patentierten ihn am 10. Januar 1997 (US6285999 (B1) - Method for node ranking in a linked database). Als Erfinder wurde lediglich der Lawrence Page eingetragen - daher auch die spätere Abkürzung: Page-Rank (Ranking nach Page [Larry]).

Das Verfahren diente kurzer Zeit später als Ausgangspunkt für die Anzeige der Suchergebnisse in der von Page und Brin gegründeten Internet-Suchmaschine Google. Übereinstimmende Statistiken zeigen bei weltweiten Suchanfragen Google als Marktführer unter den Internet-Suchmaschinen...

 

Weiterentwicklung

2010 hat Google ein neues Patent eingereicht: das "Rational Surfer Modell". Es stellt eine Weiterentwicklung des Zufallssurfermodells (PR-Verfahren) dar.

Hierbei wird die Wichtigkeit eines Links je nach Platzierung nach empirischen Daten unterschieden. Ziel ist es, Links stärker zu gewichten, welche von einem rationalen Surfer mit höherer Wahrscheinlichkeit geklickt werden. Somit soll Linkkauf entgegengewirkt werden.

Der heute von Google verwendete Algorithmus hat vermutlich nicht mehr exakt diese Form, geht aber auf diese Formel zurück.