Im Suchmaschinen-Labor des RRZN, Leibniz Universität Hannover, zu vergebende Diplom- oder Studienarbeit:

Analyse von Linkstrukturen in begrenzten Teilräumen des WWW

Die Strukturen der Verlinkung von Webservern- und Seiten sind auch in Teilräumen häufig unbekannt. Es ist jedoch zu vermuten, dass derartige Strukturen als wiederkehrende Muster existieren. Ihre Erkennung und Darstellung kann dann wertvolle Rückschlüsse auf Merkmale von Webservern- und Seiten erlauben, die mit anderen Methoden kaum möglich sind.

So werden sich thematisch zusammenhängende Bereiche auch in der Linkstruktur wiederfinden. Inhaltlich wenig relevante Seiten oder solche, die gezielt erstellt wurden, um Suchmaschinen zu täuschen, werden außerhalb Ihrer Community kaum verlinkt sein. Die typischen Crawlerfallen werden durch dedizierte Linkstrukturen sichtbar werden. Hieraus ergeben sich wertvolle Ansätze für die Steuerung und Auswertung von Suchmaschinen.

Voraussetzung zu einer aussagekräftigen Analyse ist die möglichst vollständige Erfassung eines Teilraumes. Daher soll sich die Arbeit zunächst auf den Bereich der Uni Hannover erstrecken, definiert durch den Domainraum uni-hannover.de Hieran anschließend soll die Untersuchung ausgeweitet werden, auf den geographisch definierten Bereich der Region Hannover. Da hier auch ein relevanter Anteil an kommerziell betriebenen Server vorhanden ist, werden damit auch kommerzielle Interessen in der Verlinkung eine Rolle spielen und in der Linkstruktur sichtbar werden. Abschließend sollen möglichst noch thematisch begrenzte Teilräume mit analysiert werden.

Zur Untersuchung der Linkstrukturen bieten sich Methoden der Graphentheorie an. Im Blickpunkt stehen dabei die Begriffe "Teilgraph" und "Ähnlichkeit von Graphen", mit deren Hilfe die Linkstrukturen in geeigneter Weise beschrieben werden sollen.

Die praktischen Arbeiten sollen auf der YaCy-Software aufsetzen. Die Ergebnisse der Arbeit sollen auch graphisch dargestellt werden.


Bei Interesse kontaktieren Sie bitte Dr. Wolfgang Sander-Beuermann per email: wsb@rrzn.uni-hannover.de.




Beispiel einer Linkstrukturanalyse um www.indymedia.org