Entwicklung und Test einer logfilebasierten Metrik zur Analyse von Website Entries
am Beispiel einer akademischen Universitäts-Website

vorgelegt von

Philipp Mayr

Volltext der Arbeit [download magister.pdf, 3.1mb, magister.zip, 1.5mb]
Abstract, ausgewählte Screenshots

Titelseite & Abstract [download titel.pdf, 14kb]

Inhaltsverzeichnis [download inhalt.pdf, 138kb]

Kapitel 1 - Einleitung [kap1.pdf, 10kb]
Kapitel 2 - Bezugsrahmen [kap2.pdf, 94kb]
Kapitel 3 - Untersuchung [kap3.pdf, 266kb]
Kapitel 4 - Methoden [kap4.pdf, 80kb]
Kapitel 5 - Ergebnisse [kap5.pdf, 706kb]
Kapitel 6 - Diskussion [kap6.pdf, 46kb]
Kapitel 7 - Zusammenfassung [kap7.pdf, 11kb]
Kapitel 8 - Ausblick [kap8.pdf, 10kb]
Kapitel 9 - Literatur [kap9.pdf, 32kb]
Kapitel 10 - Anhang [kap10.pdf, 87kb]

Handreichung 129
Berlin, den 10. Dezember 2003  

Magisterarbeit zur Erlangung des akademischen Grades Magister Artium M.A.

Philosophische Fakultät I der Humboldt-Universität zu Berlin, Institut für Bibliothekswissenschaft

1. Gutachter: Prof. Dr. Walther Umstätter 
2. Gutachter: PD. Dr. Roland Wagner-Döbler 



deutscher Abstract

Web Logfiles protokollieren Benutzertransaktionen auf Webservern und bieten aufgrund ihres Umfangs, ihrer Eigenschaften und Potenziale ein ausgezeichnetes Untersuchungsfeld für heutige Informations- und Onlineverhaltensstudien. Die empirische, explorative Untersuchung aus den Bereichen Web Mining, Webometrics und Logfileanalyse stellt neue Gesichtspunkte und Analysemöglichkeiten für Logdaten vor. Zu diesem Zweck entwickelt und testet die Arbeit ein quantitatives, nicht-reaktives Messverfahren (Logmetrik „Web Entry Faktoren“), das anhand von einfachen Web Logdaten, Aussagen über die Zugänglichkeit und Sichtbarkeit von hochfrequentierten Einstiegspunkten einer Website ermöglicht. Im Mittelpunkt stehen die drei unterscheidbaren Navigationsarten im Web „Navigation über Suchmaschinen“, „Navigation über Backlinks“ und „direkte Navigation“. Die Untersuchung integriert ein Klassifikationsschema für Webseiten sowie den prominenten externen Parameter PageRank der heute wichtigsten Suchmaschine Google. Untersuchungs-gegenstand sind Web Logfiles zweier kompletter Jahrgänge (2000 und 2002) des Webservers des Instituts für Bibliothekswissenschaft an der Humboldt-Universität zu Berlin (http://www.ib.hu-berlin.de/), sowie die 100 am häufigsten genutzten Einstiegsseiten dieser akademischen Universitäts-Website.

english abstract

Web log files record user transactions on web servers and offer due to their extent, their properties and potential an excellent investigation field for contemporary information and online behaviour studies. The empirical, explorative investigation from the fields Web Mining, Webometrics and Logfile Analysis introduces new aspects and analysis possibilities for web log data. The study develops and tests a quantitative, non-reactive measure method (log metric "Web Entry Factors"), that allows statements about the accessibility and visibility of highly frequented entry points of a web site. The three distinguishable web navigation types "navigation about search engines", "navigation about backlinks" and "direct navigation" are focused. The study integrates a classification scheme for web pages as well as the prominent external parameter PageRank from the today most important search engine Google. Investigation subject are Web log files of two complete age-groups (in 2000 and 2002) of the web server of the Institute for Library Science at the Humboldt University to Berlin (http://www.ib.hu-berlin.de/), as well as the 100 most frequently used entry pages of this academic university web site.

ausgewählte Screenshots

figure 1: Häufigkeit der Web Entries nach Position auf der Google Trefferlisten-Seite
figure 1: Häufigkeit der Web Entries nach Position auf der Google Trefferlisten-Seite
siehe Kapitel 5 (kap5.pdf, 706kb)

figure 2: Verteilung der Web Entries nach Navigationart (Suchmaschine, Direkt, Referenz)
figure 2: Verteilung der Web Entries nach Navigationart (Suchmaschine, Direkt, Referenz)
siehe Kapitel 5 (kap5.pdf, 706kb)

nach oben


figure 3: Verteilung der WEF Werte für die Top 100 Web pages
figure 3: Verteilung der WEF Werte für die Top 100 Web pages
siehe Kapitel 5 (kap5.pdf, 706kb)


figure 4: Entwicklung der Web Entries über die wichtigsten Suchmaschinen (2000 & 2002)
figure 4: Entwicklung der Web Entries über die wichtigsten Suchmaschinen (2000 & 2002)
siehe Kapitel 5 (kap5.pdf, 706kb)


 

nach oben


contact: Philipp Mayr, Home