Institut für Bibliotheks- und Informationswissenschaft

Humboldt-Uni zu Berlin

Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft. 183

Möglichkeiten und Grenzen maschineller Indexierung in der Sacherschließung

Strategien für das Bibliothekssystem der Freien Universität Berlin

von Jens Mittelbach und Michaela Probst

Mittelbach, Jens ; Probst, Michaela:
Möglichkeiten und Grenzen maschineller Indexierung in der Sacherschließung : Strategien für das Bibliothekssystem der Freien Universität Berlin / von Jens Mittelbach und Michaela Probst. - Berlin : Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin, 2006. - 88 S. - (Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft ; 183)
ISSN 1438-7662

PDF-Dokument (716 KB)

Abstract

Automatische Indexierung wird zunehmend als sinnvolle Möglichkeit erkannt, Daten für Informationsretrievalsysteme zu erzeugen und somit die Auffindbarkeit von Dokumenten zu erhöhen. Die dafür geeigneten Methoden sind seit geraumer Zeit bekannt und umfassen statistische bzw. computerlinguistische Sprachanalysetechniken, die im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vorteile hinsichtlich des Retrievals bieten. So bilden erst die Wortformenreduzierung und die semantische Zerlegung sowie die Gewichtung der ermittelten Indexterme die Grundlagen für die gezielte sachliche Suche im Online-Katalog. Entsprechende Verfahren, die sich für Bibliotheken eignen, stehen seit Mitte der neunziger Jahre auch für den praktischen Einsatz bereit und werden - nicht zuletzt aufgrund steigender Akzeptanz - ständig weiterentwickelt. Dabei geht es nicht nur um die Steigerung der allgemeinen Leistungsfähigkeit von maschinellen Indexierungssystemen, sondern auch um ihre Fähigkeit, die im Bibliothekswesen verfügbare, sehr heterogene Datengrundlage optimal zu nutzen. Wichtige Kriterien sind zudem eine vertretbare Fehlerquote, die Integrierbarkeit in die Geschäftsgänge und die Darstellbarkeit der anfallenden Datenmengen in entsprechenden Datenrepräsentationsmodellen. Im Fokus der Untersuchung stehen die allgemeine Betrachtung der Vor- und Nachteile der beiden gängigen Indexierungssysteme MILOS und intelligentCAPTURE sowie die Möglichkeiten und Grenzen ihres Einsatzes im Bibliothekssystem der Freien Universität Berlin.

Diese Veröffentlichung geht zurück auf eine Master-Arbeit im postgradualen Fernstudiengang Master of Arts (Library and Information Science) an der Humboldt-Universität zu Berlin.