Von Jakob Voß.
Letzte Änderung: 20.12.2005
Seit Ende 2003 existiert für das Maschinelle Austauschformat für Bibliotheken (MAB2), dass von deutschen Bibliothekssystemen für den Datenaustausch von Metadatensätzen verwendet wird, auch eine XML-Version namens MABxml. XML ist inzwischen die Grundlage einer Vielzahl von modernen Datenformaten. Die Vorteile liegen unter anderem in der Verwendung von Unicode, der Möglichkeit von validierbaren Dokumenttype mittels DTD und XML Schema sowie einer Vielzahl von Werkzeugen zur Verarbeitung von XML-Daten, zum Beispiel per XSLT. Mit MABxml bietet sich nun erstmals die Möglichkeit, vollständige Datensätze aus deutschen Bibliotheken verfügbar zu machen (zum Beispiel über das OAI-Protokoll) und weiter zu verwenden, ohne auf Spezialsoftware angewiesen zu sein.
In deutschen Bibliothekskatalogen lagern Millionen von aufwändig nach komplizierten Regelwerken wie den Regeln für die alphabetische Katalogisierung (RAK) erstellten Datensätze. Herkömmliche Suchmachinen und Kataloge (OPACs) können jedoch immer nur einen Teil davon wirklich nutzen. Durch eine Weitergabe der Katalogisate als MABxml können nicht nur andere Bibliotheken sondern auch Drittanbieter die Daten mit relativ einfachen Mitteln weiter verwenden und so aus der bereits erbrachten Katalogisierungsleistung einen Mehrwert für den Nutzer erbringen. Die Möglichkeiten sind vielfältig: Sie reichen von der einfachen Darstellung als HTML über automatisch erzeugte gedruckte Literaturverzeichnisse, die Übernahme in Suchmaschinen und privater Bibliografiesysteme bis hin zu visuellen Navigationsmöglichkeiten und vollverlinken Browsingstrukturen (um nur einige Beispiele zu nennen).*
Diese Seite richtet sich an Entwickler und Interessierte in Bibliotheken und verwandten Einrichtungen, die sich über die Möglichkeiten und Techniken von MABxml informieren wollen. Grundlegende von XML werden vorausgesetzt.
Für den MABxml Standard gibt es ein XML Schema. Da die Validierung gegen ein XML Schema nicht in allen XML-Werkzeugen möglich ist, sollte zumindest eine DTD verwendet werden, z.B. folgende: mabxml-1-informal.dtd. Die DTD weicht als etwas weicherer Standard nur in Kleinigkeiten vom XML Schema ab - alle gültigen MABxml-Dokumente sind auch gegen die DTD valide.
Für eine Verwendung von MAB-Daten ist natürlich eine Kenntnis der MAB-Felder notwendig. Die Liste der bekannten MAB-Felder wurde aus den bei der DDB verfügbaren Online-Kurzversionen der MAB-Formate mit einem PHP-Skript erzeugt. Die Liste wird für jedes MAB-Format in einer XML-Datei abgelegt. Die Struktur dieses Formates ist sehr einfach:
<!ELEMENT MABfelder (feld)+> <!ATTLIST MABfelder format (TITEL | PND | GKD | SWD | NOTAT | LOKAL | ADRESS | REDAKTION) #REQUIRED quelle CDATA #REQUIRED > <!ELEMENT feld (titel, indikator*, unterfeld*)> <!ATTLIST unterfeld nummer CDATA #REQUIRED> <!ELEMENT titel (#PCDATA)> <!ELEMENT indikator (#PCDATA)> <!ATTLIST indikator code CDATA #REQUIRED> <!ELEMENT unterfeld code CDATA #REQUIRED> <!ATTLIST unterfeld code CDATA #REQUIRED>
Ab besten schauen Sie sich bei Bedarf direkt die XML-Daten an. Für die Praxis ist jedoch eine Übersicht in HTML schöner. Diese wird per XSLT mit dem Skript MABxmlFields.xsl erzeugt. Sie können sich die Feldbelegung der einzelnen MAB-Formate direkt mit einem XSLT-fähigen Browser (z.B. Mozilla Firebird 0.8, Internet Explorer >5.5) anschauen (Die direkte, clientseitige Transformation der XML-Daten mit Mozialla ist z.Z. aufgrund einer Servereinstellung nicht möglich. Bitte laden sie alle Dateien auf ihren lokalen Rechner (s.u.) oder betrachten die XML-Daten und die HTML-Anzeige getrennt!).
Da in den Online-Kurzreferenzen der MAB-Formate einige Felder und Indikatoren bei sich wiederholenden Angaben ausgelassen wurden (beispielsweise für mehrere Körperschaften wie in den Feldern 200-202 bis Feld 296-298), sind diese Angaben in der XML-Feldliste bislang nicht oder nur als Kommentare enthalten.
Zur Anzeige und Validierung von MABxml-Datensätzen steht das XSLT-Skript MABxmlView.xsl zur Verfügung. MABxml-Daten werden damit übersichtlich dargestellt, wobei Fehler in der Struktur erkannt und die Bedeutung bekannter Felder mit eingeblendet wird. Falls sie einen XSLT-fähigen Browser besitzen, können sie ein Beispiel (mit einem korrekten und einem fehlerhaften Datensatz) direkt betrachten. Felder aus Segment Null werden bislang nicht erkannt!
Mab/XML Converter ist eine kleine GUI für die MABxml-Konvertierung mit den Java-Programmen Der Deutschen Bibliothek. Bislang ist das Programm lediglich im Beta-Statdium, steht aber schon zur Validierung und Transformation von MABxml nach MAB zur Verfügung.
Die auf dieser Seite verlinkten XSLT-Skripte können unter den Bedingungen der GNU General Public License oder der Creative Commons Attribution-ShareAlike License frei verbreitet und weiterverwendet werden. Da zu kann der gesamte Inhalt heruntergeladen werden. Für Richtigkeit und Vollständigkeit kann keine Garantie übernommen werden. Bei Rückfragen, Kommentaren, Hinweisen: mail an jakob {at} nichtich.de.

This work is licensed under a Creative Commons License.

This software is licensed under the CC-GNU GPL.
Anmerkung: Wie unter anderem der Experte in Fragen bibliothekarischer Datenformate, Bernhard Eversberg, bemerkte: Mit XML alleine "ändert sich an der Inkompatibilität der Formate überhaupt nichts". Wohl aber wird mit dem Umstieg auf XML eine der Ursachen dafür bekämpft, indem im Gegensatz zu szene-internen Wildwüchsen auf verbreitete Standards wie Unicode, XML und XML Schema gesetzt wird, für die es eine Vielzahl freier Werkzeuge gibt. So sinkt zum Einen der Aufwand von Eigenentwicklungen und zum Anderen können auch Nicht-Bibliothekare leichter etwas mit den Daten anfangen. Dass diese Daten oft gar nicht erst den Weg aus den Bibliotheken schaffen, ist der zweite Grund. Die Öffnung der Kataloge für die automatische Datenverabeitung Dritter (natürlich verbunden mit einer entsprechenden Open-Content Lizensierung) ist jedoch die konsequente Folgerung aus der Entscheidung, die Benutzer selbst an die Kataloge zu lassen.