Zurück zur Eingangsseite
LIBREAS Audio.

Prof. Felix Sasaki, Fachhochschule Potsdam, Lehrgebiet Metadaten und Standards und Deutsch-Österreichisches Büro des W3C
LIBREAS PODCAST # 13

Download - mp3  (26,3 mb)
Download Podcast (mp3/26,3mb) (ogg/55,8mb)
Spieldauer/Running Time: 45min 55sec

Interview mit Prof. Felix Sasaki

Prof. Felix Sasaki hat im März 2009 an der Fachhochschule Potsdam eine Professur im Fachbereich Informationswissenschaften angetreten. Zuvor hat er in Japan für das World Wide Web Consortium im Bereich Internationalisierung gearbeitet. Im Rahmen seiner jetzigen Professur beschäftigt er sich mit den Themen Metadaten und Standardisierung. Unter anderem sprechen wir in unserem Podcast über die Arbeit des W3C bei der Erstellung und Pflege von Webstandards, über die Ziele Prof. Sasakis in seiner Lehre und Forschung. Wir diskutieren aber auch die Entwicklungen im Bereich der informationsbasierten Berufsbilder, die Entwicklung des Semantic Web und von Suchmaschinen.

 

Transkription zum Interview

LIBREAS PODCAST #13
Interview mit Prof. Felix Sasaki
Karsten Schuldt (Interview, Transliteration)
Sprache/Language: Deutsch
Spieldauer/Running Time: 45 min 55 sec
Datei/File: mp3/26,3mb // ogg/55,8mb
Bitrate: mp3/80 kBit/s // ogg/160 kBit/s
Aufnahmedatum/Recorded: 16. Juni 2009
Veröffentlicht/Published: 10. Juli 2009
Über: W3C, Webstandards, Berufsbild, Semantic Web, Fachhochschule Potsdam


[00:11]
LIBREAS: Guten Tag. Mein Name ist Karsten Schuldt und ich begrüße Sie zu dieser Ausgabe des LIBREAS-Podcast. Ich spreche heute mit Prof. Felix Sasaki, der seit März 2009 an der Fachhochschule Potsdam im Fachbereich Informationswissenschaften lehrt. Prof. Sasaki arbeitete zuvor beim World Wide Web Consortium (W3C) und bringt aus dieser Arbeit weitreichende Erfahrungen zum Bereich Standards und Internationalisierungen mit. In unserem Podcast stellt er noch einmal die Arbeit dieses Gremiums dar. Zudem skizziert er seine zukünftige Lehre und Forschung. Zu Beginn dieses Interviews stellt sich Prof. Sasaki selbst vor.

[00:51]
Prof. Sasaki: Ich habe einmal technische und einmal philologische Bereiche studiert. Ich habe angefangen mit einem Studium der Japanologie und der Germanistik in Berlin. Habe das dann 1999 abgeschlossen, bin dann nach Bielefeld und habe im Bereich Computerliguistik promoviert. Und habe mich dann mehr und mehr in der Promotion mit Webtechnologie beschäftigt und der Nutzung von Webtechnologie für multiliguale Daten, zum Beispiel japanische und deutsche Sprachdaten. Und bin dann nach der Promotion mit diesem Schwerpunkt Multilingualität und Webtechnologie zum W3C nach Japan gekommen, in einen Bereich der sich Internationalisierung nennt. Also wo es darum geht, dass Web möglichst vielen Sprach- und Kulturräumen zugänglich zu machen. Was diese beiden Bereiche - mein sprachenorientiertes, philologisches Studium und diesen technischen Bereich - gut verbunden hat. Und da habe ich dann vier Jahre gearbeitet und dann hat sich die Möglichkeit ergeben, jetzt in Potsdam im Bereich Informationswissenschaften eine Professur aufzunehmen zum Thema Metadaten und Standards, mit dem Schwerpunkt inhaltliche Erschließung. Das habe ich jetzt seit März gemacht und bin jetzt in Potdam.

Das W3C

[02:20]
LIBREAS: Okay, was mich interessiert, ist vor allem das W3C. Dass ist ja tatsächlich auch das Spannende, dass sie von da in die Informationswissenschaft gekommen sind. Können Sie erst kurz umreißen, was das W3C macht, was die Aufgabe ist?

[02:32]
Prof. Sasaki: Ja. Vielleicht fange ich mit einem kurzen geschichtlichen Hintergrund an. Vielleicht sagt Ihnen der Browser-War noch etwas? Der Krieg zwischen Internet-Explorer und Netscape, der dazu führte, dass sehr viele Webinhalte - HTML-Seiten zu der Zeit zumeist - nur in einem Browser funktionierten, aber nicht in dem anderen. Und irgendwann hat man sich zusammen gesetzt und festgestellt, das geht nicht weiter, man muss das standardisieren. Und die Standardisierung wurde erst in einer Organisation, der ITF, der Internet Engineering Task Force, angefangen. Aber es stellte sich mehr und mehr heraus, dass das Web doch ein eigener Bereich ist, der abgegrenzt ist vom Internet. Internet als die Ebene, in der Daten ausgetauscht werden, aber wo es noch keinen Zugang direkt zum Benutzer gibt; das Web aber die Ebene, wo über den Browser direkt Menschen miteinander kommunizieren, Dokumente erzeugen.

Und zu der Zeit, genau als dieser Browser-War am kriegen war, hat der "Erfinder des Web", Tim Berners-Lee, diese Organisation W3C geschaffen, die diese Standardisierung - mit dem Browser-War als ein Beispiel, wo das nötig ist - voran treiben sollte, damit das Web nachhaltig allen zur Verfügung steht. Mit dem Browser-War als Anlass kam dann HTML ins W3C, was auch jetzt noch ein wichtiger Standard ist. Später kam XML hinzu, als DER Standard inzwischen für Datenrepräsentation, -austausch, -verarbeitung im Web, aber auch außerhalb des Web. Und inzwischen sind Bereiche dabei, wie Semantic Web, wo auf neuerem Weg als bisher der Zugang zu Ressourcen ermöglicht werden soll.

Es geht darum, wie an dem Beispiel Browser-War gezeigt, da, wo aufgrund fehlender Standards es proprietäre Lösungen gibt, Fragmentierung zwischen Communities, Nutzercommunities, Entwicklercommunities - da Standards zu schaffen, die den Austausch, den weltweiten Austausch, communityübergreifenden Austausch erleichtern. Das ist das Hauptziel vom W3C. Man kann sagen, ein Web für alle und alle können dann rein, über Kulturgrenzen hinweg, über Barrieregrenzen hinweg - Barrierefreiheit ist ein wichtiges Thema - und eben über Communitygrenzen hinweg. Da werden wir sicherlich heute noch drüber sprechen.

[05:05]
LIBREAS: Das Problem ist ja, dass auch im Bibliotheksbereich immer wieder darüber diskutiert wird, welche Standards man benutzen soll und das auch bibliothekarische Standards definiert wurden mit MARC und MAB und mit der Schnittstelle Z39.50, die Erfahrung aber ist, dass sich auch immer nicht alle dran halten. Hat es den... ich meine, Netscape ist tot, dafür gibt es Firefox, andere Browser wie Opera haben ja überlebt - hat sich den die Arbeit des W3C bisher positiv durchgesetzt oder ist das so ein Nerdthema?

[05:32]
Prof. Sasaki: Ich denke, es ist ein Thema, dass sich durchgesetzt hat. Zum einen so, wie die Größenbeschreibung von Schrauben sich durchgesetzt hat oder die Standardisierung von Papiergrößen. Jeder benutzt A4 ohne jetzt daran zu denken, woher das kommt. Und jeder benutzt heute, wenn Sie Ihren Tank füllen, wenn Sie Ihr Internetbanking machen und so weiter; jeder benutzt dabei XML, ohne das sie sich dem eigentlich bewusst sind. Also: ohne das man es sich bewusst ist. Ich denke, da haben sich jetzt viele Standards durchgesetzt. Und wenn wir heute Internetapplikationen wie Google Kalender oder anderes benutzen, profitieren wir auch von Standards, die sich durchgesetzt haben, ohne jetzt unmittelbar die zu benutzen.

Eine andere Frage sind diejenigen, die jetzt nicht auf der unmittelbaren Nutzerebene sind, sondern die auf einer Ebene sind - Sie haben gerade bibliothekarische Protokolle erwähnt -, selber Standards zu schaffen, für die es dann vielleicht wieder andere Nutzer gibt. Und da ist dann immer die spannende Frage, wie communityspezifisch sollen die Standards sein? Und da ist die Tendenz vom W3C eher dazu, Standards für eine technische Infrastruktur zu machen, die communityunspezifisch ist und dann Communities dazu anzuregen, dass zu nutzen und, wenn möglich, keine eigene technische Infrastruktur parallel dazu zu entwickeln. Und gerade hinsichtlich der Bibliothekscommunity, die haben Z39.50 entwickelt, da gibt es auch Parallelentwicklungen. Und eine Hoffnung von mir, ein Grund auch, warum ich hier bin - hier im Sinne von Potsdam oder in der Bibliothekscommunity in Deutschland -, ist zu versuchen, dieser Fragementierung entgegen zu wirken. Also in der technischen Infrastruktur dafür zu werben, auf eine Infrastruktur zu setzen.

[07:25]
LIBREAS: Wie kommuniziert das W3C mit den Communities? Also tatsächlich so über Einzelpersonen? Oder können Communities sich in die Arbeit des W3C einbringen?

[07:34]
Prof. Sasaki: Vielleicht kann ich kurz was zum Aufbau vom W3C sagen. Das W3C besteht im kleinsten Kern erstmal aus einem Staff, der die Arbeit koordiniert, die Standardisierungsarbeit, dass sind 50-60 Leute über die Welt verteilt. Dann gibt es Mitgliedsorganisationen, die machen eigentlich die Hauptarbeit, indem sie Mitarbeiter entsenden in Arbeitsgruppen. Das sind mehrere hundert Leute dann, wenn man sich die Gesamtheit anschaut. In manchen Arbeitsgruppen nur zehn, in manchen 20-30 und noch mehr, die an den Standards arbeiten. Und dann gibt es, last but keinesfalls least, gibt es die Öffentlichkeit, die auch bei der Entwicklung von Standards mitarbeiten kann.

Sehr wichtig beim W3C ist ein Prozess, der den Mitgliedern ein großes Vorrecht gibt, grundlegende Richtungen vorzuschlagen. Nehmen wir ein Beispiel aus dem Bereich, der für Bibliotheken relevant ist: das Format SKOS, was zur Repräsentation von Thesauri oder Klassifikationen verwendet werden kann. Das ist maßgeblich beeinflusst, überhaupt die Entscheidung so ein Format zu entwickeln, ist maßgeblich beeinflusst von der Library of Congress, die W3C.Mitglied ist und die in diese Richtung richtungsweisend beigetragen hat. Bei der Entwicklung von SKOS, wie auch bei anderen W3C-Standards, gibt es aber im W3C-Prozess für die gesamte Öffentlichkeit die Möglichkeit, beizutragen. Es gibt bestimmte Phasen in diesem Prozess, wo Drafts - also noch nicht fertige Standards - veröffentlicht werden, wo die Öffentlichkeit aufgerufen wird, Kommentare abzugeben. Und der Prozess im W3C ist sehr strikt. In bestimmten Phasen darf der Draft nicht auf die nächste Stufe weiterkommen, ohne das wirklich alle Kommentare zur Zufriedenstellung auch des Kommentierenden beantwortet sind. Und wenn zum Teil schwerwiegende Änderungen gemacht werden, dann muss der Prozess nochmal auf einer grundlegenden Ebene wiederholt werden.

Obwohl es diese drei Gruppe gibt, den Staff, die Mitglieder, die Öffentlichkeit und obwohl es nach außen oft so scheint, dass das W3C ein großer Monolith ist, wo man eigentlich nichts beitragen kann, gibt es doch viele Möglichkeiten, doch was beizutragen als Öffentlichkeit. Natürlich: eine größere Möglichkeit etwas beizutragen hat man, wenn eine Organisation da Mitglied ist, dann kann die Organisation wirklich, grundlegendere Themata vorschlagen. Ab einer kann man sagen kritischen Masse von Organisationen, die ein Thema haben möchten, kann man damit rechnen, dass dazu eine Arbeitsgruppe gebildet wird, dass dazu gearbeitet wird.

Das ist meine Hoffnung, dass jetzt auch durch meine Arbeit hier, in diesem Bereich, Bibliothek, Archiv, Dokumentation an der FH (Potsdam) oder generell der Bibliothekscommunity in Deutschland, ich mehr Organisationen ermutigen kann, auch aktiv beim W3C mitzuarbeiten. Also: selbst beizutreten, selbst solche neuen Standards vorzuschlagen, neue Themen, neue Arbeitsgruppen vorzuschlagen.

Das W3C-Büro in Potsdam

[10:53]
LIBREAS: Okay. Also, Ivan Herman, der in den Niederlanden ist, hat letztens mit Talis, also im Talk with Talis Podcast, auch nochmal darauf hingewiesen, dass gerade Bibliotheken sich, seiner Einschätzung nach, sehr schwer tun, mit dem W3C zusammen zu arbeiten, im Gegensatz zu anderen Communities, obwohl er gleichzeitig gemeint hat, dass die ganzen Initiativen für digitale Bibliotheken eigentlich prädestiniert dafür wären.

Aber Sie haben auch das W3C-Büro Europa nach Potsdam geholt...

[11:19]
Prof. Sasaki: ...das deutsch-österreichische...

[11:22]

LIBREAS: ...das deutsch-österreichische, okay. Ändert sich damit jetzt was? Wird alles besser? Oder was ist genau das Ziel?

[11:29]
Prof. Sasaki: Ich kann kurz ein Wort noch zu diesem Büro sagen. Das W3C besteht erstmal aus dem W3C an sich, was von verschiedenen Organisationen getragen wird, dem MIT in den USA, dem Institut Ercim (European Research Consortium for Informatics and Mathematics) in Frankreich und der Keio-University in Japan. Aber dann gibt es verschiedenen Officies, die vor allem als Katalysator funktionieren, die nicht selber technische Arbeit leisten und auch nicht technische Arbeit koordinieren, aber die zum Beispiel, wenn ein neuer Standard herausgebracht wird, dann Press-Releases übersetzten in die regionalen Sprachen, zum Beispiel auf Deutsch; die Outreach-Veranstaltungen machen, wo neue Technologien vorgestellt werden und so weiter. Meine Hoffnung hier, dieses Büro in der Region hier zu haben, ist, einmal in diese Community zu wirken, an der ich auch jetzt sehr stark interessiert bin, da gibt es viele Organisationen die hier aktiv sind. Natürlich die FH (Potsdam) selber, wo ich bin, Ihr Institut (für Bibliotheks- und Informationswissenschaft) hier (an der Humboldt-Universität zu Berlin), es gibt viele große Bibliotheken und Archive in der Region - also es ist sehr attraktiv hier, in der Region, durch das Büro mehr Kontakte zu haben, zu dieser Community.

Aber auch in anderen Bereichen ist es für das W3C interessant, hier aktiv zu sein. Schon seit Langem gibt es Kooperationen im Bereich Semantic Web, also unabhängig von der bibliotheks- oder sagen wir mal informationswissenschaftlichen Community, zum Beispiel an die Freie Universität. Es gibt einmal im Jahr einen sogenannten W3C-Tag, bei einer Veranstaltung, die sich Xinnovations nennt, die so verschiedene mittelständische Unternehmen aus der Region ansammelt, welche sich mit Webtechnologie beschäftigen. Und auf diesem W3C-Tag werden wieder neue Technologien vorgestellt. Also das ist wieder ein Katalysator um Öffentlichkeit zu schaffen. Der Tag wird dann am 15. September sein, da werden wir wieder aktiv sein. Und am 15. Oktober - vielleicht kann ich da auch noch in eigener Sache drauf hinweisen - wird es noch einen W3C-Eröffnungsevent geben. Wir haben das Office zwar schon hier, aber wir wollen noch mal ein besonderes Event machen, wo wir nochmal die Bereiche, die ich jetzt genannt habe, wie informationswissenschaftlicher Bereich, Bereich Semantic Web, nochmal extra präsentieren wollen und auch noch Leute aus dem internationalen Bereich einladen wollen. Wer das genau ist, kann ich noch nicht sagen. Das soll wieder als Katalysator, als Verknüpfungsmittel zwischen internationalen und lokalen Communities zu dienen.

Einen Bereich, als letzten Punkt, der in dieser Region noch interessant ist, ist der Bereich E-Government. Das ist auch leichter zu bewerkstelligen, dort Kontakte zu knüpfen, zwischen W3C-Aktivitäten, zwischen nationalen Aktivitäten. Wenn man hier ist, kann man sehr viel leichter mal entsprechende Besuche machen in Ministerien. Natürlich, bei diesen Bereichen habe ich jetzt auch persönliche bestimmte Schwerpunkte, die sind natürlich bei meinen Hintergrund jetzt informationswissenschaftlich orientiert und auch am Thema Mehrsprachigkeit orientiert. Und diese anderen Bereich, die fördere ich aber natürlich auch, aber eben als Katalysator. Also das Office, dass wird auch nicht von mir allein getragen. Es gibt auch verschiedene andere Bereiche aus der informationswissenschaftlichen Fakultät an der FH (Potsdam), aus dem Bereich Design an der FH - also, das ist wirklich einfach ein Katalysator, um Öffentlichkeit für Webthemen zu schaffen.

Professur an der FH Potsdam

[14:53]
LIBREAS: Okay, ein anderer Bereich der (mich) interessiert ist: Sie sind jetzt Professor an der FH Potsdam geworden. Mich würde interessieren, was die Ziele Ihrer Lehre sind und auch die Ziele der Forschung in der nächsten Zeit. Also wie Sie in das Bibliothekswesen hineinwirken werden über die Studierenden.

[15:06]
Prof. Sasaki: Also die Denomination, mit der ich jetzt an der FH bin, nennt sich Metadaten und Standards mit dem Schwerpunkt inhaltliche Erschließung. Also, die Länge der Denomination macht ja schon deutlich, dass das ein sehr weites oder ich denke zu einem gewissen Grad auch noch unscharfes Feld ist. Und ich möchte das in einer Richtung ausarbeiten, ich fasse das mal unter einem Oberbegriff zusammen: in die Daten, in die Dokumente hineingehen. So die klassische Sicht von Informationswissenschaftlern - um das jetzt auch noch mal zusammenzufassen und nicht zu trennen zwischen Bibliothek, Archiv und anderen Bereichen - ist, auf die Dokumente drauf schauen; wenn man sagt hineingehen, dann vielleicht nur unter dem Aspekt: Wie kann ich sie automatisch erschließen? Oder auch intellektuell erschließen? Soweit muss ich mich dann dem Inhalt nähern.

Was ich als einen weiteren Schwerpunkt setzen möchte, ist das - jetzt erstmal in der Lehre - sich die Studenten auch mit dem Aufbau der Dokumente beschäftigen, mit den Formaten die dem zugrunde liegen. Das sind zur Zeit oft XML-basierte Formate, deswegen gibt es natürlich einen starken W3C-Bezug, als das grundlegende Datenrepräsentationsformat. Aber unabhängig vom W3C gibt es viele Formate, denke Sie an OpenDocument, an OpenOffice, die XML-basiert sind. Es gibt verschiedene Community-spezifische Formate, denke Sie an - dass kennen Sie vielleicht - TEI, die Text Encoding Initiative, die Formate für geisteswissenschaftliche Daten, Gedichte, Prosa, andere Texte, linguistische Datensammlungen und so weiter, gemacht hat. Also, in die Dokumente hineingehen, in den Aufbau der Daten selber, vielleicht auch lernen, nicht mehr in ein abgeschlossenes Produkt zu schauen, sondern schauen: Wie baut man solche Daten selber auf? Wie baut man solche Dokumente selber auf? Das als ein neuen Schwerpunkt zu geben.

Und das im weiteren Schwerpunkt: Wie bringt man Daten ans Netz? Mit welchen Metadaten stattet man sie aus? Also, Metadaten, die zum Beispiel über Netzprotokolle wie das HTTP weitergegeben werden, zum Beispiel zur Sprachidentifikation. Oder, zur Verlinkung, Metadaten. Ja, Metadaten auch im Dokument selber, auch zu Themata wie Sprachidentifikation oder anderen Metadaten. Wo sollten solche Informationen untergebracht werden? Wie werden die jetzt vielleicht noch nicht so, aber in Zukunft von Suchmaschinen genutzt? Also, für solche Techniken Sensibilisierung schaffen. Das ist das, was ich den Studenten beibringen möchte.

Wenn man das unter einem Berufsfeld "Bibliothekar" ansieht, könnte man sagen, dass wird dann vielleicht erweitert um den Bereich, der wird im anglo-amerikanischen Raum manchmal Data Curator oder Metadata-Librarian benannt. Ein Ziel von mir ist auch, die Berufsfeldorientierung, beziehungsweise ein Stück weit davon abzugehen. Ich denke, die Fähigkeiten, die jetzt gerade beschrieben habe, die auch jetzt schon zum großen Teil vermittelt werden, die sind für ganz unterschiedliche Bereiche - für Unternehmen zum Beispiel, die auch mit großen Informationsmengen umgehen müssen, nicht nur für klassische Bibliotheken - von Relevanz. Also, den Absolventen Zugang zu sehr verschiedenen Berufsfeldern zu ermöglichen. Das ist ein Ziel von mir, da hoffe ich auch, dass dann das erwähnte W3C-Office helfen kann, dass sich jetzt auch die Kontakte hier in der Region Berlin/Brandenburg ergeben, wenn man davon ausgeht, dass die Leute wahrscheinlich erstmal in der Nähe suchen; Kontakte, die dann auch über die klassischen Arbeitgeber, die sich unsere Absolventen zur Zeit noch vorstellen, hinausgehen. Und das ist also der Lehrbereich, wie ich ihn auffasse.

Von der Forschung her gibt es in diesem Bereich: Wie sind Dokumente aufgebaut? - im Bereich Humanties Computing eine sehr aktive Community, die zum Beispiel das TEI-Format sehr intensiv nutzt. Da bin ich auch aktiv und möchte das weiter sein, den Studenten dazu Zugang verschaffen.

Dann gibt es einen Bereich, der sich generell mit Markup-Sprachen beschäftigt. Da gibt es eine international sehr prominente Konferenz, zum Beispiel, die sich Extrem Markup Languages nennt, oder inzwischen Balisage, wo formale Eigenschaften von Markup-Sprachen oder zum Teil philosophische Eigenschaften - Was ist ein Tag? Was bedeutet ein

-Tag? Wie lässt sich die Bedeutung beschreiben? - wo so etwas diskutiert wird.

Ja und ein anderer Bereich, der dann, denke ich, wieder sehr nahe liegend ist, wenn Sie sich meine Vita anschauen, ist eben der Bereich Multilingualität, wo ich mit diesen Mitteln, wie Markup-Sprachen bestimmte Anwendungen, wie vielleicht TEI oder anderen, mich dafür interessieren: Wie lassen sich multiliguale Daten gut darstellen? Wie lassen sie sich gut ans Web binden? Gut auffindbar machen? Gut nachhaltig repräsentieren und von Benutzern aus verschiedenen Kulturräumen gut auffindbar machen?Ja, solche Themen.

Wo Sie sagen Forschung, nochmal abschließend, ganz entscheidend ist dafür natürlich auch die Entwicklung dann bei uns an der Fachhochschule, wie weit das als Forschung jetzt möglich ist oder nicht. Also, wir haben jetzt einen Bachelor, der von dieser Bandbreite, was ich jetzt beschrieben habe... wo das eher Randbereiche sind. Aber eine sehr spannende Frage ist jetzt, wie sich das bei uns an der Fakultät in Zukunft entwickeln wird, bei der weiteren Planung im Bachelor und der Planung im Master. Das ist jetzt sehr spannend und es wird sich zeigen, wie das in den nächsten Jahren weiter geht.

Interne Spezialisierung des Berufsfeldes

[20:54]
LIBREAS: Ja, aber Sie haben es schon angedeutet, dass führt ja vom klassischen Berufsbild oder auch vom dem Berufsbild, wie Bibliothekare sich immer mal wieder kontinuierlich fassen auch weg. Gibt es da schon Reaktionen aus dem Bibliothekswesen? Oder... zumindest die Diskussion an Ihrer Fakultät (das heißt: Fachbereich) haben sie ja schon angedeutet. Gibt es da Diskussion, gibt es da positive Reaktionen drauf? Oder nur negative?

[21:14]
Prof. Sasaki: Es hängt immer davon ab, welche Gruppe man fragt. Ich denke bei manchen Leuten sieht man leuchtende Augen, wenn man spitze Klammern zeigt, spitze Klammern als ein Teil von einem XML-Dokument. Bei anderen Leute sieht man eher müde Gesichter. Man kann das vielleicht auch so Gegenüberstellen: die einen wollen mehr und mehr solche technischen Inhalte; die anderen sagen, dass überlassen wir den Informatikern und wir beschäftigen uns mit den klassischen Inhalten. Zur Zeit, glaube ich, ist es so, dass man schon viele technische Inhalte eingeführt hat. Was ich sehr begrüße und was für mich auch eine große Motivation war, nach Potsdam zu kommen. Allerdings glaube ich, woran noch mehr gearbeitet werden muss, ist der Aspekt, nicht zu versuchen, "eierlegende Wollmilchsauen" auszubilden, sondern eher klarere Profile zu schaffen. Also es gibt positive Reaktionen von bestimmten Gruppen, es gibt nicht so positive von anderen. Und ich glaube, man muss einfach diese Gruppen deutlich genug in der Ausbildung und - soweit dafür Ressourcen da sind - auch in den Forschungsmöglichkeiten trennen und entsprechende Schaniere schaffen. So Leute, die dann eventuell in beiden Bereichen kompetent sind. Aber ich denke, dass Gros der Leute, die wird sich entweder für den klassischen oder eben für solche neuen Bereiche interessieren und eventuell auch nicht-berufsfeldorientiere Bereiche. Und wichtig ist, dass klar genug zu trennen und nicht zu versuchen, alles in einer Ausbildung oder in einem Forschungsansatz unterzubringen.

Teilnehmendes Feedback

[22:44]
LIBREAS: Ich dachte immer, man muss als Bibliothekar sich immer um alle Medien kümmern. Aber das ist vielleicht ein anderer Ansatz. Wenn überhaupt, dann interessiere ich mich immer für alle Medien und wie die sich entwickeln. Und ich verstehe immer nicht, warum sich jemand nur aufs Buch bezieht.

[22:57]
Prof. Sasaki: Vielleicht kann ich daran kurz noch anschließen. Man hat sehr viel Feedback von der Bibliothekscommunity... ja, ich würde sagen, sehr viel zuschauendes Feedback, was so Entwicklungen im Web angeht. Zuschauendes Feedback im Sinne von zum Beispiel Analysen, wie die Nutzung von Twitter unser Sozialverhalten verändert oder wie Suchmaschinen, natürlich schon seit Langem, unsere Art verändert, auf Informationen zuzugehen. Man hat aber bisher wenig teilnehmendes Verhalten bei der Entwicklung dieser Technologien. Also, Library of Congress, als ein Beispiel, die sich aktiv auch bei der Standardisierung von zum Beispiel SKOS beteiligen.

Und ich hoffe einfach auch, dass man mehr und mehr eben dieses Teilnehmen hat. Aber meine Erwartung ist nicht, dass das etwas ist, das für alle relevant ist. Und es ist auch etwas, dass verlangt, dass man doch eine gewisse Tiefe mitbringt beim Zugang zu bestimmten Technologien. Ja, und natürlich Tiefe und Breite: beides gleichzeitig zu haben wäre schön, aber der Tag hat nur 24 Stunden, die Woche nur sieben Tage. Also ich denke, wenn man solche Profile schafft, dann wird ein Stück weit auch dieser Generalität verloren gehen. Aber der Gewinn ist eben, dass man dann von diesem Zuschauenden zu diesem Teilhabenden weiterkommen kann. Das man dann mehr an der Front neuer Entwicklungen ist und dann auch wirklich bei den Entwicklungen mitmachen kann.

Klarere Profile schaffen

[24:33]
LIBREAS: Es gibt ja die Debatten darum, dass Bibliotheken die Informationskompetenz vermittelnde Institution sein sollen. Man kann darüber diskutieren, ob das stimmt oder auch so passieren wird. Aber eigentlich wäre das dann auch ein Bereich, der, wenn dann Informationskompetenz vermittelt wird, mit vermittelt werden müsste. Also so ein Wissen darum, was Standards sind und wie sie funktionieren ist natürlich grundlegend dazu, um zu verstehen, wie das Netz funktioniert. Und ich frage mich - und das ist jetzt tatsächlich so eine Frage -, ob das nicht auch in diese Informationskompetenzvermittlung - die ja meistens so eine Recherchevermittlung ist, wenn man sich das anguckt - hinein fließen müsste?

[25:09]
Prof. Sasaki: Ich teile Ihre Analyse und ich denke, der Bereich Informationskompetenz ist sehr wichtig. Und mein Anliegen wäre, jetzt nicht zu versuchen, den Leuten, die - jetzt, wie Sie es beschrieben haben - Informationskompetenz zu betreiben, denen zu sagen, sie müssten jetzt Techniker werden. Ich denke, dass wäre der Versuch, die eierlegende Wollmilchsau auszubilden. Sondern mein Anliegen wäre eher für diejenigen, die Interesse haben an den technischen Bereichen und dann natürlicherweise weniger an dem sozialwissenschaftlichen Zugang, der Analyse, wie wir Technik benutzen, denen die Möglichkeit zu geben, dort auch tiefer einzusteigen und dort natürlich auch Schnittstellen zwischen beiden zu haben. Also, Sie haben Recht, normalerweise wird das eher sehr breit gesehen. Ich würde eher versuchen - dass ist auch mein Ziel noch in der Zukunft - doch klarer Profile zu schaffen und den Leuten damit doch mehr Konkurrenzfähigkeit auch außerhalb des Bibliotheksbereich zu schaffen.

Nehmen wir mal ein Beispiel, Ausbildung in grundlegenden Webtechnologien: XML und Semantic Web. Das wird zum Beispiel in vielen wirtschaftsinformatischen Fakultäten oder in vielen Informatikfakultäten, auch Fachhochschulfakultäten, gemacht. Aber da ist dann der Fokus schon so stark auf den Technologien, dass unsere Abgänger, wenn sie abschließen, mit dem Wissen, was sie an XML oder Semantic Web Technologien haben, einfach nicht konkurrenzfähig sind. Einfach weil sie das zu breit angehen, in zu vielen Bereichen ein bisschen einsteigen. Deshalb ist es nötig, um dann die Konkurrenzfähigkeit außerhalb des Berufsfeldes, also gegenüber Bereichen in anderen Berufsfeldern, aufrecht zu erhalten, dann doch einen Teil der Ausbildung dann so stark zu profilieren und dann auch zu vertiefen, dass dann auch konkurrenzfähig bliebt.

[26:56]
LIBREAS: Und kann man das eigentlich auch für Archive - also, Sie bilden ja auch Archivare und Dokumentare und auch jeweils die weibliche Form davon, aus. Mich würde interessieren, ob diese Ausbildung, wie Standards und Formate funktionieren, nicht vielleicht für Archivare und Dokumentare noch eine andere Bedeutung hat, als für Bibliothekare?

[27:14]
Prof. Sasaki: Ich denke, die Frage, worauf Sie hinaus wollen, ist, ob man solche Inhalte dann nicht auch für diese Bereiche berücksichtigen soll, Archive oder Dokumentare. Ich denke auf jeden Fall, aber ich würde wieder sagen, wichtig ist es, nicht so sehr an Berufsfeldern sich zu orientieren, also der Archivar, der Dokumentar, der Bibliothekar. Was ich im Sinne habe, ist eher der technische Informationsspezialist, der kein Informatiker ist. Als Informatiker würde ich jemanden sehen, der zum Beispiel in der Lage ist, einen XML-Parser zu entwickeln, also ein Programm, was XML-Daten verarbeitet, oder ein XQuery-Parser, also ein Programm, was XML-Abfragen erlaubt. Das würde ich den Informatikern überlassen. Aber ich würde die Konstanz darin sehen: jemand der weiß, wie man ein XML-Dokument aufbaut, der weiß, wie man dann diese Abfragesprache XQuery einsetzt, um Daten abzufragen, wie man die Daten dann ans Netz bringt, wie man sie präsentiert, wie man sie verschiedenen Nutzern zugänglich macht. Also auch Nutzern verschiedener Sprachen zum Beispiel. Und das sind Kompetenzen, die ich über diese Bereiche hinweg sehe, so wie Archiv, Dokumentation, Bibliothek und, wie gesagt, wo ich auch ganz berufsfeldunabhängig eben einen... Information Specialist, Information Engineer - es ist noch sehr schwierig, da Begrifflichkeiten zu finden. Aber wo ich das als eine sehr wichtige Kompetenz sehe, aber - und das ist eben das Problem oder das Spannende bei der Curriculumsplanung jetzt - dass so hinzukriegen, dass man das wirklich tief genug verankern kann und dann den Leute aus den Bereichen, die das machen wollen, die Möglichkeit gibt, dass auch tief genug zu behandeln. Das ist sicherlich relevant für alle Bereich, aber dann eine Form zu finden, wo man das dann wirklich tief und dann auch mit der Perspektive, dass dann auch außerhalb der Berufsfelder zu öffnen, dass ist dann die große Herausforderung, vor der dann wir und ich denke auch andere informationswissenschaftliche Fakultäten in Deutschland jetzt stehen.

Semantic Web

[29:16]
LIBREAS: Okay, dass führt vielleicht ein bisschen zurück, aber: sie würden schon sagen, bei anderen Communities hat das funktioniert? Weil, ich habe manchmal auch den Eindruck, als wäre nicht nur die Bibliothekscommunity so eine Community unter sich, sondern auch die Semantic Web/Web 2.0 Community auch in gewisser Weise abgeschlossen und nicht so richtig interessiert, an dem was drumherum vor sich geht. Aber wenn Sie meinen, dass tatsächlich andere Communities den Anschluss schon geschafft haben, ist es ja tatsächlich nicht nur ein reines Kommunikationsproblem, sondern es ist auch auflösbar.

[29:47]
Prof. Sasaki: Ja, ich kann Ihnen ein Beispiel nennen, was jetzt vor ein paar Wochen veröffentlicht wurde. Der Bereich Corporate Semantic Web (der FU Berlin) arbeitet jetzt mit dem FIZ Chemie, den Fachinformationszentrum für Chemie, was in Berlin auch sitzt, daran, deren Daten mit an das Semantic Web zu bringen. Und da haben Sie ein Beispiel, wo anders als bei anderen Semantic Web Daten, wo einfach nur "irgendwelche" Daten als Semantic Web gedacht werden, da, in so einem Bereich, wie dem Fachinformationszentrum, da werden sehr hochwertige Daten, wo sehr viel manuelle Pflege, sehr viel Kontrolle hineingesteckt wurde, ans Semantic Web gebracht. Und das ist, denke ich, ein Bereich, wo beide Gruppe voneinander profitieren können und wo sich die Communities treffen können, zum einen die Semantic Web Community, die sehr viel Arbeit in die Infrastruktur gelegt hat, aber nicht so sehr in den manuellen Aufbau von Ressourcen und dann Communities, wie die Bibliothkescommunity oder die Fachinformationscommunity, die diese Ressourcen hat, die diese sehr hochwertigen Kataloge hat, sehr hochwertig erstellte Klassifikationen und Thesauri, die aber noch nicht am Netz sind. Und FIZ Chemie ist ein Beispiel, wo das gemacht wird.

Und ich denke, diese Kombination von den hochwertigen Daten mit dem Know-How über technische Repräsentationen, das ist ein Bereich, wo sich diese Communities treffen können und immer mehr und mehr treffen. Also, was ich vorhin erwähnte, mit Health-Care und Lifescience, das ist ein Bereich, wo sich eben diese Healt-Care/Lifescience-Community, diese auf Gesundheitsforschung bezogene Community mit der Semantic Web Community getroffen hat und wo es sehr viele Verbindungen jetzt gibt. Ein anderer Bereich ist Semantic Web and Oil Industry, ein anderer Bereich ist XBRL (Extensible Business Reporting Language), ein Format, dass unabhängig vom Semantic Web entwickelt wurde, für Informationen aus dem Bankwesen, ja was jetzt auch... voran dann gearbeitet wird, dass mit dem Semantic Web in Verbindung zu bringen. Also, es wird mehr und mehr daran gearbeitet, dieses Manko, was Sie erwähnt haben, was auch stimmt, das lange das Semantic Web ja vor allem an sich ohne Zugang, ohne Verbindung zu spezifischen Communities, dass das lange so gearbeitet hat, das zu ändern, Verbindungen zu Communities zu schaffen. Und ich denke, gerade jetzt für den Bereich Bibliothek, Archiv, Dokumentation ist die Zeit reif, sind die Daten da und ist die Verbindung wirklich einfach zu machen und wird jetzt, denke ich, bald kommen.

[32:06]
LIBREAS: Es gibt ja bei dem Talk with Talis-Podcast auch immer die Semantic Web Gang, die tatsächlich auch diskutiert darüber, wie das Semnatic Web mit der Bibliothek zusammengehen kann. Aber ich habe den Eindruck, dass das Ergebnis jeder dieser Diskussionsrunden ist, dass es eigentlich demnächst losgehen müsste und das ganz viel gespielt wird, aber dass irgendwie der Take Off fehlt. Das aber auch schon seit Längerem. Ich glaube, die Einschätzung ist bei Ihnen ja auch ähnlich, einfach, was ja auch normal ist.

[32:33]
Prof. Sasaki: Vielleicht einen konkreten Aspekt noch. Im Web spielen HTTP-URIs, nicht nur im Semantic Web, sondern in der generellen Webinfrastruktur, spielen die eine große Rolle, während in der Bibliothekscommunity andere Möglichkeiten, Objekte nachhaltig zu identifizieren, fokussiert werden. Also, URNs zum Beispiel oder DOIs, als zwei prominente Formate. Und das ist zum Beispiel ein Bereich, wo es wirklich schwer ist, zu sagen, man geht halt ans Netz und behält aber diese nicht-spezifischen Identifikatoren bei. Also das ist einfache eine Voraussetzung, da dann die Verbindung zwischen den Communities zu schaffen, dass man sich auf ein Identifikatorenschema einigt. Da sehe ich einen Knackpunkt, der die Annäherung der Communites doch schwierig machen kann oder wo es doch sehr Spannend ist, wie das zu erreichen ist. Die Deutsche Nationalbibliothek, zum Beispiel, vergibt URNs für ihre Neuerwerbungen, aber zum Beispiel keine HTTP-URIs. Also wenn man da noch mehr Einigung schafft, was das Mittel der Wahl ist, ich denke, dann wird die Zusammenarbeit der Communities noch leichter.

Suchmaschinen

[33:42]
LIBREAS: Stichwort Semantic Web und wie wir mit Informationen und Daten umgehen. Das machen nicht nur Bibliotheken, sondern das machen auch Suchmaschinen. Und gerade Google, aber auch andere, hausieren ja immer mal wieder damit, dass sie jetzt das Semantic Web darstellen würden. Jetzt, Google Squared ist vor Kurzem rausgekommen, als Lab-Project. Ist das ein anderer Weg, wird der dazu führen, dass das Semantic Web tatsächlich sichtbar wird, für Menschen, damit die auch verstehen, was das ist? Und wird das auch dazu führen, dass dann auch andere Anforderungen an Bibliotheken gestellt werden? Also, das kam mir, als ich mir Google Squared das erste Mal anschaute... stellte sich mir die Frage: Werden Menschen dann anders zu uns in Bibliotheken kommen und Daten suchen? Sie haben es ja vorhin erwähnt, dass Bibliotheken eher das ganze Produkt sehen und da Metadaten zu Schreiben und das Internet eher mehr und mehr dazu tendiert, Informationen aus Daten darzustellen?

[34:33]
Prof. Sasaki: Also, zu Anfang muss ich sagen, ein bisschen liegt das außerhalb meiner Kompetenz, weil Suchmaschinenfirmen wie Google, die nutzen Webtechnologie, die machen Ankündigungen, dass sie Metadaten benutzen bei der Suche; fordern Leute, die Inhalte erstellen, ins Web stellen, auf, dann die Metadaten zu nutzen. Formate wie Microformats oder RDFa sollen jetzt angeblich bei Google berücksichtigt werden.

Ich sagte, dass ist außerhalb meiner Kompetenz, dass zu beantworten, weil, was Firmen wie Google oder andere Suchmaschinen nicht öffentlich machen, ist die Frage, welchen Einfluss hat das wirklich auf das Suchergebnis? Das ist auch verständlich aus deren Perspektive: wenn sie den Einfluss öffentlich machen würden, würden sie einen Teil Ihres Erfolges einfach öffentlich machen. Aber das macht es dann schwierig, zu sagen, wie relevant das dann wirklich in Zukunft sein wird. Also man wird, denke ich, abwarten müssen, wie sehr dann wirklich solche Informationen, eingebracht in Webseiten, dann zu anderen Ergebnisse führen.

Was Sie erwähnten mit Google Squared: Sie haben richtig gesagt, dass kommt aus einem Lab von Google, also ist noch nicht Teil der Hauptsuchmaschine. Da muss man schauen, was sich in den nächsten Jahren dann wirklich durchsetzt. Also da wage ich schwer, Prognosen zu machen. Ich denke zur Zeit ist doch noch die Hauptstrategie der Suchmaschinen, einfach wenig Metadaten zu nutzen. Ich denke, dass wird sich mehr und mehr ändern. Vielleicht auch in bestimmten Bereichen, also nicht so sehr jetzt in der Volltextsuche, aber in der Suche von Multimediaobjekten zum Beispiel, weil da die Analyse von Bildern oder die Analyse von Audiodateien - dass bringt doch nach wie vor noch unbefriedigende Ergebnisse. Und da sind Metadaten ein wichtiges Mittel, um entsprechende Ressourcen zu finden, um die Multimedia-Objekte zu finden. Also so in bestimmten Domänen denke ich, können Metadaten doch mehr und mehr noch eine große Rolle spielen.

[36:33]
LIBREAS: Ja, dass hat mich auch ein bisschen immer so irritiert in der Entwicklung der Suchmaschinen, dass da eigentlich mehr und mehr davon abgegangen wurde, Metadaten zu benutzen und Google ja auch damit bekannt wurde, irgendwann zu sagen, wir haben niemals Metadaten benutzt, sondern immer nur ein Ranking. Und das die jetzt auf einmal wieder kommen. Auch bei Bing, die neuen Suchmaschine von Microsoft, scheint mir das ja auch nicht klar, wie funktioniert das eigentlich? Aber es ist auch Metadaten-basiert. Das würde vielleicht nochmal als Feststellung festhalten, dass es tatsächlich so eine Bewegung gegen die Bewegung, die es eigentlich seid dem Bestehen der Suchmaschinen gibt, jetzt auf einmal in den letzten Jahren gab.

[37:06]
Prof. Sasaki: Ich kann Ihnen noch einmal ein konkretes Beispiel geben aus dem Bereich Sprachidentifikation, wo ich ein bisschen so den Überblick habe, was die Nutzung von Metadaten angeht. Es gibt ja die Möglichkeit, Sprachinformationen in HTML-Dokumenten auszudrücken oder auch in XML-Dokumenten oder auch in dem Protokoll zur Übertragung, im HTTP-Protokoll auch die Sprachinformationen weiterzugeben. Und oft wird die Frage gestellt: Wie wird das eigentlich genutzt? Es wird zum Beispiel für Browser benutzt, wenn Sie die Googlewebsite aufrufen, dann wird Ihnen gleich das deutsche Userinterface gegeben und sie kriegen, wenn Sie nach Pizza suchen, dann eine Pizza aus Berlin, aber nicht eine Pizza aus Tokio. Also dazu, um dann Suchergebnisse entsprechend darzustellen oder mal die Ergebnisse zu fokussieren, also dafür denke ich, wird das schon genutzt. Und die spannende Frage ist ja, wird das auch genutzt, wenn das in den Eingangsdaten vorhanden ist, also wenn jemand sein Dokument mit Sprachinformationen ausstattet und ans Web stellt? Wird das von der Suchmaschine genutzt, wenn ich da jetzt reinschreibe, die Sprache ist auf Deutsch, auf Englisch oder in einer anderen Sprache? Und da ist, aus meinen Informationen, wie Google sich auch nach außen präsentiert, da werden auch Zahlen nach außen veröffentlicht, doch der Anteil der Sprachen bzw. der Anteil der Webseiten, die erstmal richtig mit Sprachen getaggt sind, doch verschwindend gering. Weit unter einem Prozent der Seiten, die indiziert sind, haben die Sprache, die Sprachtags der Sprache, die in der Seite wirklich enthalten sind. Und das doch das Hauptmittel, um die Sprache einer Seite herauszufinden, doch einfach automatische Verfahren sind, also das man entsprechende Daten hat, die einer Sprache entsprechen und dann die zu indizierende Seiten analysiert und schaut, ob die Muster dann jeweils einer Sprache entsprechen. Und dann sagt man, dass ist dann eine deutsche, japanische, englische, sonst wie Seite. Also solche automatischen Verfahren sind aufgrund der Fehlerhaftigkeit der manuell erstellten Metadaten doch noch das Hauptmittel, mit denen eine Suchmaschine wie Google zum Beispiel ihre Daten indiziert und dann trennt.

Ja, und wenn sie überlegen: Sprachdaten, dass ist ja doch eine relativ einfache Art von Metadatum, dass ist ja eigentlich eine Information: welche Sprache ist eine Seite? Und wenn Sie das jetzt vergleichen mit den Metadaten, an die man sonst denkt, also Metadaten, die man in Microformaten, RDFa und anderen Formaten unterbringen könnte, die sind ja wesentlich komplexer. Also da hat man Adresse, Kalenderformate und so weiter. Also, da geht es nicht nur um einzelne Werte, sondern um ganz komplexe Informationen. Und wenn Sie jetzt an die Fehlerhaftigkeit bei dem einfachen Wert schon denken, also da bezweifle ich doch - also, wie gesagt, ohne das jetzt kompetent wirklich bewerten zu können, jetzt in dem Bereich, aber aufgrund der Erfahrung aus dem Bereich Sprachidentifikation -, bezweifle ich doch, dass es so ohne Weiteres möglich sein wird, diese Metadaten bei der Erstellung von Indizes, bei der Analyse von Suchergebnissen dann noch zu nutzen.

Qualitätsvolle Daten

[40:11]
LIBREAS: Was Bibliotheken ja auch immer wieder betonen, ist die Qualität ihrer Daten, im Gegensatz zu den anderen Daten, die dann offenbar nicht so qualitätsvoll sind. Und trotzdem scheint mir, dass darauf, außer Bibliotheken selber, niemand so richtig reagiert. Nimmt das den keiner wahr? Also, mich interessiert das tatsächlich, weil ich sehe, dass das Argument auf der einen Seite immer gebracht wird und eine gewisse Plausibilität auch anführt, weil da tatsächlich Menschen sitzen, um diese Metadaten zu erstellen und mehrfach zu kontrollieren, bevor sie überhaupt hinaus gegeben werden in die Welt. Und gleichzeitig aber irgendwie kein Response von der Außenwelt zu kommen scheint. Also, ein ähnliches Problem gab es ja mit diesem Dublin Core: dass das Bibliotheken immer wieder darauf hingewiesen haben, man sollte seine Seiten mit Dublin Core austaggen und dann hat das aber auch nie eine Suchmaschine benutzt. Interessiert das einfach niemanden in der Suchmaschinenwelt, dass es diese qualitätsvollen Daten gibt? Oder wird dann einfach darauf gesetzt, dass einfach der Großteil der Daten nicht qualitätsvoll ist und die deshalb technisch erschlossen werden sollen? Das ist ja auch interessant als Frage: Brauchen wir eigentlich diese qualitätsvollen Daten die ganze Zeit? Also, für den bibliotheksinternen Betrieb ja. Aber brauchen wir die eigentlich im Webzeitalter für das Web?

[41:22]
Prof. Sasaki: Ich denke, was jetzt die Wahrnehmung der Qualitätsdaten angeht, da kann ich nochmal das Gleiche sagen, wie vorhin: standardisierte Formate zur Repräsentation, zum Zugang der Daten zu nutzen, so was wie HTTP-URIs zur Identifikation zu nutzen, HTTP als Austauschprotokoll - das wird auf jeden Fall der Sichtbarkeit helfen. Und was die Frage angeht, brauchen wir die Daten an sich, da würde ich einfach versuchen zu trennen, in Communities. Stellen Sie sich vor, Sie haben zu hause Ihre private Photosammlung, die Sie aufbauen. Da benutzen Sie wahrscheinlich Tags auf Ihrem Computer, da erzeugen Sie eine Tagcloud und das ist es. Das ist aber was ganz anderes, als jemand, der ein Bildarchiv vielleicht, sagen wir mal, mit einer ganz bestimmten philologischen Ausrichtung aufbaut. Und der dann auch einen anderen Nutzerkreis hat, also Leute, die zum Beispiel für bestimmte Forschung Informationen brauchen. Also ich denke, da ist es nicht verwunderlich, dass Leute, die vor allem an diesem einfachen Szenario, sagen wir einfach mal ganz einfache Websuche, interessiert sind, dass die kein Interesse an den komplexen Daten haben, weil der Zugang ja auch einiges an Vorwissen erfordert. Aber ich denke, es wird auch nach wie vor Communities geben, die dieses größere Interesse haben an Zugang. Nur, man muss halt die Schnittstelle zu den offeneren Communities offen halten. Also ganz oft wird zum Beispiel Wikipedia als ein Gegenpol zu Bibliotheken beschrieben: Also Wikipedia, da sind die Informationen nicht so gesichert, in Bibliotheken, da sind sie gesicherter und ja, dass sind zwei verschiedene Arten des Wissens. Ich denke, dass man kein Gegenpol sein. Ich denke, man kann solche Mechanismen wie Wikipedia auch in Bibliotheken aufbauen. Da ist es wieder die technische Infrastruktur, um das ans Web anzuschließen, die wichtig ist. Aber eben auch die soziale Infrastruktur derjenigen, die dann solche hochwertigen Informationen nutzen und dann die Verbindungen zu offeneren Communities aufrecht erhalten oder schaffen. Das sind, glaube ich, sehr wichtige Aspekte.

[43:33]
LIBREAS: Na, was mir auch auffällt: dass, als ich angefangen habe zu studieren, also 2001 bis 2006, wurde noch viel darüber diskutiert, wie man aus der Datenmenge nicht irgendwas sucht, sondern wie man da Informationsveredelung macht. Also, wie man aus einfachen Informationen wieder neue und qualitätsvollere Informationen herausbringt, die dann auch tatsächlich einen Surplus geben. Und mir scheint so ein bisschen diese Diskussion irgendwo verschwunden zu sein und mehr darauf gezielt zu werden, dass es den einzelnen Nutzer oder die einzelne Nutzerin gibt mit der expliziten Frage. Manchmal frage ich mich, wo eigentlich diese Idee der Informationsveredelung geblieben ist im Semantic Web. Ob die irgendwo verschwunden ist, weil eigentlich sind das ja angereicherte Daten, die auch eine gewisse neue Qualität darbieten sollen, auch wenn das, was wir sehen, sich ja meistens darauf beschränkt, zu sagen, okay, wo ist die nächste Pizzeria? Und wie teuer ist sie? Das sind dann so Standardanwendungen, die der Normalnutzer, die Normalnutzerin versteht.

[44:26]
Prof. Sasaki: Ich denke, es ist wieder so: man hat die technische Infrastruktur, die einem erlaubt, veredelte und nicht veredelte Informationen in das Datenkonklomerat herein zu bringen, aber man hat auch die Möglichkeit, ganz klar zu sagen: dieser Bereich dieses Konklomerats ist der veredelte Bereich. Denken Sie an das Beispiel mit dem Fachinformationszentrum und den Bibliotheken. Wenn die Ihre Daten mit in so ein Projekt wie Linked Open Data bringen, dann ist das ein sehr großer Mehrwert für das Projekt. Aber sicherlich nicht für alle Nutzer. Manche sind auch ganz froh, wenn sie einfach nur ohne Veredelung einen Zugriff haben. Die Veredelung bedeutet ja auch eine größere Hürde des Zugriffs. Ein Klassifikationssystem muss man erstmal verstehen, einen Thesaurus muss man erstmal verstehen, um wirklich daraus Nutzen ziehen zu können. Ich denke, es ist ein Stück weit auch kritisch für den Erfolg des Semantic Web, dass man diese hochwertigen, veredelten Daten hat.

[45:20]
LIBREAS: Gut, ich bin mit meinen Fragen erstmal am Ende. Also, wenn Sie noch wichtig Sachen, die wir besprechen wollen, sagen wollen, können wir das machen.

[45:30]
Prof. Sasaki: Ja, ich möchte mich bedanken für die Möglichkeit des Interviews und diese Arbeit, diese Aktivitäten hier darzustellen. Das ist sehr Spannend. Ja, und ich denke, generell ist die Entwicklung in diesem Bereich sehr spannend. Es interessiert mich sehr, was hier in den nächsten Jahren passiert. Sowohl bei Ihnen (an der Humboldt Universität) als auch bei uns am Institut (an der Fachhochschule Potsdam), in dieser Region und generell.

[45:52]
LIBREAS: Ja, gut. Dann danke ich Ihnen für das Interview.


 
nach oben