Podcast

Podcast #14 zu EuropeanaConnect

Download Podcast: mp3 / 15,4mb ogg / 32,1mb

In dieser Ausgabe des LIBREAS-Podcast trafen wird uns mit drei wissenschaftlichen Mitarbeiterinnen, die am Institut für Bibliotheks- und Informationswissenschaft für das EuropeanaConnect-Projekt tätig sind.

Wir sprachen dabei über das Projekt und die Europeana selber, aber an diesem Beispiel auch über die Schwierigkeiten beim Aufbau von semantischen und multilingualen Suchen.

v.l.n.r. Marlies Olensky, Maria Gäde, Juliane Stiller. Wissenschaftliche Mitarbeiterinnen am EuropeanaConnect-Projekt.


Transkript zum Interview

LIBREAS PODCAST #14
Interview mit Maria Gäde, Juliane Stiller, Marlies Olensky
Karsten Schuldt (Interview, Transkription)
Sprache/Language: Deutsch
Spieldauer/Running Time: 26 min 53 sec
Datei/File: mp3/15,4mb // ogg/32,1mb
Bitrate: mp3/80 kBit/s // ogg/160 kBit/s
Aufnahmedatum/Recorded: 28. Januar 2010
Veröffentlicht/Published: 08. Februar 2010
Über: Europeana, EuropeanaConnect, Multilingualität, Semantische Suche


00:00:10

LIBREAS: Guten Tag.

Ich begrüße Sie zur vierzehnten Ausgabe des libreas-Podcast. In diesem spreche ich mit Maria Gäde, Juliane Stiller und Marlies Olensky, die allesamt als wissenschaftliche Mitarbeiterinnen am EuropeanaConnect-Projekt [1] arbeiten. Wir thematisieren in diesem Interview sowohl die Europeana [2] als Gesamtprojekt als auch Fragen der Multilingualität, der sematischen Suche und des Umgangs mit Metadaten in der Europeana.

Im Hintergrund der Aufnahme hören sie den Baulärm der aktuellen Umbauten im Institut für Bibliotheks- und Informationswissenschaft der Humboldt Universität zu Berlin. Mein Name ist Karsten Schuldt und ich hoffe, dass Ihnen dieser Podcast Einblicke in die Arbeit hinter der Europeana liefert.

00:00:49

Juliane Stiller: Also, mein Name ist Juliane Stiller. Ich habe am Institut für Bibliotheks- und Informationswissenschaft in Berlin studiert, habe dort meinen Abschluss vor drei Jahren gemacht. Und seit einem halben Jahr bin ich im Projekt EuropeanaConnect. Dort arbeite ich im Work Package 2 "Multilingual Access to Content", was soviel bedeutet wie mehrsprachiger Zugang zu Content in Europeana.

00:01:19

Maria Gäde: Ja. Mein Name ist Maria Gäde, für mich gilt das Gleiche. Ich arbeite auch am Work Package2 bei EuropeanaConnect: Multilingualer Zugang. Ich habe auch an diesem Institut studiert und promoviere auch zu dem Thema.

00:01:31

Marlies Olensky: Mein Name ist Marlies Olensky. Ich habe nicht am Institut studiert. Ich hab in Österreich studiert und bin seit einem halben Jahr auch an EuropeanaConnect beteiligt, allerdings im Work Package 1, wo es um die Erstellung der semantischen Datenschichten in Europeana geht.

00:01:52

LIBREAS: Okay. Also eigentlich sollten das Bibliothekare ja wissen, aber könnt ihr nochmal kurz den Ansatz von Europeana einführen, also was Europeana ist und machen soll?

00:02:01

Juliane Stiller: Europeana ist sozusagen ein Netzwerk und ein Portal, in dem verschiedene kulturelle Institutionen ihre Dokumente aggregieren können. Diese Institutionen sind Bibliotheken, Museen, Archive und audiovisuelle Archive. Und die sollen zugänglich gemacht werden über ein Portal oder über ein Interface. Die Idee ist, dass man praktisch multilingualen und multimedialen Zugang zu diesen Dokumenten schafft.

00:02:30

Marlies Olensky: Genau. Ziel soll es einfach sein, dasKulturerbe Europas eben digital den Bürgern frei zugänglich zu machen. Dass heißt es werden keine Gebühren erhoben.

00:02:42

Maria Gäde: Man muss dazu sagen, dass es auf der Metadatenebene bleibt. Also Europeana hat jetzt nicht diese digitalisierten Objekte, sondern man wird, wenn man letztendlich auf dieses Objekt klickt, auf die jeweilige Institution verwiesen.

00:02:57

Juliane Stiller: Das ist auch der Unterschied zu einer Bibliothek, die die Objekte an sich hat. Europeana hat die Objekte an sich nicht, sondern praktisch nur die Verweisungen oder die Metadaten dazu. Wir bieten den Thumbnail an und durch den Klick auf den Thumbnail hat man dann Zugang.

00:03:16

Maria Gäde: Wir möchten zu jedem Objekt Thumbnails anbieten. So weit ist es noch nicht.

00:03:24

Marlies Olensky: Aber das erklärte Ziel soll dann irgendwann mal sein, dass Europeana nicht nur ein Portal ist, sondern das es eben auch eine Schnittstelle wird und das es genauso eine Anwendung ist wie GoogleMaps zum Beispiel, die dann in andere Websites oder in andere Anwendungen eingebunden wird. Also das Europeana nicht nur über das Portal zugänglich ist.

00:03:49

Juliane Stiller: Ja. Und das auch die kulturellen Institutionen Europas praktisch die Suche anbieten können, auf ihr Angebot zugeschnitten.

00:04:00

LIBREAS: Gut. Und ihr arbeitet jetzt im EuropeanaConnect-Projekt, was Teil des Ganzen ist...

00:04:05

Juliane Stiller: Ja, EuropeanaConnect bedeutet praktisch nur, dass es ... es soll praktisch die technische Voraussetzung für die Realisierung von Europeana liefern. Da gibt es halt verschiedene sogenannte Work Packages oder Arbeitsgruppen, die sich um verschiedene Aspekte der Realisierung kümmern.

00:04:23

Marlies Olensky: Genau, weil: Europeana als Ganzes gibt es ja jetzt nur als Beta-Version online, momentan. Es gibt das Core-Europeana-Projekt, dass sozusagen die Weiterentwicklung dieser Beta-Version vor Augen hat und dann eben EuropeanaConnect mit den technischen Details beziehungsweise ... kann man das Sagen? Keine Ahnung, mir fallen Zuckerln ein, aber das versteht ja keiner...

00:04:50

Maria Gäde: Also EuropeanaConnect soll eigentlich dafür sorgen, dass Europeana am Ende der Projektlaufzeit auch funktioniert. So was wie ein mobiler Zugang, multilingualer Zugang, semantischer Zugang...

00:05:02

Marlies Olensky: ... beschäftigt sich ja auch mit der Lizenzierung der verschiedenen Objekten beziehungsweise den Formularien, die lizenziert werden müssen. Das rechtlich also alles abgeklärt ist, da gibt es auch ein Work Package zu.

00:05:16

LIBREAS: Ihr habt ja zwei Work Packages. Vielleicht können wir nochmal kurz die unterschiedlichen Ansätze besprechen? Vielleicht fangen wir mit der Multilingualität an, weil das ist ja ein spannendes Thema. Wenn ich das richtig verstehe, soll die Europeana sowohl multilingual zugänglich sein als auch multilingual arbeiten, also tatsächlich auf die Daten zugreifen und sie übersetzen. Das klingt schon nach Problemen, wollt ihr die nochmal schildern?

00:05:39

Juliane Stiller: Ja, also das Work Package beschäftigt sich mit dem multilingualen Zugang zu den Daten. Da gibt es halt verschiedene Ansätze oder verschiedene...

00:05:49

Maria Gäde: ... Ebenen der Multilingualität. Also die elementarste Ebene ist eigentlich die Interfacesprache. Das ist ja letztendlich auf fast allen Interfaces inzwischen der Fall, dass man seine eigene Sprache wählen kann. Was für uns aber wichtiger ist, ist die multilinguale Suche, dass bedeutet eigentlich einen barrierefreien Zugang zur Europeana: in der eigenen Sprache anfragen und eben in allen Sprachen, die Europeana unterstützt, dann letztendlich Ergebnisse zu bekommen. Und dann ist natürlich auch nochmal auf der Ergebnisliste - gibt es noch mal diese Übersetzungsebene. Da kann man nochmal unterscheiden zwischen der Dokumentenübersetzung, falls man jetzt ein Dokument hat, oder aber der Übersetzung der Schlagwörter, was eigentlich unser Ansatz ist. Europeana hat ja zum sehr großen Teil Bildmaterial. Bildmaterial ist ja nun eigentlich in keiner Sprache vorhanden, sondern nur Schlagwörter sind in einer Sprache vorhanden. Und das also schon in einem vorhergegangenen Prozess diese Schlagwörter letztendlich so multilingual gestaltet werden das derjenige die Chance hat, diese Schlagwörter in den Sprachen, die er kann oder denen er mächtig ist, dann auch zu sehen.

00:07:06

LIBREAS: Und die Sprachen sind die, die in der Europäischen Union gesprochen werden?

00:07:09

Maria Gäde: Also das erklärte Ziel sind die 26 Sprachen. Im Moment sind wir gerade bei sechs Kernsprachen, wo wir uns dann drüber freuen, wenn die dann so funktionieren, wie wir das gerne hätten.

00:07:20

Juliane Stiller: Die Sprachen sind Englisch, Deutsch, Italienisch, Spanisch, Polnisch und Französisch.

00:07:28

Maria Gäde: Also bei der Übersetzung von Suchanfragen: Das ist eine ganz schwierige Sache. In der Regel tippt ja ein Nutzer keinen Satz ein, sondern vielleicht ein Wort, vielleicht zwei. Bei Eigennamen ist das schon mal ein Problem, also welche Sprache ist Peter Pan? Oder Apple-Computer - da muss das System eigentlich schon erkennen, dass das letztendlich nicht zu Übersetzen ist mit Apfel und Computer, sondern als eine Einheit gesehen werden muss. Und dann ist ja auch die Mehrdeutigkeit ohnehin schon ein Problem und dann, wenn man noch anfängt zu Übersetzen, ein weiteres Problem: Avocate zum Beispiel, ein französisches Wort, kann man entweder Übersetzen zum Anwalt oder zur Frucht. In welche Übersetzung geht man? Dass heißt man muss diese Mehrdeutigkeit dann entweder verdeckt versuchen aufzulösen oder den User fragen: Was meintest du eigentlich?

Ein anderer Ansatz wäre natürlich auch - um die Erkennung der Sprache zu umgehen, also dass das System erstmal die Sprache erkennen muss - den Nutzer gleich zu fragen: In welcher Sprache fragst du den an? Das macht zum Beispiel CACAO. [3]

00:08:32

Juliane Stiller: CACAO ist ein Vorläuferprojekt und die haben einen Demoversion zugänglich unter www.cross-library.com. Dort kann man anschauen, wie zum Beispiel mehrsprachiger Zugang zu Bibliotheksbeständen realisiert werden kann oder realisiert ist. Und die machen das innerhalb von sechs Sprachen. Dort wird der User gebeten, anzuklicken in welcher Sprache seine Suchanfrage ist. Das macht es natürlich für das System sehr viel einfacher, als wenn man bestimmen muss, welche Sprache das ist.

00:09:11

LIBREAS: Aber wir können ja kurz in die Technik gehen. Also welche Modelle benutzt ihr denn, also favorisiert ihr oder habt ihr schon verworfen? Benutzt ihr zum Beispiel Wörterbücher bei den Übersetzungen? Arbeitet ihr mit semantischer Suche?

00:09:24

Juliane Stiller: Also das ist zum Beispiel ganz unterschiedlich. Da gibt es unterschiedliche Ansätze. Wir haben ja zwei kommerzielle Partner, also Xerox und Celi, und die beschäftigen sich auch damit. Die sollen auch ein Language-Resource-Repository - also ein Repositorium für Sprachressourcen - anlegen. Festgelegt haben wir uns, glaube ich, noch nicht.

00:09:47

Maria Gäde: Das ist auch sprachabhängig, zum Teil. Es kommt darauf an, welche Ressourcen uns zur Verfügung stehen. Das heißt nach dem Ende des Projektes muss das ja auch alles funktionieren. Wir haben jetzt ein paar Ressourcen, mit denen man ganz gut arbeiten kann, die aber lizenziert sein müssen, die wir versuchen mit OpenSource-Ressourcen zu ersetzen. Die müssen erstmal getestet werden, wie die Qualität ist. Aber im Prinzip - für das Bestehen des Projektes brauchen wir dann letztendlich OpenSource-Ressourcen, die wir dann benutzen können, auch nach der Laufzeit des Projektes.

00:10:22

Marlies Olensky: Und da liegt es auch in Verantwortung der Europeana-Foundation, nein wie heißen die genau? Europeana-Office in Den Haag, also die zentrale Stelle, die das Projekt und den Projekt-Cluster drumherum koordiniert - an denen ist es auch, sich um die Lizenzierung dieser Language-Resources zu kümmern. Das ist nicht im Work Package selber verankert.

00:10:54

LIBREAS: Bis wann ist das überhaupt geplant? Ihr sagt immer Projektende.

00:10:58

Juliane Stiller: Projektende ist Oktober 2011.

00:11:03

Marlies Olensky: Allerdings ist, wie gesagt, der erste Prototyp schon online. Jetzt für den Sommer [2010] ist die Version 1 geplant. Und dann kommt ein weiteres Update im Sommer 2011.

00:11:17

Juliane Stiller: Und für jede Version sollen dann praktisch die Fortschritte, die in EuropeanaConnect gemacht wurden, implementiert werden.

00:11:24

LIBREAS: Vielleicht kommen wir dann zur Semantischen Suche, das ist ja dann dein Themenfeld. Willst du es kurz einführen? What it is?

00:11:32

Marlies Olensky: Gut. Die Semantische Suche in Europeana. Es geht einerseits darum, so wie eigentlich auch schon bei der Multilingualität, zu erkennen: Wonach sucht der User jetzt eigentlich? Wenn er jetzt "Paris" eintippt: Ist das die Stadt Paris? Ist es die Person Paris? Und was biete ich dem User dann für Ergebnisse an? Sind das nur ortsbezogene Bilder? Ist Paris irgendwie enthalten, auf dem Photo, in dem Dokument?

00:12:06

Maria Gäde: Das ist immer so das Problem: Also es gibt so ganz wenig Mittelwerte. Entweder ist das System total auf User ausgerichtet. Das bedeutet aber auch, dass der User eine ganze Menge machen muss. Oder aber man verbirgt alles und macht ihn dann zum unmündigen Nutzer. Wir versuchen irgendwie so einen gesunden Mittelweg zu finden zwischen dem User nicht zu viel zuzumuten und ihm aber schon zu zeigen, was eigentlich passiert.

00:12:42

Marlies Olensky: Also was wir im Workpackage 1 mit der Semantischen Suche beziehungsweise mit dem Erstellen der semantischen Datenschicht machen wollen, ist eben, genauso wie bei der Multiligualität, herauszufinden, was der User eigentlich mit der Eingabe seiner Keywords meint. Ist es Paris als Ort, ist es Paris als Person? Welche Dokumente erwartet sich der User dahinter? Sind das zum Beispiel Gemälde, die Paris im Titel enthalten oder einfach nur einen Ausschnitt, zum Beispiel Montmartre, als Gemälde darstellen? Oder eben zum Beispiel der Raub der Helena, wo Paris beteiligt war.

Was wir eben jetzt dahinter machen müssen ist das Technische, die Datenquellen sozusagen zusammenbringen. Also zum einen geht es darum, die Vokabularien mit denen die Objekte, also die Metadaten, verschlagwortet sind, zu verbinden. Und zum anderen eben zu Schauen, dass in den Metadaten der Objekte dann auch die Links zu diesen Vokabularien vorhanden sind. Einerseits geht's darum, interne Vokabularien von den Museen und den Bibliotheken zu verwenden und das Ganze dann aber auch für allgemeingültige, wie zum Beispiel den - vom Getty-Institut - den geographischen Thesaurus [4] zum Beispiel zu verwenden oder eben die Union List of Artists Names, dem ULAN. [5] Und da sozusagen die Tür zu öffnen zur Multilingualität, weil das dann einfacher ist zu Übersetzen, in Thesauri, die auch allgemein gültig sind, einfach. Beziehungsweise über diese Vokabularien zwischen den unterschiedlichen Institutionen und den Keywords Verbindungen herzustellen.

00:14:42

LIBREAS: Ja. Aber ihr arbeitet nicht mit einem vollständig neuen Thesaurus, den ihr zusammen bastelt, sondern ihr nehmt - sondern, genauso wie bei den Daten, nehmt ihr den von den einzelnen Institutionen?

00:14:53

Marlies Olensky: Genau, richtig. Wir verwenden da als Datenstandard oder Datenformat zur Darstellung vom Thesaurus SKOS. [6] Die werden also sozusagen SKOS-offiziert, die Vokabularien und dann mit den Begriffen "exact macht", "related term" und so weiter verbunden.

00:15:23

LIBREAS: Da drängt sich ja die Frage auf: Kriegt man da nicht einen gänzlich unterschiedliche Datenqualität und auch Datenansetzung?

00:15:28

Marlies Olensky: Unterschiedliche Datenqualität: damit müssen wir leben. Weil einfach die Daten aus unterschiedlichen Communities kommen. Sie sind heterogen, sowieso schon mal. Die Institutionen arbeiten auch mit unterschiedlichen Datenformaten. Manche können ihre Daten nur in MARC 21 als Export zur Verfügung stellen. Aber da ist dann auch - wir haben da den Projektpartner in Amsterdam, die Freie Universität Amsterdam, [7] die technisch sehr fit sind. Und auch die Technische Universität in Athen, [8] die da Algorithmen entwickelt haben um einerseits zu erkennen, wenn Schlagworte im Thesaurus das Gleiche bedeuten und diese zu verbinden, also das es da keine Doubletten gibt, redundante Informationen. Beziehungsweise an der Universität in Athen wird vor allem mit dem sogenannten Fuzzy-Matching gearbeitet, dass sozusagen Ähnlichkeiten erkannt werden und dann die Thesauri verbunden werden können.

00:16:38

LIBREAS: Es gab im Bibliothekswesen, aber auch in anderen Bereichen auch immer die Diskussion darum, ob man auch nicht text-basiert Suchen kann. Es gab ja immer wieder Ansätze: Graphische Suche oder Repräsentation von Daten zumindest. Arbeitet ihr damit auch?

00:16:54

Marlies Olensky: Momentan ist es so, also... ein Teil von dem Work Package beschäftigt sich auch damit, was User sich erwarten von der Suche und wie sie gerne suchen möchten. Da sind wir jetzt gerade erst dabei herauszufinden, was das denn ist. Für die ersten zwei Updates, die jetzt noch abgedeckt sind, kann ich jetzt schon sagen, dass es sich technisch nicht auswirken wird, so eine graphische Repräsentation auch mit rein zu bringen. Was wir schon machen wollen ist, dass der User die Möglichkeit hat zu browsen, anhand von Facetten. Aber ob da eine graphische Repräsentation dabei ist? Glaube ich eigentlich nicht. Da reicht einfach die Zeit nicht, um das umzusetzen.

00:17:36

LIBREAS: Aber, wisst ihr denn schon, was die User ungefähr wollen?

00:17:42

Marlies Olensky: Nein. Also wir haben jetzt erst gerade angefangen. In einem ersten Schritt werden wir herausfinden, was Experten sich davon erwarten, weil wir glauben, dass die einfach nochmal besser einschätzen können... also ihr Suchverhalten einschätzen können und wir ihnen dann sozusagen mit Europeana zeigen, was möglich wäre mit semantischer Suche und die uns dann sagen, was für ihre Forschungsfrage, die sie da jetzt gerade bearbeiten, hilfreich wäre.

Aufgrund dessen soll technisch dann aber umgesetzt werden: Ist jetzt am allerwichtigsten, dass das Suchwort gleich bei der Eingabe der Suche identifiziert wird - was ist damit gemeint? Oder geht es hauptsächlich darum, bei der Präsentation der Resultate das in einer schönen Landkartenform oder irgendwelchen statistisches Auswertungen zu machen. Beziehungsweise auch so eine kleine Box zu haben: Hast du auch danach gesucht? Oder: Hast du eigentlich das gemeint? Sozusagen auch verwandte Suchbegriffe dann auch mit abzufragen und dem User vorzuschlagen.

00:18:58

LIBREAS: Ihr habt das vorhin ja schon erwähnt, dass Europeana nicht nur den Ansatz hat ein Produkt zu sein, dass dann auf einer Seite erreichbar ist, sondern tatsächlich auch offene Schnittstellen bieten soll - so steht es ja in dem Arbeitsdraft drin. Werden den diese Schnittstellen... also, könnt ihr schon sagen, wie die ungefähr sein werden? Ich frage mich, ob nicht auch solche Schnittstellen die Möglichkeit bieten... also, wenn man eine solche Schnittstelle hat und weiß, man ist ja ein Museum, in Frankreich, dann kann man das ja schon vordefinieren, dass die meisten Menschen Französisch sprechen und einen musealen Thesaurus benutzen werden.

00:19:29

Marlies Olensky: Soweit sind wir leider noch nicht.

00:19:33

Maria Gäde: Das würde ich aber nicht machen, weil die ganzen Nutzerstudien eigentlich klar gezeigt haben, dass die virtuellen Besuche von internationalen Besuchern auf solchen Homepages ganz stark angestiegen sind. Das heißt: die Leute, bevor sie ins Land fahren und sich ein Museum angucken oder was auch immer, gehen erstmal auf die Seite und suchen dort. Das soll auch einen ganz starken Anreiz für diese Museen, Archive und so weiter geben, dass sich die Leute also schon im Voraus informieren können, was sie eigentlich suchen.

Das ist ja auch eigentlich eine Herausforderung von Europeana, dass es ein sehr breites Publikum ansprechen soll. Das man sowohl den Schüler hat, der jetzt vielleicht ein Referat zusammenstellt. Da ist das Ziel einfach jetzt sehr weitreichende Features zu haben, dass man also dort schon eigentlich die Chance hat, sein Referat zusammen zu stellen, indem man die verschiedenen Sachen, die man einbinden, gleich zu so was wie einer Präsentation zusammen fügen kann. Auch für Lehrer zum Beispiel die dort mit ihren Schülern arbeiten können. Aber genauso der Tourist oder der Professional oder der Bibliothekar, der...

00:20:46

Marlies Olensky: ... oder der Forscher, der im Büro seine Forschungsfragen mithilfe von Europeana beantworten möchte und sich vielleicht auch mal vorinformiert, bevor er dann in das Land reist, um sich bestimmte Objekte dann genauer anzusehen.

00:21:02

LIBREAS: Der Erfahrung nach, die ihr bisher gemacht habt: Sind das eigentlich unterschiedliche Suchkulturen und Aufbereitungskulturen von Daten, nicht nur in den einzelnen unterschiedlichen Institutionen, sondern auch in den unterschiedlichen Regionen in Europa? Weil, das ist ja auch eine Frage: geht man von einem Gesamteuropäer aus oder einer Gesamteuropäerin, bei den Nutzerinnen und Nutzern? Oder hat man unterschiedliche kulturelle Präferenzen?

00:21:24

Juliane Stiller: Hat Europeana nicht, würde ich sagen. Wir gehen davon aus, dass es einen... Es werden Nutzergruppen unterschieden, aber keine kulturellen Kreise. Eventuell noch verschiedene Kontexte, wie museale Objekt oder Bibliotheksobjekte, die dann natürlich einen anderen Fokus haben in den Metadaten.

00:21:46

Marlies Olensky: Das Einzige, was Europeana schon noch macht bei den Nutzergruppen ist: Also es gibt ein eigenes Work Package, dass sich nur mit den Usern beschäftigt. Und die haben eben versucht, die unterschiedlichen Usergruppen zu unterteilen, die Maria jetzt schon angesprochen hat. Und die haben natürlich schon darauf geachtet, dass es jetzt eine geographische Verteilung da gibt, damit schon ein europäisches Bild entsteht. Aber es ist jetzt nicht direkt in Europeana ersichtlich bei der Suche oder sonst wie, dass da speziell jetzt eingegangen wird auf spezielle Regionen.

00:22:22

Juliane Stiller: Aber es ist jetzt eine interessante Frage, weil: Ich weiß nicht, ob sich jemand schon mal die Metadaten angeguckt hat, ob die sich kulturell unterscheiden, ob sie jetzt aus Frankreich kommen oder aus Litauen.

00:22:34

LIBREAS: Wenn ich das jetzt richtig verstanden hab gab es doch auch - ich weiß nicht in welchem Jahr, aber während der Laufzeit des Europeana-Projektes - schon, das - ich glaub Ungarn, oder zumindest ein Land - in Abrede gestellt hat, dass bestimmte Objekte die eingestellt wurden, Bilderdaten von Kinderheimen, dort repräsentiert werden dürfen.

00:22:53

Marlies Olensky: Das war Rumänien.

00:22:54

LIBREAS: Das war Rumänien? Okay. Wie geht man den bei Europeana damit um? Wird es unterschiedliche Ansichten geben für die unterschiedlichen Länder? Ignoriert man das einfach im Sinne der Informationsfreiheit? Oder ist das eine politische Frage, die technisch überhaupt nicht angegangen wird?

00:23:11

Juliane Stiller: Also, wir beschäftigen uns einfach gar nicht damit.

00:23:17

Marlies Olensky: Ich habe jetzt... vor zwei Tagen hatten wir ein großes Meeting in Berlin, wo ich das erste Mal von diesem Fall gehört habe. Also ich wusste davor noch gar nicht, dass so etwas passiert ist. Deswegen: es läuft alles auf dieser Ebene im Europeana-Office ab, dass ich schon erwähnte, dass sich in Den Haag mit der Koordinierung beschäftigt. Dass heißt, dass wissen wir eigentlich gar nicht.

00:23:43

Maria Gäde: Ich denke aber, dass der Ansatz eher der sein wird, dass Europeana ein Projekt ist, das nicht auf einzelne Probleme eingehen kann. Sowohl technisch als auch politisch. Und da keine Unterschiede machen wird.

00:24:00

LIBREAS: Was problematisch sein könnte ist, dass ja einzelne Institutionen sich da nicht mehr repräsentiert sehen könnten, wenn sie da teilnehmen. Also das die Bibliotheken als Ganzes zum Beispiel Angst davor haben könnten, dass die bibliothekarischen Daten, die sie ja immer als sehr qualitätsvoll ansehen und wo sie sehr viel Zeit reinstecken, jetzt auf einmal reduziert werden, also neben andere Daten gestellt werden.

00:24:20

Marlies Olensky: Nein, das ist nicht der Fall. Es ist so, dass dadurch, dass wir auf die Originalobjekte verlinken, sichergestellt wird, dass immer der Konnex zur Originalinstitution bleibt. Da besteht keine Gefahr. Zum anderen, zu den Metadaten, die wir bekommen von ihnen: Es werden auf alle Fälle die Originalmetadaten erhalten bleiben und es gibt dann einfach ein Datenmodell, das besagt, dass eigene Files erstellt werden, wo dann Europeana das "semantic enrichment" macht, also sozusagen die semantische Anreicherung, die Verbindung zu verschiedenen Vokabularien, zu anderen Objekte. Und das ist dann ein eigenes Europeana-Objekt, wo Europeana dann die Rechte drauf hat. Und daneben, mit Verlinkung natürlich, bestehen die Originalmetadaten weiter.

00:25:19

Juliane Stiller: Und um das Objekt im Kontext zu sehen, muss der User immer auf die Institution gehen, die das Objekt zur Verfügung stellt. Also: um das Bild in voller Größe sich anzeigen zu lassen, verlässt er praktisch auch die Europeana-Domain.

00:25:36

LIBREAS: Da stellt sich aber auch noch die Frage: Also, dass Europeana sich auf die EU bezieht ist ja auch eine politische Frage. Gibt es da technische Gründe für? Also, könnte man das Projekt nicht auch anderswo einsetzen? Also ihr arbeitet ja mit OpenSource-Produkten, so weit es möglich ist. Dass heißt wenn ihr euch an die Lizenzen haltet müsstet ihr auch OpenSource sein. Dass heißt ich könnte das auch einfach nehmen und in Afrika aufsetzen?

00:25:57

Marlies Olensky: Definitiv.

00:25:57

Juliane Stiller: Theoretisch schon. Klar.

00:25:59

Marlies Olensky: Das ist eine politische Frage. Nachdem wir EU-finanziert sind ist es für die Europäische Union und beschränkt sich auch darauf.

00:26:10

LIBREAS: Ja, genau. Aber es stellt sich ja auch die Frage, ob da nicht ein Kern gebildet wird, der quasi für die digitale Weltbibliothek ... also, ob da ein Kern für eine digitale Weltbibliothek gelegt wird. Weil es gibt ja immer die Kritik daran, dass Google nicht die digitale Weltbibliothek ist, sondern das da mehr hinein muss. Da stellt sich ja die Frage: Bietet nicht die Europeana oder irgendjemand anders da ein Grundmodell?

00:26:31

Marlies Olensky: Das ist auch das, was wir gemeint haben mit: Europeana kann sozusagen Features zur Verfügung stellen. Nicht nur sozusagen den Zugang zu den Objekten, sondern auch die Technologie, die dahinter steht. Also das ist prinzipiell möglich. Sicher nur eine politische Entscheidung.


Fußnoten

[1] http://www.europeanaconnect.eu/

[2] http://www.europeana.eu/

[3] http://www.cacaoproject.eu/

[4] http://www.getty.edu/research/conducting_research/vocabularies/tgn/

[5] http://www.getty.edu/research/conducting_research/vocabularies/ulan/

[6] http://www.w3.org/2004/02/skos/

[7] http://www.vu.nl/nl/index.asp

[8] http://www.ntua.gr/

mehr: Podcasts | Preprints | E-Doc-Archiv | Weblog | Twitter

English | Kontakt | Impressum