Metadaten modellieren und Schnittstellen nutzen 1/2
Nachdem wir beim letzten Unterrichtsblock bereits zum ersten Mal eine OAI-PMH Schnittstelle betrachtet und damit gearbeitet haben, schauen wir uns heute noch etwas mehr Theorie zu Schnittstellen und Austauschformaten von Metadaten an und setzen das anschliessend bei den installierten Programmen in die Praxis um.
wo stehen wir?
Angekommen bei den Schnittstellen, im Schaubild OAI-PMH, werden wir heute mittels VuFindHarvest Daten aus den installierten Programmen herunterladen und in den jeweiligen Metadatenformaten ausgeben. Anschliessend werden wir die Metadaten-Dateien in MARC21-XML konvertieren (ausser bei den Koha-Daten, diese sind bereits in diesem Format), dazu verwenden wir marcEdit (XSLT).
Theorie Schnittstellen
Im Bibliotheks- und Archivbereich gibt es diverse Austauschprotokolle (Schnittstellen). Die drei bekanntesten
-
Z39.50 wurde bereits 1984 initiiert und dann ab 1990 durch die Library of Congress weiterentwickelt. Z39.50 ist ein sehr alter Standard, um diesen heute noch einsetzen zu können braucht man alte Software. Als Nachfolger des Z39.50-Protokolls wurde SRU entwickelt.
-
SRU ist ein technischer Standard für Suchanfragen (Search/Retrieve via URL), welche als moderne Weiterentwicklung des Z39.50-Protokolls. Das Protokoll wurde ebenfalls von Library of Congress entwickelt. SRU basiert auf etablierten Internet-Standards wie URI und XML.
-
OAI-PMH wurde von der Open Archives Initiative entwickelt. Das OAI Protocol for Metadata Harvesting (OAI-PMH, engl.) dient dem Einsammeln und Weiterverarbeiten von Metadaten. Bei einer OAI-PMH-Schnittstelle spricht man von Daten harvesten, das ist der Fachbegriff, der beim Abgreifen oder eben Ernten von Daten mittels OAI-PMH verwendet.
Praxis VuFindHarvest
Die Installation von VuFindHarvest war mit der geführten Anleitung in Webex ohne Schwierigkeiten umsetzbar. VuFindHarvest besitzt keine grafische Oberfläche, sondern wird mittels Shell-Befehlen ausgeführt.
Für das Harvesten wird in der Shell nun pro Abfrage in einem System nur ein Befehl eingegeben, dieser beinhaltet den die URL, über welche die Schnittstelle erreichbar ist, das Metadatenformat, das geholt werden soll, sowie das Verzeichnis, in welchem die Daten anschliessend abgespeichert werden. Die Daten, die wir abgreifen haben, mussten in unterschiedlichen Verzeichnissen gespeichert werden, dies weil wenn die Dateien dieselben Namen haben, sie einander überschreiben.
Wenn die Daten dann über die Schnittstelle heruntergeladen wurden, kann man sie im Verzeichnis von VuFindHarvest als Dateien finden. Zusätzlich zu den Dateien erstellt VuFindHarvest jeweils noch eine Log-Datei, wo der Zeitstempel gespeichert wird.
Crosswalks
Wir werden nun die heruntergeladenen Datensätze in den MARC21-XML Standard überführen. Crosswalk (in Deutsch Zebrastreifen) beschreibt den Prozess, wie man einen Metadatenstandard in einen anderen überführt. Das führt teilweise zu Verlusten, da die Metadatenstandards unabhängig voneinander entstanden und spezifiziert sind.
Um den Crosswalk vornehmen zu können müssen zuerst Regeln geschaffen werden, wie die Felder und auch die Inhalte möglichst verlustfrei konvertiert werden sollen, dies nennt man auch Mapping. Als Beispiel von Dublin Core zu MARC21: In Dublin Core (DC) existiert das Feld title, dieses muss dann dem entsprechenden Feld in MARC21 zugeordnet werden, in diesem Beispiel 245a. Dabei entstehen bereits die ersten Schwierigkeiten, die gleich aufzeigen, weshalb ein Crosswalk nicht immer verlustfrei durchgeführt werden kann: In DC gibt es nur ein Feld für den Titel, in MARC21 gibt es den Haupttitel 245a aber auch den Untertitel in 245b. Damit dieses Mapping nicht jedes Mal von Neuem aufgesetzt werden muss, gibt es bereits Standards und Empfehlungen für das Mapping von bestimmten Metadatenstandards in andere. Z.B. von Library of Congress.
Quellen
- Wikipedia, Search/Retrieve via URL (SRU), 2021. Zugriff unter: https://de.wikipedia.org/wiki/Search/Retrieve_via_URL
- Wikipedia, Z39.50-Protokoll, 2022. Zugriff unter: https://de.wikipedia.org/wiki/Z39.50
- Wikipedia, Open Archives Initiative, 2020. Zugriff unter: https://de.wikipedia.org/wiki/Open_Archives_Initiative