Liebes Tagebuch,

Zwischenstand

Heute wollen wir auch die OAI-PMH-Schnittstellen von unseren lokal installierten Systemen Koha und ArchivesSpace abrufen und dann bearbeiten wir die Daten mit MarcEdit. Ich bin gespannt und motiviert!

Wir machen heute Crosswalks Mit Crosswalks sind gemeint Datenformate zu ändern. Wir wollen Metadatenformate von einem Format in ein anderes Metadatenformat bringen. Zum Beispiel Dspace von dublin core zu xml machen.Crosswalks brauchen Regeln, z.b. EAD in Marc21 zugeordnet werden können, ist ein Metadatastandard in XML Format. wir machen heute folgende Crosswalks:

  • EAD (Archive Spaces) –> in MARC21
  • MARC21 —>in MARC XML
  • DUBLIN CORE (dspace) –>in MARC21
  • (Koha ist schon in Marc21 darum muss man dort nichts machen)

EAD für Archive MARC21 für Bibliothek Es ist nicht so einfach EAD in MARC21 verlustfrei zu importieren!

Alternative: anstatt Crosswalks gibt es auch noch XSLT: das ist eine Programmiersprache zur Transformation von XML-Dokumenten (W3C Empfehlung, 1999) XSLT.

Wie man Dublin Core (DC) in Marc 21 konvertieren kann: Kein Problem wär es Marc 21 in Dublin Core- Felder zu bringen, es hat viele gemeinsame Felder. Aber von Dublin Core in Marc 21 ordnen, bereitet Probleme beim Mapping. Dublin Core hat 1000 solche Kernfelder und Marc 21 hat nur 12 Felder. Wenn jetzt von 1000 Felder auf 12 Felder dann gäb es ja Probleme diese in in nur 12 Felder einzuwängen! Von Dublin Core zu Marc 21 geht daher nicht gut. In Dublin Core Namenfeld und marc 21 würde dann Familienname und Vorname und so ändern, dann müsste man jedes Mal entscheiden.Erfahrung von Dozenten: man findet zwar fertige Crosswalks, aber man muss Daten anschauen und prüfen. In welches Feld kommt dann bei MARC21 der Titel, dann wäre es 245 a aber muss in Spezifikaton nachlesen, kann ich anhand eines Trennzeichens eines Punkt das in 245 a (titel) und 245b (untertitel) aufteilen oder kann gar nicht trennen?

Autor wäre bei Marc 21 —> 100a

Bei so einem Mapping gibt’s eben dann die Probleme oder man könnte ein Excel machen,und dann alles so zuordnen. Gibt so Regeln auch auf W3C, in Skriptsprache.

Darum gibt es eben Software wie die von Marc Edit, welche hilft beim Mapping, um die Crosswalks zu bewerkstelligen.

VU FIND HARVESTER-Ernten von koha und archive space mit dem vufind harvesting

STROMAUSFALL: Weil ich am Morgen früh aufgestanden bin und plötzlich einen Stromausfall hatte, habe ich den Anschluss verpasst, weil der Elektriker kam und dann erst um ca. 8.45 Uhr ich wieder Strom hatte, da ich einen Kurzschluss hatte. Zum Glück half mir Hr. Lohmeier beim “Harvesting” der KOHA eigenen Metadaten und den ArchivesSpace eigenen Metadaten. Vielen Dank nochmals für die Hilfe von Hr. Lohmeier!

Theorie zu Austauschprotokolle für Metadaten (OAI-PMH, SRU)

  • Z39.50 (Library of Congress) –> ist sehr alt, aber immer noch im Einsatz als Ergängzung zum SRU
  • SRU - Search/Retrieve via URL (Library of Congress)–> Live-Abfragen, gute Parameter
  • OAI-PMH - Open Archives Initiative Protocol for Metadata Harvesting (Open Archives Initiative) —> eignet sich für viele Parameter, grössere Datenabzüge, Aktualisierungen Das Praktische an SRU und OAI-PMH ist, dass die Anfragen als Internetadresse (URL) zusammengestellt werden können und direkt über den Browser (unser localhost) ohne Zusatzsoftware aufrufbar sind.
  1. Zuerst musste man die Schnittstellen von KOHA und Archive Space wieder aufrufen überOAI-PMH Endpoints

  2. Wichtig war es diese Änderungen der example Server umwandeln das heisst auf “bin meine schule” …umzuändern, und auch ansonsten wäre es nicht möglich gewesen cd ~/vufindharvest-4.1.0 php bin/harvest_oai.php –url=http://example.com/oai_server –metadataPrefix=oai_dc my_target_dir

  3. Dann musste ändern auf “binmeine Schule” und auch die Endungen also bei koha auf marc xml und beim archive space auf oai ead umbenennen

bin endungen umbennen

  1. danach wurde der VU-Find Harvester 4.1.0 installiert

63 packete u bin harvest

  1. Ernte / Harvesting machen im Vu Find

Hier die Ernte aus dem KOHA, ich erkenne die Daten wieder vufind koha harvesting

hier die einzelne Datei: Screenshot from 2021-12-02 12-10-20

AHA- Moment**Hier die aus dem Archive Spaces, auch hier erkenne ich die Metadaten wieder: vufind harvesting archive space

hier die einzelne Datei: Screenshot from 2021-12-02 12-08-58

**Installation von marc edit auf der shell zum die Crosswalks (von ead in marc21, von marc 21 zu xml, von dc in marc21 etc.) zu machen Wir wollen ja gemäss dem Schaubild der ersten Lektion alles am Schluss in Marc XML haben, um dass dann nachher ins VUFIND zu laden. offizielle Webseite

Installation von Marc Edit ging reibungslos, dann musste man noch ändern: MarcEdit konfigurieren und Slash ändern, weil Linux…

        Für die benötigten Funktionen (EAD=>MARC und OAIDC=>MARCXML):
        Im Menü “Defined Functions” die gewünschte Funktion auswählen und Modify klicken
        Unter XSLT/XQuery Path XSLT\ durch xslt/ ersetzen
        Anschließend “Save” und für nächste Funktion wiederholen

Sofern alles gut lief, kam eine Meldung mit dem Hund von dem Erfinder von Marc Edit, das fand ich amüsant!

Start Marc Edit: marceditläuft

aussicht marcedit

Hier die Übersicht von MarcEdit, ich kann einfach auswählen, welche Dateien ich die Formate konvertieren möchte: vufind harvesting übersicht

Konfigurieren mit der Beispieldatei im Format EAD in MArc21 dann in Marc xml ging soweit gut. ich wähle von EAD zu Marc 21 aus: ead zu marc start

konvertieren ead zu marc

in Format marc21 noch nicht so lesbar: Screenshot from 2021-12-02 12-04-57

von marc 21 auf marc 21 xml konvertieren: marc21 zu marc21xml

AHA-Moment: Hier das Beispiel nun in marc xml, viel lesbarer:

Screenshot from 2021-12-02 11-56-30

archivesspace von ead in marc21 und dann in marc 21 xml formatieren mit der marc edit:

ead zu marc2

auf dem Desktop habe ich sie gefunden, (man kann nur auswählen von ead in marc21 und nicht direkt in marc xml: Screenshot from 2021-12-02 12-40-53

nun mache ich sie von marc21 in marc xml:

so sieht es dann aus, ist auch lesbar, und ich erkenne sie wieder Screenshot from 2021-12-02 12-47-10

Anmerkung: Daten von dspace von Format dublin core in marc 21 ändern, ging nicht, warum? dublincore zu marc

Tschau liebes Tagebuch!