Katalogdatenexport für EBSCO Discovery Service

Aus Admin Kuhn GmbH
Zur Navigation springen Zur Suche springen

Der EBSCO Discovery Service / EDS ist eine Metasuchmaschine für Datenbanken und Bibliothekskataloge der US-amerikanischen Firma EBSCO Publishing, welche einen Index über 300 fortlaufende Literaturdatenbanken und Volltextdatenbanken mit mehreren tausend Titeleinträgen von Zeitschriften und Magazinen als kostenpflichtige Abonnements anbietet.

Die Abonnenten von EDS sind oft Bibliotheken - diese können auch ihre eigenen Katalogdaten in den EDS-Index hinzuladen, sodass über diesen Index dann also nicht nur die abonnierten Datenbanken, sondern auch die Bibliotheksbestände unter einer Oberfläche durchsuchbar sind. Nach einem Urladen sämtlicher Katalogdatensätze kann die Aktualisierung der eigenen Katalogdaten auf zwei Arten stattfinden:

  • Vollständiges Laden: Nachdem die bereits vorhandenen Daten gelöscht werden, werden erneut sämtliche Katalogdaten in den EDS-Index geladen.
  • Inkrementelles Laden: Es wird zwischen neuen, geänderten und gelöschten Datensätzen unterschieden. Neue Datensätze werden zum EDS-Index hinzugefügt, geänderte Datensätze überschreiben die bereits vorhandenen. Im Bibliothekskatalog gelöschte Datensätze werden ebenfalls aus dem Index gelöscht.

Im Sommer 2016 entwickelte die Admin Kuhn GmbH für zwei SISIS-Sunrise-Bibliotheken Routinen für die automatische Durchführung beider möglichen Ladevorgänge. Dabei werden kurz gesagt folgende Schritte durchgeführt:

  • Die in SISIS-Sunrise im bibliografischen Datenformat SISIS-MAB vorhandenen Katalogdaten werden mittels ENTLMASS über den (eigentlich für Touchpoint gedachten) Exportkonverter "SisisToMarcJeromeXml" im Format MARCXML entladen.
  • Aufgrund inhärenter Fehler von ENTLMASS bzw. des Konverters "SisisToMarcJeromeXml" wird nicht in jedem Fall korrektes XML erzeugt - fehlerhafte XML-Datensätze werden deshalb künstlich "geheilt", um die Wohlgeformtheit der Datensätze sicherzustellen. Der EBSCO Discovery Service würde den Ladevorgang sonst beim ersten vorkommenden XML-Fehler abbrechen und alle weiteren Datensätze also nicht laden. Im Fall von Touchpoint ist es sogar so, dass überhaupt kein Datensatz geladen wird, wenn die XML-Daten auch nur einen Fehler enthalten.
  • Doppelte Überprüfung der nun entladenen und bereinigten XML-Datensätze auf wohlgeformtes XML.
  • Komprimierung der XML-Datensätze.
  • Übertragung der komprimierten XML-Datensätze auf den FTP-Rechner von EBSCO Publishing. Von dort aus werden sie dann einmal im Tag automatisch in den EDS-Index geladen.

Vollständiger Katalogdatenexport

Die Fachhochschule Bielefeld besitzt rund 320'000 Katalogdatensätze. Zwar werden natürlich jeden Tag nur vergleichsweise wenige Katalogdatensätze neu aufgenommen, geändert oder gelöscht. Das vollständige Entladen erzeugt Datensätze, in denen alle Titel-, Exemplar- und Normdaten vollständig enthalten sind. Da das Entladen mittels ENTLMASS bloss rund vier Stunden dauert und also in einer Nacht durchführbar ist, wurde entschieden, den EDS-Index täglich über die vollständigen Katalogdaten zu aktualisieren.

Die Katalogdaten werden dabei


Inkrementeller Katalogdatenexport

Universitätsbibliothek Bochum





Weblinks

https://help.ebsco.com/interfaces/EBSCO_Discovery_Service/EDS_Catalogs_IRs/EDS_Custom_Catalog_Overview_Instructions