Koha/Migration der Bibliothek des Wissenschaftsparks Albert Einstein in Potsdam von SISIS-Sunrise zu Koha: Unterschied zwischen den Versionen

Aus Admin Kuhn GmbH
Wechseln zu: Navigation, Suche
 
Zeile 18: Zeile 18:
 
Aufgrund der internationalen Nutzerschaft des Wissenschaftsparks wurden in Koha neben Deutsch auch die Sprachen Chinesisch, Englisch, Französisch, Italienisch, Russisch, Spanisch und Türkisch installiert, auf die vom Nutzer selber jederzeit umgeschaltet werden kann.
 
Aufgrund der internationalen Nutzerschaft des Wissenschaftsparks wurden in Koha neben Deutsch auch die Sprachen Chinesisch, Englisch, Französisch, Italienisch, Russisch, Spanisch und Türkisch installiert, auf die vom Nutzer selber jederzeit umgeschaltet werden kann.
  
Als Teil der Datenmigration wurden einige grundlegende Werte aus der bisherigen SISIS-Sunrise Administration nach Koha übernommen, darunter die Zweigstellen, Abteilungen, Medientypen und Benutzergruppen. Ausserdem wurde eine Reihe von Parametrierungen vorgenommen (z. B. die Verwendung des für den Wissenschaftspark gültigen ISIL DE-B103, der in den MARC 21-Titelaufnahmen automatisch als Organisationscode hinterlegt wird) und ein MARC-Framework mit allen benötigten MARC-Feldern angelegt - die MARC-Frameworks entsprechen in etwa den "Formularen" der SISIS-Sunrise Katalogisierung.
+
Als Teil der Datenmigration wurden einige grundlegende Werte aus der bisherigen SISIS-Sunrise Administration nach Koha übernommen, darunter die Zweigstellen, Abteilungen, Medientypen und Benutzergruppen. Ausserdem wurde eine Reihe von Parametrierungen vorgenommen (z. B. die Verwendung des für den Wissenschaftspark gültigen ISIL DE-B103, der in den [[MARC 21]]-Titelaufnahmen automatisch als Organisationscode hinterlegt wird) und ein MARC-Framework mit allen benötigten MARC-Feldern angelegt - die MARC-Frameworks entsprechen in etwa den "Formularen" der SISIS-Sunrise Katalogisierung.
  
 
Die weitere Konfiguration der zahlreich vorhandenen Koha-Systemparameter wird die Bibliothek mit eigenem Wissen selber durchführen.
 
Die weitere Konfiguration der zahlreich vorhandenen Koha-Systemparameter wird die Bibliothek mit eigenem Wissen selber durchführen.
Zeile 51: Zeile 51:
 
== Normdaten ==
 
== Normdaten ==
  
Die unter SISIS-Sunrise im MAB-Format vorliegenden Normdaten wurden nach der notwendigen Bereinigung und Deduplizierung in MARCXML umgewandelt. So konnten schliesslich rund 57'500 Personen-, 7'000 Körper-schafts- und 6'600 Schlagwortnormdatensätze im Format MARC 21 in Koha geladen werden.
+
Die unter SISIS-Sunrise im MAB-Format vorliegenden Normdaten wurden nach der notwendigen Bereinigung und Deduplizierung in MARCXML umgewandelt. So konnten schliesslich rund 57'500 Personen-, 7'000 Körper-schafts- und 6'600 Schlagwortnormdatensätze im Format [[MARC 21]] in Koha geladen werden.
  
 
Auf eine Umwandlung der uneinheitlichen Systematiknormdaten wurde verzichtet - stattdessen wurden die 62 normierten Werte der bibliotheksseitig aktuell tatsächlich verwendeten Systematik geladen.
 
Auf eine Umwandlung der uneinheitlichen Systematiknormdaten wurde verzichtet - stattdessen wurden die 62 normierten Werte der bibliotheksseitig aktuell tatsächlich verwendeten Systematik geladen.
Zeile 61: Zeile 61:
 
Eigentlich hätte mittels ENTLMASS (Schalter "-S") gleichzeitig ein Entladen der Exemplardaten stattfinden sollen, aufgrund eines Fehlers in SISIS-Sunrise war dies jedoch nicht möglich, sodass die Exemplardaten schliesslich mit SQL direkt aus der Tabelle "d01buch" entladen wurden.
 
Eigentlich hätte mittels ENTLMASS (Schalter "-S") gleichzeitig ein Entladen der Exemplardaten stattfinden sollen, aufgrund eines Fehlers in SISIS-Sunrise war dies jedoch nicht möglich, sodass die Exemplardaten schliesslich mit SQL direkt aus der Tabelle "d01buch" entladen wurden.
  
Über eine eigens programmierte Konverterdatei wurden die Titel- und Exemplardaten schliesslich vereinigt und in MARCXML umgewandelt. So konnten rund 88'500 Titelaufnahmen im Format MARC 21 in Koha geladen und danach mit den Normdaten verlinkt werden.
+
Über eine eigens programmierte Konverterdatei wurden die Titel- und Exemplardaten schliesslich vereinigt und in MARCXML umgewandelt. So konnten rund 88'500 Titelaufnahmen im Format [[MARC 21]] in Koha geladen und danach mit den Normdaten verlinkt werden.
  
 
== Ausleihdaten ==
 
== Ausleihdaten ==
Zeile 70: Zeile 70:
 
== Zwischenfazit ==
 
== Zwischenfazit ==
  
Die Migration der Daten des Wissenschaftsparks hat gezeigt, dass auch ein komplexer Datenbestand (ISO 8859-1, mehrere Zweigstellen, MAB, mehrstufige Titelaufnahmen usw.) innert nützlicher Frist in die von Koha verwendeten Formate (insbesondere MARC 21) umgewandelt und benutzbar gemacht werden kann.
+
Die Migration der Daten des Wissenschaftsparks hat gezeigt, dass auch ein komplexer Datenbestand (ISO 8859-1, mehrere Zweigstellen, MAB, mehrstufige Titelaufnahmen usw.) innert nützlicher Frist in die von Koha verwendeten Formate (insbesondere [[MARC 21]]) umgewandelt und benutzbar gemacht werden kann.
  
 
Eine solche Datenmigration eignet sich auch ideal dafür, um Bereinigungen des vorhandenen Datenbestands vorzunehmen (z. B. durch Deduplizierung, Vereinheitlichung, Korrekturen usw.) und so die Datenqualität zu verbessern.
 
Eine solche Datenmigration eignet sich auch ideal dafür, um Bereinigungen des vorhandenen Datenbestands vorzunehmen (z. B. durch Deduplizierung, Vereinheitlichung, Korrekturen usw.) und so die Datenqualität zu verbessern.

Aktuelle Version vom 22. Februar 2019, 01:19 Uhr

Der folgende Bericht erschien im Newsletter "Neues von Admin Kuhn (April 2015)".



Die Bibliothek des Wissenschaftsparks Albert Einstein in Potsdam mit ihren vier Zweigstellen (u. a. das Deutsche GeoForschungsZentrum GFZ) wird in Kürze von SISIS-Sunrise zu Koha wechseln. Die im Oktober 2014 begonnene Datenmigration ist bereits abgeschlossen, die Bibliothek beschäftigt sich gegenwärtig noch mit internen organisatorischen Fragen wie der Anbindung des neuen Katalogs an die Bibliothekssuchmaschine ALBERT, auf der auch das neue KOBV-Portal basiert.

Damit wird nicht nur auf ein zeitgemässes und international bewährtes Bibliothekssystem gewechselt, sondern auch die Kostensituation deutlich verbessert - da die Open Source-Software Koha kostenlos ist und Koha auch selber ausschliesslich kostenlose Open Source-Software nutzt, entfallen künftig jegliche Lizenzzahlungen für Betriebssystem, Datenbankserver und Bibliothekssystem.

Rechner und grundlegende Software

Als Grundlage für Koha dient gegenwärtig eine virtuelle Maschine mit einem Prozessor, 4 GB Arbeitsspeicher und knapp 40 GB Festplattenplatz. Darauf installiert ist das Betriebssystem Ubuntu 14.04 LTS (64-bit), welches einen kostenlosen fünfjährigen "Long Time Support" bietet und über eine einfach bedienbare Online-Aktualisierung verfügt.

Als Datenbankserver kommt MySQL 5.5.41 zum Einsatz, als Webserver für die Dienstoberfläche und den OPAC von Koha dient der Apache HTTP Server 2.4.7. Als Bibliothekssystem schliesslich wird das im November 2014 veröffentlichte Koha 3.18 verwendet.

Grundkonfiguration

Aufgrund der internationalen Nutzerschaft des Wissenschaftsparks wurden in Koha neben Deutsch auch die Sprachen Chinesisch, Englisch, Französisch, Italienisch, Russisch, Spanisch und Türkisch installiert, auf die vom Nutzer selber jederzeit umgeschaltet werden kann.

Als Teil der Datenmigration wurden einige grundlegende Werte aus der bisherigen SISIS-Sunrise Administration nach Koha übernommen, darunter die Zweigstellen, Abteilungen, Medientypen und Benutzergruppen. Ausserdem wurde eine Reihe von Parametrierungen vorgenommen (z. B. die Verwendung des für den Wissenschaftspark gültigen ISIL DE-B103, der in den MARC 21-Titelaufnahmen automatisch als Organisationscode hinterlegt wird) und ein MARC-Framework mit allen benötigten MARC-Feldern angelegt - die MARC-Frameworks entsprechen in etwa den "Formularen" der SISIS-Sunrise Katalogisierung.

Die weitere Konfiguration der zahlreich vorhandenen Koha-Systemparameter wird die Bibliothek mit eigenem Wissen selber durchführen.

Datenmigration

Als zu migrierende Daten wurden die folgenden Datenarten bestimmt:

  • Benutzerdaten
  • Normdaten (Personen, Körperschaften, Schlagwörter)
  • Titel- und Exemplardaten
  • Ausleihdaten

Für alle Datenarten wurde jeweils eine Konkordanz erstellt, welche die un-ter SISIS-Sunrise vorhandenen Dateninhalte den unter Koha verfügbaren Datenfeldern zuordnet.

Für alle Daten war eine Umwandlung des bisherigen Zeichensatzes ISO 8859-1 zu UTF-8 notwendig.

Die Bibliothek des Wissenschaftsparks Albert Einstein entstand ab 1992 u. a. aus der Zusammenlegung der folgenden Bibliotheken:

  • Deutsches GeoForschungsZentrum, Helmholtz-Zentrum Potsdam / GFZ
  • Potsdamer Forschungsstelle des Alfred-Wegener-Instituts, Helm-holtz-Zentrum für Polar- und Meeresforschung / AWI
  • Potsdam-Institut für Klimafolgenforschung / PIK
  • Institute for Advanced Sustainability Studies / IASS (ab 2010)

Die teilweise lange und wechselhafte Geschichte der einzelnen Bibliotheken sorgte zusammen mit bereits früher stattgefundenen Datenmigrationen und Fremddatenübernahmen für einen recht heterogenen Datenbestand. Die Migration war deshalb gleichzeitig Anlass für vielfältige Bereini-gungen, für welche ich konkrete Vorschläge machte. Nach Möglichkeit konnten diese Bereinigungen automatisiert, in verschiedenen Fällen mussten sie aber auch händisch durchgeführt werden.

Benutzerdaten

Ausschnitt aus einem (hier anonymisierten) Benutzerdatensatz, wie er über die Dienstoberfläche zu sehen ist.

Die hauptsächlich in der SISIS-Sunrise-Tabelle "d02ben" vorliegenden Benutzerdaten wurden mit den in "d02onl" abgelegten E-Mail-Adressen ergänzt und gleichzeitig eine Umbenennung der bisherigen Bezeichnungen von Zweigstellen und Benutzergruppen durchgeführt.

Anschliessend konnten die nun im CSV-Format vorliegenden Daten der rund 2'200 Benutzerdatensätze über den Benutzerdatenimport recht einfach in Koha geladen werden und sorgten so für ein erstes Erfolgserlebnis.

Normdaten

Die unter SISIS-Sunrise im MAB-Format vorliegenden Normdaten wurden nach der notwendigen Bereinigung und Deduplizierung in MARCXML umgewandelt. So konnten schliesslich rund 57'500 Personen-, 7'000 Körper-schafts- und 6'600 Schlagwortnormdatensätze im Format MARC 21 in Koha geladen werden.

Auf eine Umwandlung der uneinheitlichen Systematiknormdaten wurde verzichtet - stattdessen wurden die 62 normierten Werte der bibliotheksseitig aktuell tatsächlich verwendeten Systematik geladen.

Titel- und Exemplardaten

Die unter SISIS-Sunrise im MAB-Format vorliegenden Titeldaten wurden entladen und daraufhin untersucht, ob sie Teil einer mehrstufigen Aufnahme waren.

Eigentlich hätte mittels ENTLMASS (Schalter "-S") gleichzeitig ein Entladen der Exemplardaten stattfinden sollen, aufgrund eines Fehlers in SISIS-Sunrise war dies jedoch nicht möglich, sodass die Exemplardaten schliesslich mit SQL direkt aus der Tabelle "d01buch" entladen wurden.

Über eine eigens programmierte Konverterdatei wurden die Titel- und Exemplardaten schliesslich vereinigt und in MARCXML umgewandelt. So konnten rund 88'500 Titelaufnahmen im Format MARC 21 in Koha geladen und danach mit den Normdaten verlinkt werden.

Ausleihdaten

Ein migrierter Titeldatensatz samt Exemplardaten, wie er über die sogenannte "Normalansicht" der Dienstoberfläche zu sehen ist.

Abschliessend wurden die rund 4'300 relevanten Ausleihdatensätze (Ausweis- und Strichcodenummer, Fälligkeits-, Ausleih-, Rückgabedatum usw.) aus der Tabelle "d01buch" entladen und so umgewandelt, dass sie in die Koha-Tabelle "issues" geladen werden konnten.

Zwischenfazit

Die Migration der Daten des Wissenschaftsparks hat gezeigt, dass auch ein komplexer Datenbestand (ISO 8859-1, mehrere Zweigstellen, MAB, mehrstufige Titelaufnahmen usw.) innert nützlicher Frist in die von Koha verwendeten Formate (insbesondere MARC 21) umgewandelt und benutzbar gemacht werden kann.

Eine solche Datenmigration eignet sich auch ideal dafür, um Bereinigungen des vorhandenen Datenbestands vorzunehmen (z. B. durch Deduplizierung, Vereinheitlichung, Korrekturen usw.) und so die Datenqualität zu verbessern.

Nach Abschluss der intern noch durchzuführenden organisatorischen Arbeiten wird die Bibliothek noch im Frühjahr 2015 die Echtmigration zu Koha durchführen. Die weitergehende Konfiguration von Koha sowie die Schulung des Personals wird dabei durch die Bibliothek des Wissenschaftsparks selber geleistet.

Ein Abschlussbericht zur Echtmigration des Wissenschaftsparks wird sich im kommenden Newsletter im Herbst finden.