Koha/Migration der Bibliothek des Wissenschaftsparks Albert Einstein in Potsdam von SISIS-Sunrise zu Koha: Unterschied zwischen den Versionen
Admin (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
Admin (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
Zeile 77: | Zeile 77: | ||
Ein Abschlussbericht zur Echtmigration des Wissenschaftsparks wird sich im kommenden Newsletter im Herbst finden. | Ein Abschlussbericht zur Echtmigration des Wissenschaftsparks wird sich im kommenden Newsletter im Herbst finden. | ||
[[Kategorie:Koha]] | |||
[[Kategorie:SISIS-Sunrise]] |
Version vom 26. November 2015, 11:56 Uhr
Der folgende Bericht erschien im Newsletter "Neues von Admin Kuhn (April 2015)".
Die Bibliothek des Wissenschaftsparks Albert Einstein in Potsdam mit ihren vier Zweigstellen (u. a. das Deutsche GeoForschungsZentrum GFZ) wird in Kürze von SISIS-Sunrise zu Koha wechseln. Die im Oktober 2014 begonnene Datenmigration ist bereits abgeschlossen, die Bibliothek beschäftigt sich gegenwärtig noch mit internen organisatorischen Fragen wie der Anbindung des neuen Katalogs an die Bibliothekssuchmaschine ALBERT, auf der auch das neue KOBV-Portal basiert.
Damit wird nicht nur auf ein zeitgemässes und international bewährtes Bibliothekssystem gewechselt, sondern auch die Kostensituation deutlich verbessert - da die Open Source-Software Koha kostenlos ist und Koha auch selber ausschliesslich kostenlose Open Source-Software nutzt, entfallen künftig jegliche Lizenzzahlungen für Betriebssystem, Datenbankserver und Bibliothekssystem.
Rechner und grundlegende Software
Als Grundlage für Koha dient gegenwärtig eine virtuelle Maschine mit einem Prozessor, 4 GB Arbeitsspeicher und knapp 40 GB Festplattenplatz. Darauf installiert ist das Betriebssystem Ubuntu 14.04 LTS (64-bit), welches einen kostenlosen fünfjährigen "Long Time Support" bietet und über eine einfach bedienbare Online-Aktualisierung verfügt.
Als Datenbankserver kommt MySQL 5.5.41 zum Einsatz, als Webserver für die Dienstoberfläche und den OPAC von Koha dient der Apache HTTP Server 2.4.7. Als Bibliothekssystem schliesslich wird das im November 2014 veröffentlichte Koha 3.18 verwendet.
Grundkonfiguration
Aufgrund der internationalen Nutzerschaft des Wissenschaftsparks wurden in Koha neben Deutsch auch die Sprachen Chinesisch, Englisch, Französisch, Italienisch, Russisch, Spanisch und Türkisch installiert, auf die vom Nutzer selber jederzeit umgeschaltet werden kann.
Als Teil der Datenmigration wurden einige grundlegende Werte aus der bisherigen SISIS-Sunrise Administration nach Koha übernommen, darunter die Zweigstellen, Abteilungen, Medientypen und Benutzergruppen. Ausserdem wurde eine Reihe von Parametrierungen vorgenommen (z. B. die Verwendung des für den Wissenschaftspark gültigen ISIL DE-B103, der in den MARC 21-Titelaufnahmen automatisch als Organisationscode hinterlegt wird) und ein MARC-Framework mit allen benötigten MARC-Feldern angelegt - die MARC-Frameworks entsprechen in etwa den "Formularen" der SISIS-Sunrise Katalogisierung.
Die weitere Konfiguration der zahlreich vorhandenen Koha-Systemparameter wird die Bibliothek mit eigenem Wissen selber durchführen.
Datenmigration
Als zu migrierende Daten wurden die folgenden Datenarten bestimmt:
- Benutzerdaten
- Normdaten (Personen, Körperschaften, Schlagwörter)
- Titel- und Exemplardaten
- Ausleihdaten
Für alle Datenarten wurde jeweils eine Konkordanz erstellt, welche die un-ter SISIS-Sunrise vorhandenen Dateninhalte den unter Koha verfügbaren Datenfeldern zuordnet.
Für alle Daten war eine Umwandlung des bisherigen Zeichensatzes ISO 8859-1 zu UTF-8 notwendig.
Die Bibliothek des Wissenschaftsparks Albert Einstein entstand ab 1992 u. a. aus der Zusammenlegung der folgenden Bibliotheken:
- Deutsches GeoForschungsZentrum, Helmholtz-Zentrum Potsdam / GFZ
- Potsdamer Forschungsstelle des Alfred-Wegener-Instituts, Helm-holtz-Zentrum für Polar- und Meeresforschung / AWI
- Potsdam-Institut für Klimafolgenforschung / PIK
- Institute for Advanced Sustainability Studies / IASS (ab 2010)
Die teilweise lange und wechselhafte Geschichte der einzelnen Bibliotheken sorgte zusammen mit bereits früher stattgefundenen Datenmigrationen und Fremddatenübernahmen für einen recht heterogenen Datenbestand. Die Migration war deshalb gleichzeitig Anlass für vielfältige Bereini-gungen, für welche ich konkrete Vorschläge machte. Nach Möglichkeit konnten diese Bereinigungen automatisiert, in verschiedenen Fällen mussten sie aber auch händisch durchgeführt werden.
Benutzerdaten
Die hauptsächlich in der SISIS-Sunrise-Tabelle "d02ben" vorliegenden Benutzerdaten wurden mit den in "d02onl" abgelegten E-Mail-Adressen ergänzt und gleichzeitig eine Umbenennung der bisherigen Bezeichnungen von Zweigstellen und Benutzergruppen durchgeführt.
Anschliessend konnten die nun im CSV-Format vorliegenden Daten der rund 2'200 Benutzerdatensätze über den Benutzerdatenimport recht einfach in Koha geladen werden und sorgten so für ein erstes Erfolgserlebnis.
Normdaten
Die unter SISIS-Sunrise im MAB-Format vorliegenden Normdaten wurden nach der notwendigen Bereinigung und Deduplizierung in MARCXML umgewandelt. So konnten schliesslich rund 57'500 Personen-, 7'000 Körper-schafts- und 6'600 Schlagwortnormdatensätze im Format MARC 21 in Koha geladen werden.
Auf eine Umwandlung der uneinheitlichen Systematiknormdaten wurde verzichtet - stattdessen wurden die 62 normierten Werte der bibliotheksseitig aktuell tatsächlich verwendeten Systematik geladen.
Titel- und Exemplardaten
Die unter SISIS-Sunrise im MAB-Format vorliegenden Titeldaten wurden entladen und daraufhin untersucht, ob sie Teil einer mehrstufigen Aufnahme waren.
Eigentlich hätte mittels ENTLMASS (Schalter "-S") gleichzeitig ein Entladen der Exemplardaten stattfinden sollen, aufgrund eines Fehlers in SISIS-Sunrise war dies jedoch nicht möglich, sodass die Exemplardaten schliesslich mit SQL direkt aus der Tabelle "d01buch" entladen wurden.
Über eine eigens programmierte Konverterdatei wurden die Titel- und Exemplardaten schliesslich vereinigt und in MARCXML umgewandelt. So konnten rund 88'500 Titelaufnahmen im Format MARC 21 in Koha geladen und danach mit den Normdaten verlinkt werden.
Ausleihdaten
Abschliessend wurden die rund 4'300 relevanten Ausleihdatensätze (Ausweis- und Strichcodenummer, Fälligkeits-, Ausleih-, Rückgabedatum usw.) aus der Tabelle "d01buch" entladen und so umgewandelt, dass sie in die Koha-Tabelle "issues" geladen werden konnten.
Zwischenfazit
Die Migration der Daten des Wissenschaftsparks hat gezeigt, dass auch ein komplexer Datenbestand (ISO 8859-1, mehrere Zweigstellen, MAB, mehrstufige Titelaufnahmen usw.) innert nützlicher Frist in die von Koha verwendeten Formate (insbesondere MARC 21) umgewandelt und benutzbar gemacht werden kann.
Eine solche Datenmigration eignet sich auch ideal dafür, um Bereinigungen des vorhandenen Datenbestands vorzunehmen (z. B. durch Deduplizierung, Vereinheitlichung, Korrekturen usw.) und so die Datenqualität zu verbessern.
Nach Abschluss der intern noch durchzuführenden organisatorischen Arbeiten wird die Bibliothek noch im Frühjahr 2015 die Echtmigration zu Koha durchführen. Die weitergehende Konfiguration von Koha sowie die Schulung des Personals wird dabei durch die Bibliothek des Wissenschaftsparks selber geleistet.
Ein Abschlussbericht zur Echtmigration des Wissenschaftsparks wird sich im kommenden Newsletter im Herbst finden.