Jakob Voß (VZG)
Nico Wagner (DNB)
Bibliothekskongress 2022
https://jakobib.github.io/bibtag2022/
2022-05-31
Grundsätzlich nicht anders als andere Daten
Bibliotheksspezifische Metadatenformate
(MARC21, MAB2, PICA, ASEQ, METS/MODS, ONIX…)
Außerhalb von Bibliotheken irrelevant
⇒ wenig Support allgemeiner Datenwerkzeuge
Datenformate altern langsamer als Software
(Linked) Open Data: Verknüpfung mit anderen Daten
Data Science, Visualisierung, Machine-Learning…
Wie mit Bibliotheksdaten umgehen?
Allgemeine Datenwerkzeuge (z.B. Excel, OpenRefine)
Freie Werkzeuge für bibliothekarische Datenformate
Programmierbibliotheken
Anwendungsprogramme
Interne Werkzeuge (WinIBW, FALCON, BibControl…)
Data Science Werkzeugkasten
Interaktive Notebooks (Jupyter, Observable…)
Kommandozeile (grep
, head
, sort
…)
OpenRefine
GitHub/GitLab
…
Integration in Data Science Workflows
(Skripte, Makefiles, Cron-Jobs, Versionskontrolle)
Es stehen eine große Anzahl an Standardwerkzeugen zur Verfügung (head
, grep
)
Umfangreiches Literatur- und Fortbildungsangebot
title.dat
): 38GBgnd.dat
): 5.5GBWerkzeuge sollten sich kombinieren lassen
Gemeinsame Sprachen (PICA Path, Fix, Avram…)
Standardformate
Dokumentation, Fortbildung, Einarbeitung
Softwareentwicklung ist Daueraufgabe
Entwicklung hängt oft an einzelnen Personen
(Beispiel: MarcEdit, zumal nur Freeware)
Projektgetriebene Entwicklung selten nachhaltig
(Beispiel: d:swarm)
Dokumentation der jeweiligen Programme
Handbuch IT in Bibliotheken (geplant)
Magnus Pfeffer (2016): Open Source Software zur Verarbeitung und Analyse von Metadaten. Präsentation auf dem 6. Bibliothekskongress. urn:nbn:de:0290-opus4-24490
Von Wikimedia Commons
Datenverarbeitung ist keine Wissenschaft sondern Handwerk!
Übung macht die Meister*in!