Jakob Voß (VZG)
Nico Wagner (DNB)
Bibliothekskongress 2022
https://jakobib.github.io/bibtag2022/
2022-05-31
Grundsätzlich nicht anders als andere Daten
Bibliotheksspezifische Metadatenformate
(MARC21, MAB2, PICA, ASEQ, METS/MODS, ONIX…)
Außerhalb von Bibliotheken irrelevant
⇒ wenig Support allgemeiner Datenwerkzeuge
Datenformate altern langsamer als Software
(Linked) Open Data: Verknüpfung mit anderen Daten
Data Science, Visualisierung, Machine-Learning…
Wie mit Bibliotheksdaten umgehen?
Allgemeine Datenwerkzeuge (z.B. Excel, OpenRefine)
Freie Werkzeuge für bibliothekarische Datenformate
Programmierbibliotheken
Anwendungsprogramme
Interne Werkzeuge (WinIBW, FALCON, BibControl…)
Data Science Werkzeugkasten
Interaktive Notebooks (Jupyter, Observable…)
Kommandozeile (grep, head, sort…)
OpenRefine
GitHub/GitLab
…
Integration in Data Science Workflows
(Skripte, Makefiles, Cron-Jobs, Versionskontrolle)
Es stehen eine große Anzahl an Standardwerkzeugen zur Verfügung (head, grep)
Umfangreiches Literatur- und Fortbildungsangebot
title.dat): 38GBgnd.dat): 5.5GBWerkzeuge sollten sich kombinieren lassen
Gemeinsame Sprachen (PICA Path, Fix, Avram…)
Standardformate
Dokumentation, Fortbildung, Einarbeitung
Softwareentwicklung ist Daueraufgabe
Entwicklung hängt oft an einzelnen Personen
(Beispiel: MarcEdit, zumal nur Freeware)
Projektgetriebene Entwicklung selten nachhaltig
(Beispiel: d:swarm)
Dokumentation der jeweiligen Programme
Handbuch IT in Bibliotheken (geplant)
Magnus Pfeffer (2016): Open Source Software zur Verarbeitung und Analyse von Metadaten. Präsentation auf dem 6. Bibliothekskongress. urn:nbn:de:0290-opus4-24490
Von Wikimedia Commons
Datenverarbeitung ist keine Wissenschaft sondern Handwerk!
Übung macht die Meister*in!