Bibliotheken als Datenanbieter

Alexander Stocker, Peter Scheir und Klaus Tochtermann beschreiben in “Die Wertschöpfungskette der Daten” [1] Die Wertschöpfungskette der Daten : eine Basis für zukünftige wirtschaftswissenschaftliche Betrachtungen des Web of Data. HMD – Praxis der Wirtschaftsinformatik, Heft 275/2010, S. 94-104 vier mögliche Rollen [2] S. 99 in eben dieser Wertschöpfungskette.

  1. Anbieter von Daten am Web sind derzeit noch
    fast ausschließlich Anbieter von Rohdaten. […]
  2. Anbieter von Semantic-Web-Daten sind solche,
    die Daten in einem durch Maschinen interpretierbaren
    Format bereitstellen.[…]
  3. Anbieter von Semantic-Web-Applikationen
    sind solche, die eigene oder fremde Semantic-
    Web-Daten in einer Semantic-Web-Anwendung
    verarbeiten und dabei für den Menschen
    konsumierbaren Output auf Basis der
    verarbeiteten Daten generieren. […]
  4. Endnutzer sind schließlich alle Menschen, die
    eine durch Menschen interpretierbare Präsentation
    von Semantic-Web-Daten konsumieren. Menschliche Endnutzer kommen in der Praxis nicht direkt mit den für die Verarbeitung
    durch Maschinen aufbereiteten Semantic-Web-Daten in Berührung und wollen das vermutlich auch gar nicht.[…]

Bibliotheken können prinzipiell alle vier Rollen einnehmen.

Zuerst natürlich als Rohdatenanbieter von bibliographischen und anderen Daten. Wenn man weitere Wertschöpfungen zulassen möchte, müssen die Daten zwingend unter einer Lizenz veröffentlich werden, die Weiterverarbeitung jeglicher Art nicht ausschließt. Richtig gemacht haben es also unter anderem die Bibliothek des CERN oder USB Köln, die wie alle vom HBZ betreuten Open-Bibliographic-Data-Projekte unter CC0 publiziert sind.

Das Anbieten von Semantic-Web-Daten kann teils im gleichen Auslieferungsschritt erfolgen. Ein Beispiel ist die gestern erfolgte Veröffentlichung eines Teils des Katalogs der British Library als RDF-Dump. Auf der Webseite der BL sind die Bedingungen erläutert:

As part of its work to open its metadata to wider use beyond the traditional library community, the British Library is making copies of its main catalogue and British National Bibliography datasets available for research purposes. Files are initially being made available in RDF/XML […] and are distributed under a Creative Commons CC0 1.0 Universal Public Domain Dedication license.

Eine Weiterverarbeitung ist ausdrücklich erwünscht und durch die gewählte Lizenz auch möglich. Linked Data will auch die Deutsche Nationalbibliothek mit der GND anbieten. In die Wertschöpfungskette können die Daten jedoch nicht gelangen, da die Daten nicht kommerziell genutzt werden dürfen. Abgesehen davon, dass es volkswirtschaftlicher Unsinn ist, staatlich finanzierte Daten nicht zur Verwendung in kommerziellen Unternehmungen freizugeben, ist damit auch die Verwendung in der Wikipedia und Schwesterprojekten nicht möglich. Leider gilt hier: nur gucken, nicht anfassen!

Im Open Bibliographic Data Guide hat das JISC erläutert, wie man es richtig macht. Oliver Flimm schreibt (zum Reader und der Wichtigkeit der Lizenzwahl):

Nur so kann ein realer Nutzen innerhalb der Bibliothekswelt und anderswo entstehen. So sind wir z.B. sehr dankbar über Rückmeldungen von Fehlern in Verbund-Katalogisaten, bei denen wir Bestand haben, (Verknüpfung von Titeln mit Personensätzen, die eine falsche PND besitzen), die extern bei der Verarbeitung unserer geöffneten Daten aufgefallen sind.

Über Bibliotheken in den anderen beiden Rollen, also als Datennutzer wird es hier demnächst etwas zu lesen geben.

Weitere Informationen zu Open Bibliographic Data:

Adrian Pohl: Open Bibliographic Data in 2010. Ein vorläufiger Überblick

References

References
1 Die Wertschöpfungskette der Daten : eine Basis für zukünftige wirtschaftswissenschaftliche Betrachtungen des Web of Data. HMD – Praxis der Wirtschaftsinformatik, Heft 275/2010, S. 94-104
2 S. 99

2 Gedanken zu „Bibliotheken als Datenanbieter“

  1. Danke für den Beitrag. Die “Wertschöpfungskette der Daten” scheint mir auf den ersten Blick auf diese Weise ziemlich sinnvoll und einfach gegliedert zu sein (auch wenn ich das Wort “Wertschöpfungskette” nicht mag). Ich denke, die Rolle von bibliothekarischen Institutionen wird sich auf die Punkte 1 und 2 konzentrieren, wo ja auch deren Kernkompetenz liegt. Was konkrete Dienste und deren Oberflächen für Endnutzer angeht ist die Bibliothekswelt ja nicht gerade für Usability bekannt…

    Eine Sache noch zur Konkretisierung: Die British Library hat m.E. keine “Semantic-Web-Daten” veröffentlicht, diese Aufwertung findet erst im Rahmen des JISC-geförderten Projekts OpenBibliography statt. Zwar sind die BL-Daten irgendwie in RDF publiziert allerdings gibt es keinerlei URIs in den Daten, d.h. Entitäten werden nur durch sogenannte “Blank Nodes” identifiziert, die nicht webweit dereferenzierbar sind. Ben O’ Steen vom genannten Open Bibliography-Projekt hat die Daten allerdings schon Linked-Data-kompatibel gemacht, siehe http://openbiblio.net/2010/11/17/augmenting-the-british-librarys-rdf-data-to-allow-for-disambiguation/

    Seit gestern hat Ben O’ Steen übrigens insgesamt drei Blogbeiträge zu den BL-Daten und seinem Umgang damit auf http://openbiblio.net/ veröffentlicht.

  2. Besten Dank für die Korrektur und den Hinweis auf die Postings von Ben O’Steen!

    Was die Rolle der Bibliotheken als Dienstanbieter angeht, sehe ich allerdings nicht ganz so schwarz und vor allem ein paar mögliche Szenarien. Ich sammel mal ein bißchen und veröffentliche das dann recht bald.

Kommentare sind geschlossen.