Linked Library Data Tools

Die Linked Library Data Group des W3C hat heute ihren Werkzeugkoffer geöffnet und führt nun im W3C-Wiki eine öffentlich zugängliche Liste mit Werkzeugen im Bereich Linked Library Data: LLDtools.

Aufgeführt sind zum Beispiel verschiedene Werkzeuge für die Publikation von LLD (z.B. Pubby) oder Dienste zur Ansicht und zum Browsen (z.B. der Sindice Web Data Inspector).

DINI-AG KIM veröffentlicht Open-Data-Empfehlungen

Die DINI-AG KIM gibt die Veröffentlichung der “Empfehlungen zur Öffnung bibliothekarischer Daten” bekannt. Die Empfehlungen sollen bibliothekarischen Organisationen als Richtlinien und Referenz bei der Freigabe ihrer Daten dienen.

Gegenstand der Empfehlungen sind nicht nur beschreibende Metadaten, sondern sämtliche nicht-sensiblen Daten, die von bibliothekarischen Organisationen produziert werden, wie z.B. auch statistische Daten oder Zirkulationsdaten.

Die Empfehlungen benennen neun Prinzipien für offene bibliothekarische Daten. Um als ‘offen’ im Sinne der Empfehlungen zu gelten, sind zwingend die drei Kernforderungen nach offenem Zugang, offenen Standards und offenen Lizenzen einzuhalten.

Desweiteren sollten die Daten regelmäßig aktualisiert werden und auch im Ursprungsformat vorliegen, sie sollten strukturiert beschrieben werden und möglichst ohne Registrierung zugänglich sein. Vorkehrungen für die Nachhaltigkeit der Bereitstellung sollten getroffen werden.

Die Empfehlungen orientieren sich an existierenden Open-Data-Prinzipien und -Richtlinien für Gedächtnisinstitutionen oder dem öffentlichen Sektor im allgemeinen. Einzusehen sind die Empfehlungen im Wiki der Deutschen Nationalbibliothek.

Der Text selbst ist unter einer CC0-Lizenz veröffentlicht. Seine Verbreitung und Wiederveröffentlichung ist ausdrücklich erwünscht.

Hier sind die Empfehlungen in der aktuellen Version 1.0:

 


 

Empfehlungen zur Öffnung bibliothekarischer Daten

1. Präambel

Bibliotheken und andere Informationseinrichtungen arbeiten täglich in vielfältiger Weise mit Daten unterschiedlicher Verwendungszwecke und Bestimmung. Sie agieren als Datenproduzenten, Datenlieferanten, Datennutzer und Aggregatoren. Um den größtmöglichen Nutzen der durch öffentliche Einrichtungen produzierten Daten zu gewährleisten, ist es geboten, sie offen im Internet zu publizieren.

2. Gegenstand

In Informationseinrichtungen werden verschiedene Formen von Daten produziert, die Gegenstand einer Datenfreigabe sein können. Es ist zu betonen, dass eine Datenfreigabe nur durchgeführt werden kann unter der Voraussetzung, dass

  1. es sich bei den jeweiligen Daten nicht um personenbezogene oder anderweitig sensible Daten handelt,
  2. die jeweilige Einrichtung im Besitz der Datenbankrechte bzw. ggf. der Urheberrechte ist, um die Daten freizugeben.

Unter bibliothekarischen Daten zu verstehen sind sowohl bibliographische Daten gemäß den “Prinzipien zu offenen bibliographischen Daten” als auch darüber hinausgehende Daten, die in Ausübung bibliothekarischer Tätigkeit erstellt werden.

Zur Verwaltung der Dienstleistungen einer Bibliothek fallen zudem weitere Daten an, die – insofern es sich um nicht personenbezogene oder anderweitig sensible Daten handelt – ebenfalls freigegeben werden können. Zu diesen Daten zählen beispielsweise Exemplardaten, Erwerbungsdaten, anonymisierte Ausleihdaten, statistische Daten.

3. Prinzipien

Die DINI-AG KIM empfiehlt bibliothekarischen Einrichtungen im deutschsprachigen Raum und der gesamten Welt die Freigabe bibliothekarischer Daten. Folgende Prinzipien sind dabei zwingend einzuhalten:

  • Offener Zugang zu den Daten, d.h. die Daten müssen offen und kostenlos als Gesamtheit im Web zugänglich sein.
  • Offene Standards, d.h. die Daten müssen in einem offen dokumentierten und nicht-proprietären Format vorliegen. Es sind Webstandards zu bevorzugen, die von einer möglichst breiten Anwenderbasis verstanden werden.
  • Offene Lizenzen, d.h. die Daten müssen (als Einzeldatum und als Sammlung) unter einer offenen Lizenz im Sinne der Open Definition publiziert werden. Dabei empfielt die DINI-AG KIM die Verwendung eines Public-Domain-Waivers wie der CC0 Public Domain Dedication oder der Public Domain Dedication and License (PDDL) um die bestmögliche rechtliche Interoperablität der Daten zu garantieren.

Darüber hinaus empfehlen wir die Berücksichtigung folgender Prinzipien:

  • Dokumentation: Eine strukturierte Beschreibung der Daten soll veröffentlicht werden. Bestenfalls sollen die Daten in einem zentralen Verzeichnis (wie z.B. thedatahub.org)nachgewiesen werden.
  • Rohdaten: Die Daten sollen möglichst so zugänglich gemacht werden, wie sie im Informationskreislauf der Bibliotheken anfallen. Jede weitere Filterung oder Aufbereitung wird auf diejenigen verlagert, die von den Informationen später Gebrauch machen.
  • Aktualität: Daten sollen innerhalb eines angemessenen Zeitraums nach ihrer Erstellung oder Änderung veröffentlicht werden. Was angemessen ist, kann je nach Art der Daten variieren.
  • Strukturiert: Die Daten sollen in einem strukturierten Format publiziert werden, das einfache maschinelle Verarbeitung ermöglicht.
  • Nicht-diskriminierend: Der Zugriff auf die Daten soll für alle möglich sein, einzige akzeptable Hürde ist der Zugang zum Internet. Das heißt, dass keine Registrierung erforderlich sein soll.
  • Nachhaltigkeit: Die Bereitstellung der Daten soll mit der Entwicklung eines Nachhaltigkeitskonzepts verbunden sein, dass eine dauerhafte Archivierung und den Zugriff auf ältere Versionen der Daten sicherstellt.

Selten wird die Einhaltung sämtlicher Prinzipien von Anfang an gewährleistet sein. Allerdings sind die ersten drei Prinzipien notwendige Bedingungen, um überhaupt von offenen bibliothekarischen Daten zu sprechen. Es wird ausdrücklich empfohlen, zunächst auch Rohdaten zu veröffentlichen, die womöglich nicht in einem öffentlich dokumentierten Format vorliegen und/oder nicht strukturiert oder regelmäßig aktualisiert werden. Mittelfristig soll aber an der Einhaltung sämtlicher Prinzipien gearbeitet werden.

4. Verwandte Materialien

Entstanden im Rahmen der Gruppe Lizenzen der DINI-AG KIM.
Beitragende: Patrick Danowski, Kai Eckert, Christian Hauschke, Adrian Pohl und andere

Der Text dieser Empfehlungen ist unter der Creative Commons Lizenz CC0 veröffentlicht. Er ist somit gemeinfrei, d.h. er gehört allen und darf zu beliebigen Zwecken und ohne Auflagen genutzt werden. Bei Nachnutzung wird die Nennung der Quelle erbeten.

Linked Library of Congress

Adrian Pohl hat in seiner Stimme für Plan3t.info wieder vier Links parat, diesmal unter anderem auf die Ankündigung der Library of Congress, ein Bibliographic Framework for the Digital Age zu entwickeln. Dazu schreibt er:

Für viel Aufsehen hat die Ankündigung der Library of Congress gesorgt, ein ‘bibliographic framework’ für das digitale Zeitalter zu entwickeln, das auf RDF Linked-Data-Standards setzt. Nun wird es also für all jene Zeit, die Linked Data bisher als vorübergehenden Hype verstanden haben, sich mit den Ideen dahinter auseinanderzusetzen. Die Ankündigung wirft zunächst eine Menge Fragen auf, wie z.B.: Welche Vokabulare/Ontologien werden für die RDF-Repräsentation bibliographischer Information empfohlen? Wie wird RDA hierfür weiterentwickelt? Auf der Mailingliste Bibframe werden diese und andere Fragen eifrig diskutiert.

Da in der Bibliothek der FH Hannover gerade Überlegungen laufen, eine Hochschulbibliographie auf LOD-Basis aufzubauen, wird sich das Thema hier in Zukunft sicherlich regelmäßig finden. Die oben erwähnte “RDF-Repräsentation bibliographischer Information” ist dabei natürlich besonders interessant. Wer sich mal ansehen möchte, wie das aussehen könnte, dem sei BIBO empfohlen, die Bibliographic Ontology. Die Beschreibung eines Artikels sieht dort beispielsweise so aus.

Die im Beispiel verwendete RDF-Schreibweise nennt sich Turtle (Terse RDF Triple Language). Wer sich für RDF interessiert, dem möchte ich dringend nahelegen: Macht einen weiten Bogen um die XML-Schreibweisen und seht Euch direkt alles in Turtle an. Das ist menschenlesbar und schon mit sehr wenig Übung tatsächlich auch schreibbar. Ein ganz nettes Tutorial zu Turtle gibt es im Haystack Blog. Links zu anderen, vielleicht besseren Tutorials im LOD-Kontext nehme ich gerne entgegen!

ShelfLife und LibraryCloud

David Weinberger stellt in seinem Blog zwei seiner Projekte vor, ShelfLife und LibraryCloud:

Upon the announcement of the beta sprint in May, we partnered up with folks at thirteen other institutions…an amazing group of people. Our small team at Harvard , with generous internal support, built ShelfLife and LibraryCloud on top of the integrated catalogs of five libraries, public and university, with a combined count of almost 15 million items, plus circulation data. We also pulled in some choice items from the Web, including metadata about every TED talk, open courseware, and Wikipedia pages about books. (Finding all or even most of the Wikipedia pages about books required real ingenuity on the part of our team, and was a fun project that we’re in the process of writing up.)

The metadata about those items goes into LibraryCloud, which collects and openly publishes that metadata via APIs and as linked open data. We’re proposing LibraryCloud to DPLA as a metadata server for the data DPLA collects, so that people can write library analytics programs, integrate library item information into other sites and apps, build recommendation and navigation systems, etc. We see this as an important way what libraries know can become fully a part of the Web ecosystem.

ShelfLife baut auf verschiedenen Annahmen auf. Unter anderem: Libraries are social systems. Library items are social objects. A library navigation system should be social as well.

Einen Prototypen gibt es auch. Mehr Infos in seinem Blog.

LOD: Machen wir es nicht, machen es andere!

Nicht nur scheint LOD also aus rationalen und Effizienzgründen die bessere Wahl zum Aufbau zukünftiger Informationsinfrastrukturen zu sein. Auch könnte es der Bibliothekswelt dabei helfen, relevant zu bleiben und nicht durch andere Organisationen verdrängt zu werden.

Jakob Voß hat am Wochenende darauf hingewiesen, dass Wikimedia überlegt, ein Projekt “Bibliographisch-archivalische Datenbank” anzugehen, in dem eine offene bibliographisch-archivalische Datenbank angelegt werden soll zur Nachnutzung durch die verschiedenen Wikimedia-Projekte aber auch durch andere Akteure wie Wissenschaftler oder Google Books.

Wenn bibliothekarische Organisationen nicht eine wichtige Rolle dabei übernehmen, bibliographische Daten im großen Stil offen, strukturiert und leicht nachnutzbar zur Verfügung stellen, werden es schließlich andere tun…

[via Übertext]

Linked Open Data mit Sternchen

Daniel Dietrich machte in der Mailingliste des Open-Data-Networks auf das Linked Open Data Star Scheme aufmerksam. Es dient dazu, veröffentlichte Daten nach ihre Nachnutzbarkeit zu bewerten.

no star Web data
one star open Web data
two star open Web data
three star open Web data
four star open Web data
five star open Web data

Die Bewertungskriterien basieren auf den 5 LOD-Sternen von Tim Berners-Lee. Dies Schema lässt sich auch übertragen auf Open Bibliographic Data. Eine Erweiterung der Sterne um eine maschinenlesbare Fassung (z.B. mit rel-license) der Kriterien wäre allerdings wünschenswert.

Linked Open Data der UB Mannheim

Die UB Mannheim ist nach der Veröffentlichung ihrer Katalogdaten im letzten Jahr nun den konkreten Schritt gegangen, diese durch freie Lizenzierung tatsächlich nachnutzbar zu machen. Mehr dazu im Blog der UB Mannheim.

Warum das so ein wichtiger Schritt ist, erläutert Greg Grossmeier von der University of Michigan in seinem “Commitment to Compatibility”. Fazit:

By using the most compatible license available from Creative Commons, MLibrary enables efficient content creation. We make it possible for users to worry less about license incompatibility and permissions — and instead spend more time on the actual creation of quality content. We hope to see the positive influence of this throughout the local, national, and international library communities.

Es lohnt sich jedoch, das ganze Posting zu lesen.

Danke an Kai für den Hinweis!

Drei neue Empfehlungen des Wissenschaftsrats

Auf drei Empfehlungen des Wissenschaftsrats macht Wisspub aufmerksam.

Adrian Pohl analysiert eine Aussage aus den “Übergreifenden Empfehlungen”, die sich mit zwei verschiedenen Ansätzen der Metadatenbereitstellung beschäftigt: Linked Open Data vs. WorldCat, oder: Eine Alternative, die keine ist.

Am 3. Februar soll darüber hinaus eine Empfehlung zur “Zukunft des bibliothekarischen Verbundsystems in Deutschland” veröffentlicht werden.