ZDB als Open Data

Eine fantastische Nachricht hat die DNB veröffentlicht:

Seit Juni 2014 ist der größte Teil der Metadaten der Zeitschriftendatenbank (ZDB) unter den Bedingungen „Creative Commons Zero (CC0 1.0)“ verfügbar. Damit sind rund 1,7 Mio. Titeldaten in allen Sprachen und ohne zeitliche Einschränkung mit über 13 Mio. Besitznachweisen für die Weiterverwendung freigegeben. Die Freigabe bezieht sich ausdrücklich auch auf die kommerzielle Nutzung. Durch diesen Schritt wird die Nachnutzung der qualitativ hochwertigen Metadaten der weltweit größten Datenbank für Titel- und Besitznachweise fortlaufender Sammelwerke, also von Zeitschriften, Zeitungen, Schriftenreihen und anderen periodisch erscheinenden Veröffentlichungen in gedruckter und elektronischer Form, für jedermann möglich.

Ich lade mir dann mal die ZDB runter. Wer es mir nachtun möchte: hier geht es zu den Downloads.

[via Netbib]

Danowski/Pohl: (Open) Linked Data in Bibliotheken

“(Open) Linked Data in Bibliotheken”

Das Buch ist sowohl eine Einführung in die Themen Linked Data, Open Data und Open Linked Data als es auch den konkreten Bezug auf Bibliotheken behandelt. Hierzu werden konkrete Anwendungsprojekte beschrieben. Der Band wendet sich dabei sowohl an Personen aus der Bibliothekspraxis als auch an Personen aus dem Bibliotheksmanagement, die noch nicht mit dem Thema vertraut sind.

Inhalt:

Die Open-Access-Ausgabe ist nun online. Herzlichen Glückwunsch, Patrick und Adrian!

DPLA empfiehlt CC0 für bibliographische Metadaten

Das Board der Digital Public Library of America (DPLA) hat in einem Meeting empfohlen, CC0 als Lizenz für die Publikation von bibliographischen Metadaten zu verwenden. Sofern man überhaupt davon ausgeht, dass die Daten urheberrechtlich geschützt werden können und müssen. Aus der Empfehlung (PDF):

  • The DPLA asserts that metadata are not copyrightable, and that applying a license to them is not necessary.
  • To the extent that the law determines a copyright interest exists, a CC0 license applies.
  • The DPLA asserts no new rights over metadata at the DPLA level.

Damit liegt die DPLA auf einer Linie mit den “Empfehlungen zur Öffnung bibliothekarischer Daten”. [1] Disclaimer: … an denen ich mitgewirkt habe. Und reibt sich ein wenig am Widerspruch von Klaus Tochtermann, der nach Alternativen sucht. In einem Kommentar zu seinem Posting schreibt er:

For me it is still too simple to argue “the tax payers pays so we have to make it public without any restriction”. Yes the tax payer paid and the public has the right to access, reuse the data – no doubt about that. But what about commercialisation of the data? What did we learn during the last decades about publication processes of scientific papers: The tax payer pays twice: First the scientific community writes and reviews the papers for the publishers; Second the scientific community buys the journals in which these papers have been published. What makes you so confident that we will not enter the same loop with data – regardless of whether it is research data or library data? And then the European Commission must help out similar to a recent proposal to publish only OA in EC-funded projects.

Im Gegensatz zu den ins Feld geführten Nicht-OA-Publikationen führt eine Veröffentlichung von bibliographischen Metadaten unter CC0 dazu, dass sie jeder verwenden kann. Wenn man sie zurückkauft, dann muss man das nur, weil ein Mehrwert mitgeliefert wird. Zum Beispiel die Auslieferung als komfortabler Suchindex. Die datenproduzierende Bibliothek hat jedoch jederzeit die Möglichkeit, die Daten selbst aufzubereiten und damit zu machen, was sie will. Die erwähnten Publikationen sind jedoch in der Regel nicht OA verfügbar, sondern werden meist exklusiv einem Verlag zur Nutzung überlassen.

Die Kommerzialisierung von Daten, die unter CC0-Lizenz veröffentlicht wurden, schadet der datenproduzierenden Bibliothek meines Erachtens überhaupt nicht.

[via OpenGLAM]

PS: Dieses Thema wird zur Zeit auch in der Mailingliste RepMan diskutiert. Anlass ist die Möglichkeit, OA-Repositories für den Primo-Central-Index zu registrieren. Voraussetzung: Content must be published with a CC0 (no rights reserved) license.

References

References
1 Disclaimer: … an denen ich mitgewirkt habe.

isbn2toc nutzt freie (bibliothekarische) Daten

Peter Mayr macht in seinem Blog Hatori Kibble auf isbn2toc aufmerksam, den er in der Wikipedia ISBN-Suche (Beispiel-ISBN übernommen) gefunden hat.

Hier hat offensichtlich wer die Links zu den Inhaltsverzeichnissen aus den Katalogdaten extrahiert und bietet eine Suche über die ISBN an.

Die Ergebnisseite ist zwar mehr funktional als hübsch, der Dienst funktioniert aber.

Ein nettes Beispiel für eine Anwendung, die aus dem Bibliothekswesen selbst vermutlich nicht entstanden wäre.

Linked Data der DNB nun Linked Open Data

Aus einer E-Mail von Julia Hauser:

Wir freuen uns, mitteilen zu können, dass der bestehende Linked Data-Service der Deutschen Nationalbibliothek um Titeldaten erweitert wird.

2010 hat die Deutsche Nationalbibliothek damit begonnen, Normdaten als Linked Data zu veröffentlichen. Der bestehende Linked Data Service der DNB [1] wird nun um Titeldaten erweitert. In diesem Zuge wird auch die Nutzungslizenz für Linked Data auf “Creative Commons Zero” [2] umgestellt.

Jetzt wurde der überwiegende Teil der Titeldaten der DNB – es fehlen z. B. noch Musikalien und die Bestände des Deutschen Exilarchivs – sowie die fortlaufenden Sammelwerke (Zeitschriften-, Zeitungs- und Schriftenreihentitel der Zeitschriftendatenbank (ZDB)) umgesetzt. Die RDF/XML-Repräsentation des jeweiligen Datensatzes ist ab sofort im Portal der DNB [3] über einen entsprechenden Link verfügbar. Es handelt sich ausdrücklich um einen experimentellen Dienst, der laufend erweitert und verfeinert werden soll. Nähere Informationen zu Fragen der Modellierung und des Vorgehens finden sich in der aktualisierten Dokumentation [4].

Der einzig richtige und wichtige Schritt! Die dazugehörigen Links:

[1] https://wiki.dnb.de/display/LDS/
[2] http://creativecommons.org/publicdomain/zero/1.0/
[3] http://portal.dnb.de/
[4] http://files.d-nb.de/pdf/linked_data.pdf

Shelflife

Anne Christensen macht auf Plan3t.info auf Shelflife (hatten wir hier schon einmal) aufmerksam. Dabei handelt es sich um einen pfiffigen Versuch, den Mehrwert des Stöberns am Regal in die digitale Welt zu übertragen.

Am meisten beeindruckt bin ich davon, dass die Farbe der Buchrücken die Relevanz der jeweiligen Titel abbildet, und zwar auf Grundlage von lokalen Ausleihdaten sowie der Verwendung der Titel in Kursen und Seminaren der Universität. “Community Relevance” heißt dieser Faktor, den das clevere Entwicklungsteam einführt und damit bestehende interessante Vorschläge zur Integration von Popularitätsdaten in Ranking-Algorithmen aufgreift.

Mehr dazu im Video:

Tutorial from Harvard Library Innovation Lab on Vimeo.

Und natürlich (auch weiterführende Links) in Annes Posting auf Plan3t.info.

Linked Library Data Tools

Die Linked Library Data Group des W3C hat heute ihren Werkzeugkoffer geöffnet und führt nun im W3C-Wiki eine öffentlich zugängliche Liste mit Werkzeugen im Bereich Linked Library Data: LLDtools.

Aufgeführt sind zum Beispiel verschiedene Werkzeuge für die Publikation von LLD (z.B. Pubby) oder Dienste zur Ansicht und zum Browsen (z.B. der Sindice Web Data Inspector).

DINI-AG KIM veröffentlicht Open-Data-Empfehlungen

Die DINI-AG KIM gibt die Veröffentlichung der “Empfehlungen zur Öffnung bibliothekarischer Daten” bekannt. Die Empfehlungen sollen bibliothekarischen Organisationen als Richtlinien und Referenz bei der Freigabe ihrer Daten dienen.

Gegenstand der Empfehlungen sind nicht nur beschreibende Metadaten, sondern sämtliche nicht-sensiblen Daten, die von bibliothekarischen Organisationen produziert werden, wie z.B. auch statistische Daten oder Zirkulationsdaten.

Die Empfehlungen benennen neun Prinzipien für offene bibliothekarische Daten. Um als ‘offen’ im Sinne der Empfehlungen zu gelten, sind zwingend die drei Kernforderungen nach offenem Zugang, offenen Standards und offenen Lizenzen einzuhalten.

Desweiteren sollten die Daten regelmäßig aktualisiert werden und auch im Ursprungsformat vorliegen, sie sollten strukturiert beschrieben werden und möglichst ohne Registrierung zugänglich sein. Vorkehrungen für die Nachhaltigkeit der Bereitstellung sollten getroffen werden.

Die Empfehlungen orientieren sich an existierenden Open-Data-Prinzipien und -Richtlinien für Gedächtnisinstitutionen oder dem öffentlichen Sektor im allgemeinen. Einzusehen sind die Empfehlungen im Wiki der Deutschen Nationalbibliothek.

Der Text selbst ist unter einer CC0-Lizenz veröffentlicht. Seine Verbreitung und Wiederveröffentlichung ist ausdrücklich erwünscht.

Hier sind die Empfehlungen in der aktuellen Version 1.0:

 


 

Empfehlungen zur Öffnung bibliothekarischer Daten

1. Präambel

Bibliotheken und andere Informationseinrichtungen arbeiten täglich in vielfältiger Weise mit Daten unterschiedlicher Verwendungszwecke und Bestimmung. Sie agieren als Datenproduzenten, Datenlieferanten, Datennutzer und Aggregatoren. Um den größtmöglichen Nutzen der durch öffentliche Einrichtungen produzierten Daten zu gewährleisten, ist es geboten, sie offen im Internet zu publizieren.

2. Gegenstand

In Informationseinrichtungen werden verschiedene Formen von Daten produziert, die Gegenstand einer Datenfreigabe sein können. Es ist zu betonen, dass eine Datenfreigabe nur durchgeführt werden kann unter der Voraussetzung, dass

  1. es sich bei den jeweiligen Daten nicht um personenbezogene oder anderweitig sensible Daten handelt,
  2. die jeweilige Einrichtung im Besitz der Datenbankrechte bzw. ggf. der Urheberrechte ist, um die Daten freizugeben.

Unter bibliothekarischen Daten zu verstehen sind sowohl bibliographische Daten gemäß den “Prinzipien zu offenen bibliographischen Daten” als auch darüber hinausgehende Daten, die in Ausübung bibliothekarischer Tätigkeit erstellt werden.

Zur Verwaltung der Dienstleistungen einer Bibliothek fallen zudem weitere Daten an, die – insofern es sich um nicht personenbezogene oder anderweitig sensible Daten handelt – ebenfalls freigegeben werden können. Zu diesen Daten zählen beispielsweise Exemplardaten, Erwerbungsdaten, anonymisierte Ausleihdaten, statistische Daten.

3. Prinzipien

Die DINI-AG KIM empfiehlt bibliothekarischen Einrichtungen im deutschsprachigen Raum und der gesamten Welt die Freigabe bibliothekarischer Daten. Folgende Prinzipien sind dabei zwingend einzuhalten:

  • Offener Zugang zu den Daten, d.h. die Daten müssen offen und kostenlos als Gesamtheit im Web zugänglich sein.
  • Offene Standards, d.h. die Daten müssen in einem offen dokumentierten und nicht-proprietären Format vorliegen. Es sind Webstandards zu bevorzugen, die von einer möglichst breiten Anwenderbasis verstanden werden.
  • Offene Lizenzen, d.h. die Daten müssen (als Einzeldatum und als Sammlung) unter einer offenen Lizenz im Sinne der Open Definition publiziert werden. Dabei empfielt die DINI-AG KIM die Verwendung eines Public-Domain-Waivers wie der CC0 Public Domain Dedication oder der Public Domain Dedication and License (PDDL) um die bestmögliche rechtliche Interoperablität der Daten zu garantieren.

Darüber hinaus empfehlen wir die Berücksichtigung folgender Prinzipien:

  • Dokumentation: Eine strukturierte Beschreibung der Daten soll veröffentlicht werden. Bestenfalls sollen die Daten in einem zentralen Verzeichnis (wie z.B. thedatahub.org)nachgewiesen werden.
  • Rohdaten: Die Daten sollen möglichst so zugänglich gemacht werden, wie sie im Informationskreislauf der Bibliotheken anfallen. Jede weitere Filterung oder Aufbereitung wird auf diejenigen verlagert, die von den Informationen später Gebrauch machen.
  • Aktualität: Daten sollen innerhalb eines angemessenen Zeitraums nach ihrer Erstellung oder Änderung veröffentlicht werden. Was angemessen ist, kann je nach Art der Daten variieren.
  • Strukturiert: Die Daten sollen in einem strukturierten Format publiziert werden, das einfache maschinelle Verarbeitung ermöglicht.
  • Nicht-diskriminierend: Der Zugriff auf die Daten soll für alle möglich sein, einzige akzeptable Hürde ist der Zugang zum Internet. Das heißt, dass keine Registrierung erforderlich sein soll.
  • Nachhaltigkeit: Die Bereitstellung der Daten soll mit der Entwicklung eines Nachhaltigkeitskonzepts verbunden sein, dass eine dauerhafte Archivierung und den Zugriff auf ältere Versionen der Daten sicherstellt.

Selten wird die Einhaltung sämtlicher Prinzipien von Anfang an gewährleistet sein. Allerdings sind die ersten drei Prinzipien notwendige Bedingungen, um überhaupt von offenen bibliothekarischen Daten zu sprechen. Es wird ausdrücklich empfohlen, zunächst auch Rohdaten zu veröffentlichen, die womöglich nicht in einem öffentlich dokumentierten Format vorliegen und/oder nicht strukturiert oder regelmäßig aktualisiert werden. Mittelfristig soll aber an der Einhaltung sämtlicher Prinzipien gearbeitet werden.

4. Verwandte Materialien

Entstanden im Rahmen der Gruppe Lizenzen der DINI-AG KIM.
Beitragende: Patrick Danowski, Kai Eckert, Christian Hauschke, Adrian Pohl und andere

Der Text dieser Empfehlungen ist unter der Creative Commons Lizenz CC0 veröffentlicht. Er ist somit gemeinfrei, d.h. er gehört allen und darf zu beliebigen Zwecken und ohne Auflagen genutzt werden. Bei Nachnutzung wird die Nennung der Quelle erbeten.