DPLA empfiehlt CC0 für bibliographische Metadaten

Das Board der Digital Public Library of America (DPLA) hat in einem Meeting empfohlen, CC0 als Lizenz für die Publikation von bibliographischen Metadaten zu verwenden. Sofern man überhaupt davon ausgeht, dass die Daten urheberrechtlich geschützt werden können und müssen. Aus der Empfehlung (PDF):

  • The DPLA asserts that metadata are not copyrightable, and that applying a license to them is not necessary.
  • To the extent that the law determines a copyright interest exists, a CC0 license applies.
  • The DPLA asserts no new rights over metadata at the DPLA level.

Damit liegt die DPLA auf einer Linie mit den “Empfehlungen zur Öffnung bibliothekarischer Daten”. [1] Disclaimer: … an denen ich mitgewirkt habe. Und reibt sich ein wenig am Widerspruch von Klaus Tochtermann, der nach Alternativen sucht. In einem Kommentar zu seinem Posting schreibt er:

For me it is still too simple to argue “the tax payers pays so we have to make it public without any restriction”. Yes the tax payer paid and the public has the right to access, reuse the data – no doubt about that. But what about commercialisation of the data? What did we learn during the last decades about publication processes of scientific papers: The tax payer pays twice: First the scientific community writes and reviews the papers for the publishers; Second the scientific community buys the journals in which these papers have been published. What makes you so confident that we will not enter the same loop with data – regardless of whether it is research data or library data? And then the European Commission must help out similar to a recent proposal to publish only OA in EC-funded projects.

Im Gegensatz zu den ins Feld geführten Nicht-OA-Publikationen führt eine Veröffentlichung von bibliographischen Metadaten unter CC0 dazu, dass sie jeder verwenden kann. Wenn man sie zurückkauft, dann muss man das nur, weil ein Mehrwert mitgeliefert wird. Zum Beispiel die Auslieferung als komfortabler Suchindex. Die datenproduzierende Bibliothek hat jedoch jederzeit die Möglichkeit, die Daten selbst aufzubereiten und damit zu machen, was sie will. Die erwähnten Publikationen sind jedoch in der Regel nicht OA verfügbar, sondern werden meist exklusiv einem Verlag zur Nutzung überlassen.

Die Kommerzialisierung von Daten, die unter CC0-Lizenz veröffentlicht wurden, schadet der datenproduzierenden Bibliothek meines Erachtens überhaupt nicht.

[via OpenGLAM]

PS: Dieses Thema wird zur Zeit auch in der Mailingliste RepMan diskutiert. Anlass ist die Möglichkeit, OA-Repositories für den Primo-Central-Index zu registrieren. Voraussetzung: Content must be published with a CC0 (no rights reserved) license.

References

References
1 Disclaimer: … an denen ich mitgewirkt habe.

DINI-AG KIM veröffentlicht Open-Data-Empfehlungen

Die DINI-AG KIM gibt die Veröffentlichung der “Empfehlungen zur Öffnung bibliothekarischer Daten” bekannt. Die Empfehlungen sollen bibliothekarischen Organisationen als Richtlinien und Referenz bei der Freigabe ihrer Daten dienen.

Gegenstand der Empfehlungen sind nicht nur beschreibende Metadaten, sondern sämtliche nicht-sensiblen Daten, die von bibliothekarischen Organisationen produziert werden, wie z.B. auch statistische Daten oder Zirkulationsdaten.

Die Empfehlungen benennen neun Prinzipien für offene bibliothekarische Daten. Um als ‘offen’ im Sinne der Empfehlungen zu gelten, sind zwingend die drei Kernforderungen nach offenem Zugang, offenen Standards und offenen Lizenzen einzuhalten.

Desweiteren sollten die Daten regelmäßig aktualisiert werden und auch im Ursprungsformat vorliegen, sie sollten strukturiert beschrieben werden und möglichst ohne Registrierung zugänglich sein. Vorkehrungen für die Nachhaltigkeit der Bereitstellung sollten getroffen werden.

Die Empfehlungen orientieren sich an existierenden Open-Data-Prinzipien und -Richtlinien für Gedächtnisinstitutionen oder dem öffentlichen Sektor im allgemeinen. Einzusehen sind die Empfehlungen im Wiki der Deutschen Nationalbibliothek.

Der Text selbst ist unter einer CC0-Lizenz veröffentlicht. Seine Verbreitung und Wiederveröffentlichung ist ausdrücklich erwünscht.

Hier sind die Empfehlungen in der aktuellen Version 1.0:

 


 

Empfehlungen zur Öffnung bibliothekarischer Daten

1. Präambel

Bibliotheken und andere Informationseinrichtungen arbeiten täglich in vielfältiger Weise mit Daten unterschiedlicher Verwendungszwecke und Bestimmung. Sie agieren als Datenproduzenten, Datenlieferanten, Datennutzer und Aggregatoren. Um den größtmöglichen Nutzen der durch öffentliche Einrichtungen produzierten Daten zu gewährleisten, ist es geboten, sie offen im Internet zu publizieren.

2. Gegenstand

In Informationseinrichtungen werden verschiedene Formen von Daten produziert, die Gegenstand einer Datenfreigabe sein können. Es ist zu betonen, dass eine Datenfreigabe nur durchgeführt werden kann unter der Voraussetzung, dass

  1. es sich bei den jeweiligen Daten nicht um personenbezogene oder anderweitig sensible Daten handelt,
  2. die jeweilige Einrichtung im Besitz der Datenbankrechte bzw. ggf. der Urheberrechte ist, um die Daten freizugeben.

Unter bibliothekarischen Daten zu verstehen sind sowohl bibliographische Daten gemäß den “Prinzipien zu offenen bibliographischen Daten” als auch darüber hinausgehende Daten, die in Ausübung bibliothekarischer Tätigkeit erstellt werden.

Zur Verwaltung der Dienstleistungen einer Bibliothek fallen zudem weitere Daten an, die – insofern es sich um nicht personenbezogene oder anderweitig sensible Daten handelt – ebenfalls freigegeben werden können. Zu diesen Daten zählen beispielsweise Exemplardaten, Erwerbungsdaten, anonymisierte Ausleihdaten, statistische Daten.

3. Prinzipien

Die DINI-AG KIM empfiehlt bibliothekarischen Einrichtungen im deutschsprachigen Raum und der gesamten Welt die Freigabe bibliothekarischer Daten. Folgende Prinzipien sind dabei zwingend einzuhalten:

  • Offener Zugang zu den Daten, d.h. die Daten müssen offen und kostenlos als Gesamtheit im Web zugänglich sein.
  • Offene Standards, d.h. die Daten müssen in einem offen dokumentierten und nicht-proprietären Format vorliegen. Es sind Webstandards zu bevorzugen, die von einer möglichst breiten Anwenderbasis verstanden werden.
  • Offene Lizenzen, d.h. die Daten müssen (als Einzeldatum und als Sammlung) unter einer offenen Lizenz im Sinne der Open Definition publiziert werden. Dabei empfielt die DINI-AG KIM die Verwendung eines Public-Domain-Waivers wie der CC0 Public Domain Dedication oder der Public Domain Dedication and License (PDDL) um die bestmögliche rechtliche Interoperablität der Daten zu garantieren.

Darüber hinaus empfehlen wir die Berücksichtigung folgender Prinzipien:

  • Dokumentation: Eine strukturierte Beschreibung der Daten soll veröffentlicht werden. Bestenfalls sollen die Daten in einem zentralen Verzeichnis (wie z.B. thedatahub.org)nachgewiesen werden.
  • Rohdaten: Die Daten sollen möglichst so zugänglich gemacht werden, wie sie im Informationskreislauf der Bibliotheken anfallen. Jede weitere Filterung oder Aufbereitung wird auf diejenigen verlagert, die von den Informationen später Gebrauch machen.
  • Aktualität: Daten sollen innerhalb eines angemessenen Zeitraums nach ihrer Erstellung oder Änderung veröffentlicht werden. Was angemessen ist, kann je nach Art der Daten variieren.
  • Strukturiert: Die Daten sollen in einem strukturierten Format publiziert werden, das einfache maschinelle Verarbeitung ermöglicht.
  • Nicht-diskriminierend: Der Zugriff auf die Daten soll für alle möglich sein, einzige akzeptable Hürde ist der Zugang zum Internet. Das heißt, dass keine Registrierung erforderlich sein soll.
  • Nachhaltigkeit: Die Bereitstellung der Daten soll mit der Entwicklung eines Nachhaltigkeitskonzepts verbunden sein, dass eine dauerhafte Archivierung und den Zugriff auf ältere Versionen der Daten sicherstellt.

Selten wird die Einhaltung sämtlicher Prinzipien von Anfang an gewährleistet sein. Allerdings sind die ersten drei Prinzipien notwendige Bedingungen, um überhaupt von offenen bibliothekarischen Daten zu sprechen. Es wird ausdrücklich empfohlen, zunächst auch Rohdaten zu veröffentlichen, die womöglich nicht in einem öffentlich dokumentierten Format vorliegen und/oder nicht strukturiert oder regelmäßig aktualisiert werden. Mittelfristig soll aber an der Einhaltung sämtlicher Prinzipien gearbeitet werden.

4. Verwandte Materialien

Entstanden im Rahmen der Gruppe Lizenzen der DINI-AG KIM.
Beitragende: Patrick Danowski, Kai Eckert, Christian Hauschke, Adrian Pohl und andere

Der Text dieser Empfehlungen ist unter der Creative Commons Lizenz CC0 veröffentlicht. Er ist somit gemeinfrei, d.h. er gehört allen und darf zu beliebigen Zwecken und ohne Auflagen genutzt werden. Bei Nachnutzung wird die Nennung der Quelle erbeten.

Interview zur Öffnung bibliothekarischer Daten

Adrian Pohl wurde für das Open-Data-Blog der Zeit interviewt. Unbedingt lesenswert! Es geht um Open Bibliographic Data, also die Veröffentlichung bibliographischer Daten unter freier Lizenz.

Sammlungen bibliographischer Daten können als eine Landkarte verstanden werden, die uns Orientierung gibt in der Landschaft unserer literarischen, wissenschaftlichen oder künstlerischen Erzeugnisse.

So können die Daten etwa in der Forschung genutzt werden. Für Historiker beispielsweise könnte die Frage interessant sein, in welchem Jahrhundert zu bestimmten Zeiten wo wichtige Publikationsorte waren. Mit automatisierten Abfragen offener Daten aus Bibliothekskatalogen ließe sich zügig eine Übersicht über die meistgenutzten Publikationsstandorte erstellen. Das ginge weit über das hinaus, was mit normalen Rechercheoptionen möglich ist.

Ein anderes Beispiel: Bibliotheksdaten werden bereits für Anwendungen genutzt, die den urheberrechtlichen Status eines Werkes berechnen, ob es geschützt oder gemeinfrei ist. Mehr freie Daten könnten diese Dienste enorm verbessern. Es lassen sich unzählige weitere Anwendungen denken.

Dabei verweist er auch auf die “Empfehlungen zur Öffnung bibliothekarischer Daten” [1] Disclaimer: Ich bin Mitverfasser. , auf deren vorläufige Fassung Edlef Stabenau letztens schon hingewiesen hatte.

References

References
1 Disclaimer: Ich bin Mitverfasser.

Inetbib 2008: Repositories

Block 12: Repositories
Uwe Müller, HU Berlin: OA-Netzwerk

DFG-Projekt (HU Berlin, SUB Göttingen und Uni Osnabrück)

Erstmal Allgemeines zu OA.

Zweck von DINI: Steigerung der Akzeptanz in den Institutionen. Antragstellung per Fragebogen, zwei Gutachter (bibliothekarisch und technisch), Kosten ca. 250 €. Bisher 23 Zertifikate ausgegeben, mehrere zur Zeit in Bearbeitung.

Ziel: Stärkung der Repositorien, Erhöhung der Sicherheit, Aggregator für DRIVER, Verbesserung der OA-Infrastruktur. DINI-Zertifikat ist Exportschlager (z.B. Spanien, Indien).

OA-Netzwerk: OAI-Serviceprovider, Harvesting, Aggregation, Anreicherung, Bereitstellung. API ist vorgesehen.

Metasuche
Feeds
Anbindung an externe Nachweisdienste (Scirus, Scholar etc.)

Prototyp des OA-Netzwerks: Mitte 2008
Weitere Dienste geplant: OA-Statistik, OA-Citation
http://www.dini.de/oa-netzwerk

Thomas Severiens (UB Osnabrück) und Frank Scholze (UB Stuttgart): „Nutzungs- und Zitationsanalyse als alternative Impactmessung wissenschaftlicher Publikationen“
Qualitätsdienst I: OA-Statistik
Verbesserung des Impacts, Vergleichbare Nutzungsstatistik, Vernetzung von Statistiken, Gewichtung anhand von Nutzungsfaktoren. Die Relevanz von Werken soll exemplarübergreifend erfasst werden.

Qualitätsdienst II:OA-Zitationen
Werkzeug für Wissenschaftler als Autoren und Leser für die Suche und Organisation von Referenzen. Vernetzung über viele Repositorien anhand von Zitationsgraphen. Kooperation der Wissenschaftler oft nicht gegeben, wenn z.B. Referenzen standardisiert werden sollen („Zu viel Arbeit“).

Mirjam Kessler und Stefanie Rühle (KIM): „Interoperable Metadatenmodelle und Repositories“
Metasuche (Cross searching) vs. Suchmaschinenindex (harvesting)
Es liegen heterogene Datenformate vor. Interoperabilität kann nur durch Standardisierung von Metadatenformaten gewährleistet werden. Auch Standardisierung von Metadatenschnittstellen.

OAI-PMH im Vergleich zu OAI-ORE: Object Re-Use

Beispiel Geo-Leo. Singapore Framework.

FAZIT: Dieser Block war mein persönliches Highlight.