DLR-Bilder nun unter CC-Lizenz

Mathias Schindler weist im Wikimedia-Blog darauf hin, dass das Deutsche Zentrum für Luft- und Raumfahrt (DLR) ab sofort Bilder unter CC-Lizenz veröffentlicht.

Marco Trovatello beschreibt den Erkenntnisprozess des DLR im DLR-Blog:

Nicht nur, dass uns infolge von Mathias Schindlers Anfrage auffiel, dass wir Wikipedia hier sehr gerne unterstützen wollten – uns fiel auch auf, dass wir als Wissenschafts- und Technologiekommunikatoren das Teilen und damit die Verbreitung bzw. Multiplikation unserer Inhalte durch die allgemeine Öffentlichkeit und Medien unnötig erschwerten und dass wir bei genauer rechtlicher Auslegung unserer Nutzungsbedingungen auch den Medien genau das nicht eindeutig erlaubten, da die entsprechenden Verlage bzw. Unternehmen in den meisten Fällen kommerziell arbeitende Wirtschaftsunternehmen sind.

Das ganze Posting ist sehr lesenswert und beschreibt ausführlich die Überlegungen hinter diesem Schritt. Pflichtlektüre für alle Datenbefreier!

Linked Data der DNB nun Linked Open Data

Aus einer E-Mail von Julia Hauser:

Wir freuen uns, mitteilen zu können, dass der bestehende Linked Data-Service der Deutschen Nationalbibliothek um Titeldaten erweitert wird.

2010 hat die Deutsche Nationalbibliothek damit begonnen, Normdaten als Linked Data zu veröffentlichen. Der bestehende Linked Data Service der DNB [1] wird nun um Titeldaten erweitert. In diesem Zuge wird auch die Nutzungslizenz für Linked Data auf “Creative Commons Zero” [2] umgestellt.

Jetzt wurde der überwiegende Teil der Titeldaten der DNB – es fehlen z. B. noch Musikalien und die Bestände des Deutschen Exilarchivs – sowie die fortlaufenden Sammelwerke (Zeitschriften-, Zeitungs- und Schriftenreihentitel der Zeitschriftendatenbank (ZDB)) umgesetzt. Die RDF/XML-Repräsentation des jeweiligen Datensatzes ist ab sofort im Portal der DNB [3] über einen entsprechenden Link verfügbar. Es handelt sich ausdrücklich um einen experimentellen Dienst, der laufend erweitert und verfeinert werden soll. Nähere Informationen zu Fragen der Modellierung und des Vorgehens finden sich in der aktualisierten Dokumentation [4].

Der einzig richtige und wichtige Schritt! Die dazugehörigen Links:

[1] https://wiki.dnb.de/display/LDS/
[2] http://creativecommons.org/publicdomain/zero/1.0/
[3] http://portal.dnb.de/
[4] http://files.d-nb.de/pdf/linked_data.pdf

Fünf Jahre offizielle Open-Access-Heuchelei im deutschen Bibliothekswesen

“Heute vor fünf Jahren…” sollte dieser Artikel eigentlich anfangen. Nun ist es ein paar Tage später, doch der geneigte Leser ignoriere das bitte.

Also, genau heute vor fünf Jahren, am 12. August 2006, hat Klaus Graf in Archivalia ein Posting veröffentlicht mit dem zum geflügelten Wort avancierten Titel “Die Open-Access-Heuchelei der Bibliotheken”. Darin kritisiert er sieben Punkte:

(1) Bibliothekarische Fachzeitschriften sind nur zum kleinen Teil Open Access!
Kaum Änderung im deutschsprachigen Bereich. Bis auf Libreas ist da eigentlich nichts. Peinlich.

(2) Bibliothekarische Fachliteratur ist kaum OA!
Hier ist Verbesserung zu spüren, zum Beispiel mit dem Handbuch Bibliothek 2.0.

(3) Bibliotheken beliefern kostenpflichtige bibliographische Datenbanken!
Gilt weiter. Wenn es eine nicht-exklusive Lieferung ist, die Daten also jedem zur Verfügung stünden, wäre das übrigens auch nicht weiter zu beanstanden.

(4) Bibliotheken treten als Mitglieder von Digizeitschriften e.V. die Interessen von Bildung und Wissenschaft mit Füßen!
Gilt weiter.

(5) Bibliotheken denken nicht daran, “permission barriers” einzureissen!
Gilt generell nicht mehr. CC-Lizenzen sind inzwischen vielerorts im Einsatz.

(6) Sogar OAI-Metadaten werden nicht OA freigegeben!
Die Diskussion ist faktisch beendet, alle Argumente ausgetauscht. Der Trend geht zu CC0. Da wird in sehr kurzer Zeit sehr viel passieren.

(7) Die Bibliotheken betreiben in großem Stil Bildrechte-Tyrannei und Copyfraud!
Gilt weiter.

Fazit: Es sind Fortschritte zu erkennen. Insgesamt ist es jedoch ernüchternd, wie wenig sich in fünf Jahren bewegt hat. Wenn es in diesem Tempo weitergeht, können wir eine offene Fachkommunikation im Bibliothekswesen für ca. 2025 prognostizieren.

The Power of Open

The Power of Open ist eine Sammlung von Statements mehr oder weniger prominenter Kreativer zu freien Inhalten im Allgemeinen und Creative Commons im Speziellen, unter anderem von DJ Vadim oder Vincent Moon. Das Statement von Mark Patterson (PloS) zu “Research as a public resource”:

When the open access publisher Public Library of Science (PLoS) launched its first scientific journal, PLoS Biology, in 2003, it faced a serious uphill climb. Academics are judged not only by the quality of their work, but also by where that work is published. With career advancement, funding opportunities and reputations on the line, researchers are understandably selective.

“We had many conversations with scientists supportive of openness, but who had concerns about our lack of prestige and standing in the publishing world at that stage,” recalls Mark Patterson, PLoS director of publishing. “Because of our start as an advocacy organization for openness, we had a base of supporters. Eventually, their energy carried the day and soon a few researchers took the leap and published a great piece of their research in our open journal. That gave us the foundation to get to where we are today – a sustainable and growing source of high-quality open access research, publishing hundreds of articles a month.”

The core principle behind open access journals is impact. “We set out to remove all barriers to reusing research and transforming research literature into a resource for further research,” says Patterson. “Open access provides the maximum possible impact for both funders and researchers.”

Patterson now sees a very strong movement toward open access in the publishing field. “There are more open access journals being started, more content being published, and new policies are being developed at funding agencies and within institutions which are driving open access,” he said. “There is movement amongst all stakeholders. The question now is just how quickly can we make it happen.”

Creative Commons licensing has been an integral part of the success of open access publishing, and PLoS publishes all of its journals under the CC BY license. “CC has provided a strong, consistent signal that you can use openly published research to do with what you want,” says Patterson. “Because CC licenses are created by experts and have a solid legal foundation, they have become the gold standard in open access publishing.”

(CC: BY)

An einer Übertragung ins Deutsche wird gearbeitet.

[via CC-Blog]

Nina Paley: Credit is Due (The Attribution Song)

Urheberrechtlich einwandfreier Ohrwurm von Nina Paley. Hintergrund und Entstehungsgeschichte kann man hier und hier nachlesen.

Movie and song by Nina Paley
Performed by Evanescent (Vocals & Ukele: Bliss Blood, Guitar: Al Street)
Sound effects design by Greg Sextro

Always give credit where credit is due
if you didn’t write it, don’t say it’s by you
just copy the credit along with the work
or else you’ll come off as an arrogant jerk

Always give credit where credit belongs
we know that you didn’t write Beethoven’s songs
pretending you did makes you look like a fool
unless you’re Beethoven — in that case, it’s cool

A transparent system makes cheating unwise
the simplest web search exposes your lies
no one wants their reputation besmirched
which happens to liars when they are web-searched

Proper citation will make you a star
it shows that you know that we know who you are
Plagiarization will only harm you
so always give credit where credit is due!

Lizenz: CC-BY-SA

Linked Open Data der UB Mannheim

Die UB Mannheim ist nach der Veröffentlichung ihrer Katalogdaten im letzten Jahr nun den konkreten Schritt gegangen, diese durch freie Lizenzierung tatsächlich nachnutzbar zu machen. Mehr dazu im Blog der UB Mannheim.

Warum das so ein wichtiger Schritt ist, erläutert Greg Grossmeier von der University of Michigan in seinem “Commitment to Compatibility”. Fazit:

By using the most compatible license available from Creative Commons, MLibrary enables efficient content creation. We make it possible for users to worry less about license incompatibility and permissions — and instead spend more time on the actual creation of quality content. We hope to see the positive influence of this throughout the local, national, and international library communities.

Es lohnt sich jedoch, das ganze Posting zu lesen.

Danke an Kai für den Hinweis!

TIB-Katalogdaten zum Download

Die TIB hat Ihre Katalogdaten halbfrei zum Download bereit gestellt.

Sämtliche von der TIB für den Katalog erfassten bibliografischen Daten werden unter der CC-Lizenz Namensnennung – keine kommerzielle Nutzung – Deutschland 3.0 bereit gestellt und können heruntergeladen, modifiziert und für eigene Zwecke genutzt werden.

Durch die gewählte Lizenz ist eine umfassende Nutzung der Daten leider unmöglich, vgl. die Prinzipien zu offenen bibliographischen Daten:

Darüber hinaus empfehlen wir – insbesondere öffentlich finanzierte – bibliographische Daten und Sammlungen bibliographischer Daten explizit in die Public Domain zu geben durch die Nutzung der Public Domain Dedication and Licence oder des Creative Commons Zero Waivers. Dadurch werden die Nachnutzungsmöglichkeiten maximiert, ganz im Sinne des allgemeinen Ethos des Teilens im Bereich öffentlich geförderter Gedächtnisinstitutionen.

Aber eine Lizenz kann ja auch noch geändert werden, siehe Koblenz.

[via @nowakman]

SOAP-Daten unter CC0 zum Download

Wie angekündigt sind die Rohdaten des SOAP-Projekts (Study of Open Access Publishing) nun unter CC0 frei verfügbar.

  • Ankündigung auf der Projektseite mit Downloadmöglichkeiten (CSV, XLS. Der Downloadlink für XLSX ist defekt 1) Wieder einmal ein Hinweis darauf, dass Shortlinks nirgendwo verwendet werden sollten, wo nicht wirklich Zeichen eingespart werden müssen! Das Data Manual wird hier verlinkt, sobald es nicht nur via Shortlink verfügbar ist. )
  • Download hier als CSV (ca. 25 MB)
  • Download hier als ODS (ca. 4,5 MB) 2) Kann mir jemand erklären, warum die ODS-Datei nur knapp ein Fünftel der Größe der CSV-Datei hat? Liegt es daran, dass mehrfach auftretende Werte in der CSV-Datei jedes einzelne Mal in voller Länge erwähnt werden müssen?

Nun ist der Weg frei für Untersuchungen und Stichproben jeglicher Art. Als kleines Beispiel habe ich einmal die Zustimmung der Wissenschaftler, die sich hauptsächlich den Historical and Philosophical Studies zugehörig fühlen, zur These “OA articles are likely to be read and cited more often than those not OA” untersucht.

Strongly Agree 315
Agree 449
Neither agree nor disagree 265
Disagree 73
Strongly disagree 10
Keine Antwort 70
Summe 1182

Dies ist Stoff für Dutzende von Abschlußarbeiten und hervorragendes Argumentationsmaterial für Bibliothekswesen!

References   [ + ]

1. Wieder einmal ein Hinweis darauf, dass Shortlinks nirgendwo verwendet werden sollten, wo nicht wirklich Zeichen eingespart werden müssen! Das Data Manual wird hier verlinkt, sobald es nicht nur via Shortlink verfügbar ist.
2. Kann mir jemand erklären, warum die ODS-Datei nur knapp ein Fünftel der Größe der CSV-Datei hat? Liegt es daran, dass mehrfach auftretende Werte in der CSV-Datei jedes einzelne Mal in voller Länge erwähnt werden müssen?

ZB MED befreit Katalogisate

Im Rahmen der Expertenkonferenz Open Access and Open Data hat die Deutschen Zentralbibliothek für Medizin (ZB MED) in einer Pressemitteilung bekannt gegeben, dass die Katalogisate der ZB MED ab sofort unter CC0 zum Download, zur Verbreitung, Bearbeitung etc. bereit stehen.

Die Deutsche Zentralbibliothek für Medizin (ZB MED) stellt ab sofort ihre Katalogdaten zur freien Nutzung bereit. Dazu gehören über 1.000.000 Medien – unter anderem Bücher und Zeitschriften – aus den Fachbereichen Medizin, Gesundheit, Ernährungs-, Umwelt- und Agrarwissenschaften. Durch eine Freigabe der Daten unter einer CC0-Lizenz ist es möglich, ohne jegliche Beschränkung die Daten herunter zu laden, zu modifizieren und für eigene Zwecke zu nutzen.

Die Daten sind auf der Open-Data-Seite im HBZ-Wiki im Format RDF – ISO 2709 zu finden. Die Daten sind vom Mai 2010 und in zwei Downloads (“Ernährung, Umwelt, Agrar” und “Medizin, Gesundheit”) unterteilt.

Bibliotheken als Datenanbieter

Alexander Stocker, Peter Scheir und Klaus Tochtermann beschreiben in “Die Wertschöpfungskette der Daten” 1) Die Wertschöpfungskette der Daten : eine Basis für zukünftige wirtschaftswissenschaftliche Betrachtungen des Web of Data. HMD – Praxis der Wirtschaftsinformatik, Heft 275/2010, S. 94-104 vier mögliche Rollen 2) S. 99 in eben dieser Wertschöpfungskette.

  1. Anbieter von Daten am Web sind derzeit noch
    fast ausschließlich Anbieter von Rohdaten. […]
  2. Anbieter von Semantic-Web-Daten sind solche,
    die Daten in einem durch Maschinen interpretierbaren
    Format bereitstellen.[…]
  3. Anbieter von Semantic-Web-Applikationen
    sind solche, die eigene oder fremde Semantic-
    Web-Daten in einer Semantic-Web-Anwendung
    verarbeiten und dabei für den Menschen
    konsumierbaren Output auf Basis der
    verarbeiteten Daten generieren. […]
  4. Endnutzer sind schließlich alle Menschen, die
    eine durch Menschen interpretierbare Präsentation
    von Semantic-Web-Daten konsumieren. Menschliche Endnutzer kommen in der Praxis nicht direkt mit den für die Verarbeitung
    durch Maschinen aufbereiteten Semantic-Web-Daten in Berührung und wollen das vermutlich auch gar nicht.[…]

Bibliotheken können prinzipiell alle vier Rollen einnehmen.

Zuerst natürlich als Rohdatenanbieter von bibliographischen und anderen Daten. Wenn man weitere Wertschöpfungen zulassen möchte, müssen die Daten zwingend unter einer Lizenz veröffentlich werden, die Weiterverarbeitung jeglicher Art nicht ausschließt. Richtig gemacht haben es also unter anderem die Bibliothek des CERN oder USB Köln, die wie alle vom HBZ betreuten Open-Bibliographic-Data-Projekte unter CC0 publiziert sind.

Das Anbieten von Semantic-Web-Daten kann teils im gleichen Auslieferungsschritt erfolgen. Ein Beispiel ist die gestern erfolgte Veröffentlichung eines Teils des Katalogs der British Library als RDF-Dump. Auf der Webseite der BL sind die Bedingungen erläutert:

As part of its work to open its metadata to wider use beyond the traditional library community, the British Library is making copies of its main catalogue and British National Bibliography datasets available for research purposes. Files are initially being made available in RDF/XML […] and are distributed under a Creative Commons CC0 1.0 Universal Public Domain Dedication license.

Eine Weiterverarbeitung ist ausdrücklich erwünscht und durch die gewählte Lizenz auch möglich. Linked Data will auch die Deutsche Nationalbibliothek mit der GND anbieten. In die Wertschöpfungskette können die Daten jedoch nicht gelangen, da die Daten nicht kommerziell genutzt werden dürfen. Abgesehen davon, dass es volkswirtschaftlicher Unsinn ist, staatlich finanzierte Daten nicht zur Verwendung in kommerziellen Unternehmungen freizugeben, ist damit auch die Verwendung in der Wikipedia und Schwesterprojekten nicht möglich. Leider gilt hier: nur gucken, nicht anfassen!

Im Open Bibliographic Data Guide hat das JISC erläutert, wie man es richtig macht. Oliver Flimm schreibt (zum Reader und der Wichtigkeit der Lizenzwahl):

Nur so kann ein realer Nutzen innerhalb der Bibliothekswelt und anderswo entstehen. So sind wir z.B. sehr dankbar über Rückmeldungen von Fehlern in Verbund-Katalogisaten, bei denen wir Bestand haben, (Verknüpfung von Titeln mit Personensätzen, die eine falsche PND besitzen), die extern bei der Verarbeitung unserer geöffneten Daten aufgefallen sind.

Über Bibliotheken in den anderen beiden Rollen, also als Datennutzer wird es hier demnächst etwas zu lesen geben.

Weitere Informationen zu Open Bibliographic Data:

Adrian Pohl: Open Bibliographic Data in 2010. Ein vorläufiger Überblick

References   [ + ]

1. Die Wertschöpfungskette der Daten : eine Basis für zukünftige wirtschaftswissenschaftliche Betrachtungen des Web of Data. HMD – Praxis der Wirtschaftsinformatik, Heft 275/2010, S. 94-104
2. S. 99