ZDB als Open Data

Eine fantastische Nachricht hat die DNB veröffentlicht:

Seit Juni 2014 ist der größte Teil der Metadaten der Zeitschriftendatenbank (ZDB) unter den Bedingungen „Creative Commons Zero (CC0 1.0)“ verfügbar. Damit sind rund 1,7 Mio. Titeldaten in allen Sprachen und ohne zeitliche Einschränkung mit über 13 Mio. Besitznachweisen für die Weiterverwendung freigegeben. Die Freigabe bezieht sich ausdrücklich auch auf die kommerzielle Nutzung. Durch diesen Schritt wird die Nachnutzung der qualitativ hochwertigen Metadaten der weltweit größten Datenbank für Titel- und Besitznachweise fortlaufender Sammelwerke, also von Zeitschriften, Zeitungen, Schriftenreihen und anderen periodisch erscheinenden Veröffentlichungen in gedruckter und elektronischer Form, für jedermann möglich.

Ich lade mir dann mal die ZDB runter. Wer es mir nachtun möchte: hier geht es zu den Downloads.

[via Netbib]

Deutsche RDA für 12 Monate frei einsehbar

Die deutsche Übersetzung der RDA (Resource Description and Access) ist auf der Webseite der DNB verfügbar. Erst einmal zumindest:

Die Deutsche Nationalbibliothek hat es als Vertragspartnerin der RDA-Rechteinhaber erreicht, dass die Übersetzung des Regelwerkstexts für die Dauer von 12 Monaten kostenfrei zugänglich gemacht werden darf. In diesem Zeitraum sollten alle Interessenten die Gelegenheit nutzen, sich mit dem Standard vertraut zu machen. Nach Ablauf dieser Frist müssen die Dateien aus dem Webangebot der DNB entfernt werden.

Danach kann niemand mehr die Gelegenheit nutzen, sich mit dem Angebot vertraut zu machen. Wäre ja noch schöner, wenn sich jeder einfach mit einem Standard vertraut machen könnte! Hinz und Kunz! Denn Standards sind ja bekanntlich besonders dann nützlich, wenn sie unter Verschluss gehalten werden. Und zukünftige Berufsanfänger sind selbst schuld. Sie hätten ja früher geboren werden können.

Wer von den jetzt schon RDA-Interessierten vielleicht länger als 12 Monate benötigt, um sich mit RDA vertraut zu machen, kann übrigens ratzfatz ein Privatarchiv anlegen per Firefox-Erweiterung DownThemAll. In meinem Fall hat der Download inkl. Umbenennung aller Dateien nach Link-Text etwa eine halbe Minute gedauert. Video: 1) Ja, ich habe gerade Screenr für mich wiederentdeckt…

Die verwendeten Optionen (falls es im Filmchen zu schnell geht):

  1. Umbenennungstext: *flattext*.*ext*
  2. Filter: “Alle Dateien” anhaken
  3. Schnelles Filtern: pdf
  4. Andere Filter deaktivieren: anhaken
  5. Dateien speichern in: das muss man schon selbst wissen…

Und schon hat man seine Privatkopie.

[via @suwannie]

References   [ + ]

1. Ja, ich habe gerade Screenr für mich wiederentdeckt…

100 Jahre Deutsche Nationalbibliothek

Anlässlich der Gründung der Deutschen Bücherei in Leipzig am 3. Oktober 1912 zeigt der MDR heute um 20:45 Uhr die dreißigminütige Sendung “Der Bücherturm – 100 Jahre Deutsche Nationalbibliothek”

Sie ist zum Sammeln verdammt – per Gesetz und weltweit. Täglich gehen bei der Deutschen Nationalbibliothek 1.400 Bücher und Tonträger ein. Ständig muss erweitert, vergrößert, angebaut werden. In der Dokumentation geht es um die turbulente Historie, aber auch und vor allem um das lebendige Heute: das staunenswerte Innenleben der Deutschen Nationalbibliothek in Leipzig.

Schufa will auch DNB-Katalog nutzen

Wie gerade bekannt wurde, plant die Schufa eine Kooperation mit dem Hasso-Plattner-Institut (HPI). Federführend für das Projekt SchufaLab@HPI auf Seite des HPI ist Felix Naumann. Untersucht werden soll laut NDR, wie Daten aus dem Web genutzt werden können, um die Kreditwürdigkeit von Personen besser einschätzen zu können. Dazu wird u.a. erwogen, soziale Netzwerke wie Facebook oder Twitter auszuwerten.

Dem NDR liegen “vertrauliche Dokumente” vor, die das Forschungsvorhaben genauer skizzieren:

Man spricht von “Projektmöglichkeiten und Denkrichtungen”, die jedoch vor allem in eine Richtung gehen: aus unzähligen Quellen im Internet sollen gezielt Daten über Verbraucher gesammelt werden. Bei Facebook zum Beispiel, wo man auch die Kontakte der Mitglieder betrachten könne, um Beziehungen zwischen Personen zu untersuchen und hierbei Zusammenhänge mit der Kreditwürdigkeit der Verbraucher zu finden. Doch die Liste ist viel länger: Es geht um berufliche Netzwerke wie Xing oder LinkedIn, den Kurznachrichtendienst Twitter, Personensuchmaschinen wie Yasni, Geodatendienste wie Google Street View und selbst Mitarbeiterverzeichnisse von Unternehmen oder den Autorenkatalog der Deutschen Nationalbibliothek.

Der Autorenkatalog der DNB? Positiv, wenn man überhaupt auftaucht? Oder je nach Verschlagwortung der von der Person geschriebenen Werke?

Ich bin gespannt, ob die Gesellschaft für Informatik, deren assoziiertes Mitglied Felix Naumann ist, auf die Einhaltung der “Ethischen Leitlinien” aufmerksam machen wird. Ich greife mal Artikel 7 (“Beteiligung”) heraus:

Vom Mitglied in einer Führungsposition wird zusätzlich erwartet, dass es dazu beiträgt, die von der Einführung von Informatiksystemen Betroffnen [sic!] an der Gestaltung der Systeme und ihrer Nutzungsbedingungen angemessen zu beteiligen. Von ihm wird insbesondere erwartet, dass es keine Kontroll- und Überwachungstechniken ohne Unterrichtung und Beteiligung der Betroffenen zulässt.

Wenn die Berichterstattung des NDR korrekt ist, bekommen wir hier die schmutzige dunkle Kehrseite der Open-Data-Idee zu sehen. Herrn Naumann und seinen Kollegen wären hier Pionierleistungen zu bescheinigen! Unter Vorbehalt sage ich schon mal: “Glückwunsch”!

Siehe auch:Netzpolitik, Heise, viele andere. Die Forschungsmafia malt sich schon die kommende Kredit-SEO aus. Und der Postillon gibt hilfreiche Tipps.

Linked Data der DNB nun Linked Open Data

Aus einer E-Mail von Julia Hauser:

Wir freuen uns, mitteilen zu können, dass der bestehende Linked Data-Service der Deutschen Nationalbibliothek um Titeldaten erweitert wird.

2010 hat die Deutsche Nationalbibliothek damit begonnen, Normdaten als Linked Data zu veröffentlichen. Der bestehende Linked Data Service der DNB [1] wird nun um Titeldaten erweitert. In diesem Zuge wird auch die Nutzungslizenz für Linked Data auf “Creative Commons Zero” [2] umgestellt.

Jetzt wurde der überwiegende Teil der Titeldaten der DNB – es fehlen z. B. noch Musikalien und die Bestände des Deutschen Exilarchivs – sowie die fortlaufenden Sammelwerke (Zeitschriften-, Zeitungs- und Schriftenreihentitel der Zeitschriftendatenbank (ZDB)) umgesetzt. Die RDF/XML-Repräsentation des jeweiligen Datensatzes ist ab sofort im Portal der DNB [3] über einen entsprechenden Link verfügbar. Es handelt sich ausdrücklich um einen experimentellen Dienst, der laufend erweitert und verfeinert werden soll. Nähere Informationen zu Fragen der Modellierung und des Vorgehens finden sich in der aktualisierten Dokumentation [4].

Der einzig richtige und wichtige Schritt! Die dazugehörigen Links:

[1] https://wiki.dnb.de/display/LDS/
[2] http://creativecommons.org/publicdomain/zero/1.0/
[3] http://portal.dnb.de/
[4] http://files.d-nb.de/pdf/linked_data.pdf

#0zapftis: Wer archiviert die CCC-Schriften?

Der CCC hat einen Staatstrojaner analysiert (ob Bundestrojaner oder Landestrojaner) und der Aufschrei ist groß. Die Folgen werden es hoffentlich ebenso sein. Wer auch immer dies veranlasst hat, hier reicht ein einfacher Rücktritt nicht aus.

Irgendein Innenminister wird vermutlich in Kürze sein Amt abgeben müssen. Dies wird für Politikwissenschaftler heute und Historiker in späteren Zeiten interessant sein. Jetzt sind die Quellen zahlreich. FAZ, Zeit Online, Fefe, Netzpolitik und viele andere dokumentieren den Fall. Vieles, vielleicht auch dieser Artikel bei Heute.de wird in Kürze “depubliziert” oder aus anderen Gründen nicht mehr verfügbar sein. Vielleicht auch die Analyse des CCC (PDF) nicht.

Wer archiviert solche Reports? Im Katalog der DNB habe ich nur neun Publikationen des Chaos Computer Club. Da der Output dort doch etwas größer ist, vermute ich, dass dortige Netzpublikationen nicht eingesammelt werden. Müssen sich kommende Generationen auch Archive.org und ähnliche Initiativen verlassen?

Empfehlungen zur Zukunft des bibliothekarischen Verbundsystems in Deutschland

Die Empfehlungen zur Zukunft des bibliothekarischen Verbundsystems in Deutschland (PDF) sind nun veröffentlicht. Gefordert wird ein Wechsel weg von den regional ausgerichteten Strukturen. Insgesamt sei das jetzige System nicht effektiv. Die auf den ersten Blick wichtigsten Passagen aus der dazugehörigen gemeinsamen Erklärung der Deutschen Forschungsgemeinschaft und des Wissenschaftsrates zur Zukunft der Bibliotheksverbünde als Teil einer überregionalen Informationsinfrastruktur in Deutschland:

3 – Im Gesamtsystem der Verbünde sollte zukünftig eine primär funktional und verbindlich koordinierte Arbeitsteilung entwickelt werden. Dienste sollen verbundübergreifend in einer modernen technischen Architektur offener Systeme zentralisiert angeboten und, wenn sachlich geboten, mit einem regionalen Betrieb kombiniert werden.

Offene, zentral angebotene Dienste. In Teilen ist dies ja schon der Fall. So steht zum Beispiel das OPUS-Hosting des BSZ auch Bibliotheken außerhalb des BSZ offen.

4 – Mit einer Integration bislang regional geführter Kataloge und Dienste auf nationaler und internationaler Ebene sollen Redundanzen und eine heute so nicht mehr benötigte Komplexität der Verzeichnungsstrukturen vermieden werden.

Kann man als Plädoyer für zentrales Indexhosting betrachten, wie es auch hier diskutiert wird.

5 – Die Verbünde sollten mit ihren überregionalen Serviceanteilen in eine zukünftige bundesweite Koordination von Informationsdienstleistungen integriert sein. Dies schließt internationale Kooperationen ein.

6 – Für die Koordinierung des zukünftigen Verbundsystems ist ein Strategie- und Steuerungsgremium erforderlich, das für die Umsetzung der einzelnen Schritte im gesamten System über die erforderlichen Kompetenzen verfügt.

Hier wird es äußerst spannend. Was für ein Gremium soll das sein? Kompetenznetzwerk für Bibliotheken? Das Deutsche Bibliotheksinstitut gibt es ja nicht mehr. DNB?

9 – Mit dem intendierten Systemwechsel von einer primär regional zu einer funktional organisierten Verbund- bzw. Dienstleistungsstruktur wird eine leistungs- und zukunftsfähige überregionale
Informationsinfrastruktur für Wissenschaft und Forschung nachhaltig ausgebaut und
gesichert.

Wenn die Aufgaben zwischen den Verbünden nun nicht mehr nach Regionen verteilt sind, ist ein Hauen und Stechen bezüglich der zukunftsträchtigsten Aufgaben zu befürchten.

Bibliotheken als Datenanbieter

Alexander Stocker, Peter Scheir und Klaus Tochtermann beschreiben in “Die Wertschöpfungskette der Daten” 1) Die Wertschöpfungskette der Daten : eine Basis für zukünftige wirtschaftswissenschaftliche Betrachtungen des Web of Data. HMD – Praxis der Wirtschaftsinformatik, Heft 275/2010, S. 94-104 vier mögliche Rollen 2) S. 99 in eben dieser Wertschöpfungskette.

  1. Anbieter von Daten am Web sind derzeit noch
    fast ausschließlich Anbieter von Rohdaten. […]
  2. Anbieter von Semantic-Web-Daten sind solche,
    die Daten in einem durch Maschinen interpretierbaren
    Format bereitstellen.[…]
  3. Anbieter von Semantic-Web-Applikationen
    sind solche, die eigene oder fremde Semantic-
    Web-Daten in einer Semantic-Web-Anwendung
    verarbeiten und dabei für den Menschen
    konsumierbaren Output auf Basis der
    verarbeiteten Daten generieren. […]
  4. Endnutzer sind schließlich alle Menschen, die
    eine durch Menschen interpretierbare Präsentation
    von Semantic-Web-Daten konsumieren. Menschliche Endnutzer kommen in der Praxis nicht direkt mit den für die Verarbeitung
    durch Maschinen aufbereiteten Semantic-Web-Daten in Berührung und wollen das vermutlich auch gar nicht.[…]

Bibliotheken können prinzipiell alle vier Rollen einnehmen.

Zuerst natürlich als Rohdatenanbieter von bibliographischen und anderen Daten. Wenn man weitere Wertschöpfungen zulassen möchte, müssen die Daten zwingend unter einer Lizenz veröffentlich werden, die Weiterverarbeitung jeglicher Art nicht ausschließt. Richtig gemacht haben es also unter anderem die Bibliothek des CERN oder USB Köln, die wie alle vom HBZ betreuten Open-Bibliographic-Data-Projekte unter CC0 publiziert sind.

Das Anbieten von Semantic-Web-Daten kann teils im gleichen Auslieferungsschritt erfolgen. Ein Beispiel ist die gestern erfolgte Veröffentlichung eines Teils des Katalogs der British Library als RDF-Dump. Auf der Webseite der BL sind die Bedingungen erläutert:

As part of its work to open its metadata to wider use beyond the traditional library community, the British Library is making copies of its main catalogue and British National Bibliography datasets available for research purposes. Files are initially being made available in RDF/XML […] and are distributed under a Creative Commons CC0 1.0 Universal Public Domain Dedication license.

Eine Weiterverarbeitung ist ausdrücklich erwünscht und durch die gewählte Lizenz auch möglich. Linked Data will auch die Deutsche Nationalbibliothek mit der GND anbieten. In die Wertschöpfungskette können die Daten jedoch nicht gelangen, da die Daten nicht kommerziell genutzt werden dürfen. Abgesehen davon, dass es volkswirtschaftlicher Unsinn ist, staatlich finanzierte Daten nicht zur Verwendung in kommerziellen Unternehmungen freizugeben, ist damit auch die Verwendung in der Wikipedia und Schwesterprojekten nicht möglich. Leider gilt hier: nur gucken, nicht anfassen!

Im Open Bibliographic Data Guide hat das JISC erläutert, wie man es richtig macht. Oliver Flimm schreibt (zum Reader und der Wichtigkeit der Lizenzwahl):

Nur so kann ein realer Nutzen innerhalb der Bibliothekswelt und anderswo entstehen. So sind wir z.B. sehr dankbar über Rückmeldungen von Fehlern in Verbund-Katalogisaten, bei denen wir Bestand haben, (Verknüpfung von Titeln mit Personensätzen, die eine falsche PND besitzen), die extern bei der Verarbeitung unserer geöffneten Daten aufgefallen sind.

Über Bibliotheken in den anderen beiden Rollen, also als Datennutzer wird es hier demnächst etwas zu lesen geben.

Weitere Informationen zu Open Bibliographic Data:

Adrian Pohl: Open Bibliographic Data in 2010. Ein vorläufiger Überblick

References   [ + ]

1. Die Wertschöpfungskette der Daten : eine Basis für zukünftige wirtschaftswissenschaftliche Betrachtungen des Web of Data. HMD – Praxis der Wirtschaftsinformatik, Heft 275/2010, S. 94-104
2. S. 99

Wer bloggt über was?

Gerhard Hachmann beklagt das Schweigen im Bloggerwald zu einer neuen Auflage des Lehrbuches Basiskenntnis Bibliothek von Böttger. Er kann sich nicht erklären, warum es bis auf einen kleinen Hinweis auf die Existenz des Buches nichts dazu gebloggt wurde. Keine Rezension, rein gar nichts.

Wird das Buch ignoriert, weil es sich “nur” um eine Fachkunde für die FaMIs handelt? Weil es sowieso alle schon kennen? Weil es ausschließlich als Printmedium erscheint? Weil es nicht um einen in die Zukunft gerichteten 2.0-Inhalt geht? Weil in der Biblioblogosphäre Ausbildungsfragen so gut wie gar nicht thematisiert werden, und sich keiner für so etwas zuständig fühlt?

In dieser Reihenfolge: Jein. Nein. Nein. Eher ja. Ja, und ja.

1. Die meisten Biblioblogger (alle?) betreiben ihr Geblogge mehr oder weniger privat, zumindest zusätzlich zum normalen Arbeitspensum. Sie decken damit ihre beruflichen und privaten Interessen ab. Obwohl die deutschsprachige Biblioblogosphäre schon vielfältiger wird, ist die Dominanz von eher web-affinen BibliothekarInnen nicht zu übersehen. Anscheinend bloggen hauptsächlich mit der Ausbildung befasste Bibliothekswesen bislang nicht oder nicht zu diesem Thema.

2. Ich habe das Buch zufällig am Donnerstag oder Freitag in der Hand gehabt, da ich es bei einem Kollegen sah. Aber ich kenne es in der Tat nicht.

3. Printmedien sind nicht komplett außerhalb der Wahrnehmungssphäre. Zumindest nicht außerhalb meiner. Aber eine PDF-Version wäre sicherlich häufiger erwähnt worden. Wenn auch nur, weil das noch etwas besonderes ist.

4. Siehe Punkt 1: Es geht in Biblioblogs überwiegend um “Web-Themen”. Das ist meines Erachtens höchst logisch, da die Medien, in denen wir uns hier bewegen, selbst noch genügend Neues bieten, das beschrieben werden will und muss. In neueren Biblioblogs geht es aber auffällig oft nicht primär um das Web selbst, sondern z.B. um Schulbibliotheken, Leseförderung, Katalogisierung von asiatischen Schriften und vielleicht auch bald um die FAMI-Ausbildung.

5. Ich fühle mich in der Tat nicht zuständig. Weil ich mich bloggerisch für überhaupt nichts zuständig fühle. Ich blogge über Themen, die mich interessieren, ohne Vollständigkeitsanspruch. Wer ein Thema aufgegriffen sehen möchte, mag sich gerne selbst darum kümmern. Der Teil in den 2.0-Theorien, der sich um Partizipation dreht, ist durchaus ernstzunehmen. Frei nach JFK: Frag nicht, was die Biblioblogosphäre für Dich tun kann, sondern frag, was Du für sie machen kannst.

Es gibt zahlreiche Themen, die in Biblioblogs nicht behandelt werden, obwohl sie durchaus ihre Leserschaft im vielzitierten Long Tail fänden. Ein paar Desiderate (wie es in der DFG-Prosa immer so schön heißt) meinerseits wären zum Beispiel:

  • Immer noch Blogs von Niggemann, Lux & Co
  • bloggende ProfessorInnen an den Fachhochschulen, die sich dem Bibliothekswesen in irgendeinem Sinne widmen. Ich weiß nicht, ob ich die Ausnahmen loben oder das restliche Schweigen peinlich finden soll.
  • BibliotheksdirektorInnen scheinen ihre Meinung auch nicht gerne öffentlich zur Diskussion stellen zu wollen.
  • Die ganzen EDV-Leute in den Bibliotheken, die tagein, tagaus an irgendwelchen Perl-Skripten basteln, die jeden Tag das Rad neu erfinden: Tausch Euch aus! Stellt Eure Skripte ins Netz.

Was brauchen wir? Mehr und unterschiedliche Biblioblogs. Ganz klar. Also, Bibliothekswesen, hört die Signale! Auf ins Gefecht Web 2.0!

[via Netbib]