Wie viele Bibliotheken gibt es in Deutschland?

Die Antwort auf die Frage, wie viele Bibliotheken es in Deutschland gäbe, lautet seit vielen Jahren klassischerweise “um die 10.000”. Und damit hat man schon viele Außerbibliothekarische überrascht. Das Lobid-Team hat eine große Datensammlung von und über Organisationen und nach einer Auszeichnung aller Bibliotheken als eben solche (siehe Github) konnte die Frage nun exakter beantwortet werden. Und es sind nicht “um die 10.000”. Nimmt man Pfarrbibliotheken dazu, sind es nun satte 19.347 ca. 19.000 Bibliotheken in Deutschland!

By MyName (Luckyprof (talk)) (Own work) [CC BY-SA 3.0 at], via Wikimedia Commons
Eine Pfarrbibliothek im Hintergrund des Schlosses Eberschwang. Von Luckyprof [CC BY-SA 3.0 at], via Wikimedia Commons

Die Ergebnisse der Abfrage sind hier zu finden, die Twitter-Konversation zu dieser Frage findet sich hier.

UPDATE: Die Zahl 19.347 ist leider nicht ganz korrekt, spiegelt aber wohl zumindest die richtige Größenordnung wieder. Mehr im ersten Kommentar von Adrian Pohl.

xISSN und Google Refine: Infos über Zeitschriften sammeln

Für Vertragsverhandlungen wollte ich herausfinden, bei welchen Verlagen die Autoren unserer Hochschule Zeitschriftenartikel veröffentlicht haben. In einem Citaviprojekt habe ich eine Stichprobe von ca. 1000 Artikeln, die ich verwenden wollte. Das Problem: In Citavi sind die Zeitschriftenverlage nicht ordentlich zu hinterlegen. Die Lösung: wir haben die ISSN, und mit xISSN gibt es eine ganz brauchbare Schnittstelle, um mehr Daten zu einer ISSN zu bekommen.

Das Vorgehen:
Die Artikeldaten wurden inklusive ISSN in eine CSV-Tabelle exportiert. Diese CSV-Tabelle habe ich in Google (oder Open) Refine importiert. Dort ging es dann weiter. Zunächst habe ich die Spalte ISSN auf jeweils eine ISSN reduziert. In einigen Fällen waren mehrere ISSN (online und offline) im Feld.

Transform auf der Spalte ISSN mit dem Kommando slice(value, -9) nimmt die jeweils 9 letzten Zeichen und wirft den Rest weg. Aus 1234-5678, 9876-5432 wird also 9876-5432.

ISSN-Analyse in Google Refine

Danach “Add column by fetching urls on column ISSN” mit dem Kommando “http://xissn.worldcat.org/webservices/xid/issn/”+value+”?method=getHistory&format=json”, mit Anführungszeichen! Das dauert dann ganz schön. In meinem Fall hat es ca. zwei bis drei Stunden gedauert für etwa 1000 Titel.

Danach erhalte ich eine Spalte, in der die Daten zu einer Zeitschrift im JSON-Format enthalten sind. Daraus wiederum extrahiere ich eine neue Spalte (“Add column based on this column”) mit value.parseJson().group[0].list[0].publisher. Fertig.

Naja, es muss dann noch ein bißchen aufgeräumt werden. Allein Springer fand ich in 5 verschiedenen Schreibweisen, ebenso die American Physical Society. Aber prinzipiell war es das.

Ein konkreter Anwendungsfall für Open Data

Diskussionen über Open Data bleiben oft abstrakt, die Frage nach einem konkreten Anwendungsfall schwebt immer wieder im Raum. “Wer will denn überhaupt diese Daten haben?” Um diese Frage mit einem Beispiel zu beantworten: ich.

Mein Anwendungsfall ist der Aufbau einer Hochschulbibliographie. Dort sollen nicht nur die Autoren und ihre Publikationen verzeichnet werden, das System soll vielmehr ein Abbild der Forschungsaktivität der Hochschule sein. Dazu setzen wir auf VIVO. Und VIVO arbeitet mit Linked Data.

Ich habe das System und seine Komponenten hier im Blog schon beschrieben. Um meinen Anwendungsfall zu verstehen, reicht ein Blick auf dieses Profil der Boeing Company im VIVO der Cornell University.

Man kann in VIVO also Firmen abbilden, die in irgendeiner Art mit der Forschungs-, Lehr- oder Publikationstätigkeit in Verbindung stehen. Dies ist von vielen Seiten gewünscht. Manche möchten Transparenz darüber, wer die Hochschulforschung finanziert. Andere möchten wissen, welche ProfessorInnen die fleissigsten Drittmitteleinwerber sind. Manche möchten sich dadurch einfach als industrienah präsentieren oder sind auf der Suche nach neuen Kooperationspartnern. Motive gibt es vielerlei.

Nun kann man diese Daten natürlich per Hand eingeben oder die hausintern vorliegenden Daten (die berühmten Excel-Tabellen) nachnutzen. Doch ist das wirklich notwendig? Warum muss jede Hochschule diese Daten selbst pflegen? Welcher Aufwand steckt dahinter, die Daten korrekt und vollständig zu halten? Ich kann ihn nicht beziffern, eine grobe und meines Erachtens durchaus realistische Abschätzung lautet allerdings: er ist mir zu groß.

Und hier kommt der deutsche Datengeiz ins Spiel. OpenCorporates ist ein Verzeichnis für Firmeninformationen. Eines der besonderen Art. Die Daten sind unter ODbL lizenziert, es gibt tolle Schnittstellen und es finden sich dort Infos über sagenhafte 62,035,536 Firmen. Ein beachtlicher Berg!

Davon sind 40,155 aus Albanien, 45,423 aus Aruba, 68,711 aus Pakistan, 104,852 aus Gibraltar, 535,779 aus Irland, 723,842 aus Norwegen, 1,559,918 aus Südafrika oder 8,199,109 aus Großbritannien. Aus Deutschland: 0. Keine einzige.

Nichts gegen Aruba! Eine Insel, deren Wahlspruch “Una isla feliz” (kreolisch für “Eine glückliche Insel”) sicherlich berechtigt ist. Auch die wirtschaftlichen Aktivitäten sind bei 45.000 Firmen auf etwa 100.000 Einwohnern sehr beachtlich. Aber wie kann es sein, dass Aruba schafft, was für Deutschland nicht möglich ist? Liegt es daran, dass der Wahlspruch Deutschlands “Amtsgeheimnis” lauten könnte?

Die Diskussion darüber hatte ich kürzlich erst mit OKF DE, Marian Steinbach und Friedrich Lindenberg. Es wird Zeit, dass sich etwas tut.

Google schafft RSS-Alerts ab

Google 1) Wird’s Zeit für eine eigene Kategorie mit Googles abgeschafften Diensten? schafft RSS-Alerts ab, berichtet Jürgen auf Netbib. Was soll’s, Google? Wer braucht schon freie, offene und etablierte Standards, wenn man statt dessen – ja, was eigentlich? Marco Ament (Instapaper) hat sich dem Thema ausführlich gewidmet und zitiert zum Thema Niedergang der Schnittstellen:

But [Facebook] did grow. And grow. And grow. And suddenly the AOL business model didn’t seem so crazy anymore. It seemed ahead of its time.

Once Facebook had proven that it was possible to be the one-stop-shop for your user’s every need, that became the model to emulate. Startups stopped seeing themselves as just one part of a bigger web. Now they wanted to be the only service that their users would ever need… just like Facebook.

Seen from that perspective, the open flow of information via APIs — allowing data to flow porously between services — no longer seemed like such a good idea.

Wie sorgte AOL damals für Hohn und Spott! Niemand will eine Gated Community, wenn man doch das ganze Web haben könnte! Nun ist es das Businessmodell, mit dem man Investoren und Kunden glücklich machen kann. 2) Und Geheimdienste, aber das ist ein anderes Thema.

Sowohl Aments Posting als auch das hier zitierte von Jeremy Keith sind zur Lektüre empfohlen.

References   [ + ]

1. Wird’s Zeit für eine eigene Kategorie mit Googles abgeschafften Diensten?
2. Und Geheimdienste, aber das ist ein anderes Thema.

Cover von Buchhandel.de?

Der DBV hat ein Angebot der MVB Marketing- und Verlagsservice des Buchhandels GmbH herumgeschickt. Ein Angebot für Bibliotheken, das als Alternative zur Cover-API von Amazon gedacht ist. Ist da nun ein großer Unterschied zur Amazon-API? Hier wie da wird eine Verknüpfung mit dem Buchhandel gefordert. Hier wie da wird dies als Dienstleistung bezeichnet. Bei der MVB hört sich das so an:

Ab sofort bieten wir Bibliotheken und Betreibern nicht-kommerzieller, öffentlicher Webseiten, die Möglichkeit, auf buchhandel.de zu verlinken und im Gegenzug die Coverabbildungen aus dem Verzeichnis lieferbarer Bücher (VLB) kostenlos für den eigenen Katalog zu nutzen.

Statt eines bestimmten Buchhandels verlinken wir nun also ein bestimmtes Buchhandelsverzeichnis. Danke und Hurra? Naja.

Zur Beziehungskrise zwischen “echtem Buchhandel” und Amazon passt auch dieser Beitrag aus dem Lawblog:

Nun wurde bekannt, dass der Carlsen Verlag ein Buch seiner erfolgreichen “Conni”-Reihe ändert, weil es Gegenwind aus dem Buchhandel gibt. Im Band “Mein Leben, die Liebe und der ganze Rest” kriegt die Protagonistin von einer Freundin einen Amazon-Gutschein geschenkt, den sie online einlösen kann. Nach – offenbar nicht nur belanglosen – Protesten aus dem Buchhandel hat sich die Autorin nach Angaben ihres Verlages entschlossen, den Text in der nächsten Auflage zu ändern. Freiwillig, wie man betont. Conni kriegt in der Neuauflage nur noch einen “Geschenkgutschein”, von online oder gar Amazon ist nicht mehr die Rede.

Ach, Buchhandel! Wären wir im Kindergarten, würde Amazon nun sämtliche Erwähnungen konventioneller, begehbarer Buchläden aus allen E-Books durch Onlinebestellungen ersetzen.

Altmetrics in Primo

Christine Stohn schreibt über eine Extension, mit der man Altmetrics in Primo integrieren kann:

We have just added a free Primo code extension to the CodeShare area in EL Commons, the Ex Libris collaborative platform. It enables libraries using Primo to embed altmetrics from altmetric.com into the search results. I am very excited about this new feature. Read more about my take on altmetrics below the picture.

Die Idee ist gut, die API ist hier. VuFind könnte sowas doch auch ganz gut gebrauchen…