ShelfLife und LibraryCloud

David Weinberger stellt in seinem Blog zwei seiner Projekte vor, ShelfLife und LibraryCloud:

Upon the announcement of the beta sprint in May, we partnered up with folks at thirteen other institutions…an amazing group of people. Our small team at Harvard , with generous internal support, built ShelfLife and LibraryCloud on top of the integrated catalogs of five libraries, public and university, with a combined count of almost 15 million items, plus circulation data. We also pulled in some choice items from the Web, including metadata about every TED talk, open courseware, and Wikipedia pages about books. (Finding all or even most of the Wikipedia pages about books required real ingenuity on the part of our team, and was a fun project that we’re in the process of writing up.)

The metadata about those items goes into LibraryCloud, which collects and openly publishes that metadata via APIs and as linked open data. We’re proposing LibraryCloud to DPLA as a metadata server for the data DPLA collects, so that people can write library analytics programs, integrate library item information into other sites and apps, build recommendation and navigation systems, etc. We see this as an important way what libraries know can become fully a part of the Web ecosystem.

ShelfLife baut auf verschiedenen Annahmen auf. Unter anderem: Libraries are social systems. Library items are social objects. A library navigation system should be social as well.

Einen Prototypen gibt es auch. Mehr Infos in seinem Blog.

LOD: Machen wir es nicht, machen es andere!

Nicht nur scheint LOD also aus rationalen und Effizienzgründen die bessere Wahl zum Aufbau zukünftiger Informationsinfrastrukturen zu sein. Auch könnte es der Bibliothekswelt dabei helfen, relevant zu bleiben und nicht durch andere Organisationen verdrängt zu werden.

Jakob Voß hat am Wochenende darauf hingewiesen, dass Wikimedia überlegt, ein Projekt “Bibliographisch-archivalische Datenbank” anzugehen, in dem eine offene bibliographisch-archivalische Datenbank angelegt werden soll zur Nachnutzung durch die verschiedenen Wikimedia-Projekte aber auch durch andere Akteure wie Wissenschaftler oder Google Books.

Wenn bibliothekarische Organisationen nicht eine wichtige Rolle dabei übernehmen, bibliographische Daten im großen Stil offen, strukturiert und leicht nachnutzbar zur Verfügung stellen, werden es schließlich andere tun…

[via Übertext]

Schema.org

Lorenz Matzat schreibt über Schema.org:

Es ginge den Suchmaschinenbetreibern darum, bessere Ergebnisse zu liefern, verharmlosen sie selbst ihre Intention. Faktisch dürfte ihre Motivation aber sein, noch besser automatisiert Content aus Webseiten auslesen zu können und als eigenen Inhalt in den Suchergebnissen zu zeigen. Und damit die User auf ihrer eigenen Seite zu halten und ihnen so länger die Werbung der eigenen Anzeigenkunden präsentieren zu können.

Was für Journalisten offensichtlich erschreckend erscheint, könnte für Bibliothekswesen eine interessante Perspektive bieten. Wie Martin Fenner schreibt:

It will be interesting to see whether future versions of the schema.org standard will have better support for scholarly content, and how well this microformat can be integrated into our efforts to create Scholarly HTML. And how quickly scholarly publishers and other providers of scholarly content will adopt this new standard., which in its current form already is a big improvement over plain HTML.

Es wird wirklich sehr interessant zu sehen sein, how quickly wissenschaftliche Verleger reagieren.

TIB-Katalogdaten zum Download

Die TIB hat Ihre Katalogdaten halbfrei zum Download bereit gestellt.

Sämtliche von der TIB für den Katalog erfassten bibliografischen Daten werden unter der CC-Lizenz Namensnennung – keine kommerzielle Nutzung – Deutschland 3.0 bereit gestellt und können heruntergeladen, modifiziert und für eigene Zwecke genutzt werden.

Durch die gewählte Lizenz ist eine umfassende Nutzung der Daten leider unmöglich, vgl. die Prinzipien zu offenen bibliographischen Daten:

Darüber hinaus empfehlen wir – insbesondere öffentlich finanzierte – bibliographische Daten und Sammlungen bibliographischer Daten explizit in die Public Domain zu geben durch die Nutzung der Public Domain Dedication and Licence oder des Creative Commons Zero Waivers. Dadurch werden die Nachnutzungsmöglichkeiten maximiert, ganz im Sinne des allgemeinen Ethos des Teilens im Bereich öffentlich geförderter Gedächtnisinstitutionen.

Aber eine Lizenz kann ja auch noch geändert werden, siehe Koblenz.

[via @nowakman]

Ein Jahr Suchkiste

Gerald Steilen macht auf den ersten Geburtstag der Suchkiste aufmerksam. Da er wirklich keine Ahnung habe, was [er] wie umfangreich beischreiben soll, hat er ein PDF-Dokument zur Verfügung gestellt, dass das Projekt ausführlich beschreibt. Ein sehr interessanter Punkt ist auf S. 6 zu finden:

Es ist möglich den im vorliegenden Projekt generierten Index in beliebige Oberflächen für die Open Source Software Solr19 einzubinden. Im bibliothekarischen Umfeld verwenden kommerzielle Produkte wie Primo (Exlibris)20 oder TouchPoint (OCLC)21 eben jene Open Source Lösung. Daher lud die Firma Exlibris einen Projektmitarbeiter nach Hamburg ein, um den Suchkistenindex dieses Projekts mit dem eigenen Softwareprodukt Primo direkt nutzen zu können. Somit haben Primo-Kunden prinzipiell die Möglichkeit das Material der Nationallizenzen zu durchsuchen, ohne die Daten selbst indizieren zu müssen und ohne auf die Vorteile von Primo verzichten zu müssen (siehe Kap. 4.3.1 und Abb. 4.10). Der Anbieter von TouchPoint unterstützt ebenfalls dieses Verfahren. Selbstverständlich ist das auch mit einer VuFind-Installation möglich.

Das heißt, das neben (beispielsweise) dem zentralen Index des GBV auch der Index der Suchkiste in Discovery Interfaces 1) Katalog? Suchdings? Informationsorganisations- und Auffindewerkzeug? Entdecker-Oberfläche? Zur Not halt Portal, das geht immer. ;o) eingebunden werden kann. Wie theoretisch auch BASE oder verschiedene ViFas.

References   [ + ]

1. Katalog? Suchdings? Informationsorganisations- und Auffindewerkzeug? Entdecker-Oberfläche? Zur Not halt Portal, das geht immer. ;o)

Drei neue Empfehlungen des Wissenschaftsrats

Auf drei Empfehlungen des Wissenschaftsrats macht Wisspub aufmerksam.

Adrian Pohl analysiert eine Aussage aus den “Übergreifenden Empfehlungen”, die sich mit zwei verschiedenen Ansätzen der Metadatenbereitstellung beschäftigt: Linked Open Data vs. WorldCat, oder: Eine Alternative, die keine ist.

Am 3. Februar soll darüber hinaus eine Empfehlung zur “Zukunft des bibliothekarischen Verbundsystems in Deutschland” veröffentlicht werden.

7 Grundregeln für digitale Projekte

Klaus Graf schlägt “7 Grundregeln für digitale Projekte” vor:

Für digitale Sammlungen von Archiven, Bibliotheken, Museen usw. und virtuelle Ausstellungen sind die folgenden Grundregeln gedacht, die ich zur Diskussion stelle.

1. NICHT AN DER AUFLÖSUNG SPAREN! Jede Bildseite muss in hoher Auflösung vorliegen, denn nur diese garantiert die wissenschaftliche Nutzbarkeit.

2. PERMANENT-LINKS! Jede einzelne Bildseite muss mit einem deutlich angebrachten KURZEN dauerhaften Link versehen werden.

3. META-DATEN ZU JEDEM DIGITALEN OBJEKT! Zu jedem digitalen Objekt (auch zu separat nutzbaren Einzelseiten wie Druckgrafik, Zeichnungen) muss es entsprechende Metadaten geben, die professionellen Ansprüchen genügen müssen.

4. OAI-PMH NUTZEN! Alle Meta-Daten müssen für OAI-Harvester zur Verfügung stehen.

5. KEIN COPYFRAUD! Die Rechtslage ist in den Metadaten möglichst objektiv und auf jeden Fall ohne Copyfraud zu beschreiben. Was gemeinfrei ist, muss auch als Digitalisat gemeinfrei bleiben! Wenn das Projekt über Urheberrechte verfügt, ist eine Nachnutzbarkeit über eine möglichst liberale CC-Lizenz vorzusehen.

6. WEB 2.0! Nutzer sollten die Möglichkeit haben, Ergänzungen und Korrekturen anzubringen (Tags, Transkriptionen usw.)

7. LANGZEITARCHIVIERUNG! Die dauerhafte öffentliche Verfügbarkeit ist ggf. durch Kooperation mit Bibliotheken sicherzustellen.

Hier geht’s zum Posting und zur Diskussion.

EKIs schon aktiv?

Während einer Bastelstunde an einem mobilen Katalog für Hannover (Achtung: funktioniert absolut noch nicht so, wie es mal sein soll. Mehr darüber bei Jakob Voss, von dem ich das Skript auch übernahm.) stöberte ich mal wieder ein wenig in den Katalogisaten im GVK.

Langer Rede, kurzer Sinn: Es gibt nicht nur ein paar Beispiel-EKIs (Erstkatalogisierungs-IDs) wie z.B. diese hier. Eine schnelle Recherche ergab:

Suche nach Treffermenge
eki gbv? 6.019.523
eki dnb? 402.497
eki bvb? 29.030
eki bsz? 21.727

Ich konnte bislang allerdings nur im GVK nach EKIs suchen. Beim Stand der Umsetzung in Sachen EKI hat sich also leider noch nichts wesentliches getan.

Freie bibliographische Daten vom CERN

Die CERN-Bibliothek hat ihre bibliographischen Daten zum Download zur Verfügung gestellt.

The actual data export is from 6.12.2009. We are working on providing regular updates. The Data is provided in zipped MARCXML. We are working on providing other formats, specialy RDF.

For a Z39.50 access to the data it will be soon integrated into biblios.org. The Open Library Project will also integrate the data soon.

Mehr dazu auch in der dazugehörigen Ankündigung oder im schmissigen “Videoclip zum Download”:

Alle verfügbaren Daumen hoch, Patrick! Endlich setzt jemand die Forderung nach Open Access zu bibliographischen Daten (Open Bibliographic Data) in die Tat um. Die Pionierleistung ist geschafft, die gewählte Lizenz (CC0 und Public Domain Dedication) kann besser nicht sein. Gerüchteweise wollen einige Bibliotheken in Kürze folgen.

Und nun bin ich gespannt, was mit den Daten gemacht wird.

Zwei Vorträge über Open Access bei Yovisto

Gerade bei Yovisto gefunden: zwei Vorträge zu Open Access. Der Erste ist OPEN ACCESS – der freie Zugang zum Wissen von Igor Drieghe.

Der Zweite, Second-Generation Open Access: Building an Open Content von John Wilbanks ist leider nicht einbindbar. Daher sei an dieser Stelle auf die entsprechende Yovisto-Seite hingewiesen.

Bei der Suche in Yovisto wurden mir auch mehrere Mängel des Angebots bewusst. Ich habe zuerst die Angabe der Spieldauer zum Beispiel beim letzten Video vermisst. Bis mir klar wurde, dass sie in den Suchergebnissen ganz klein (und anscheinend nur dort) tatsächlich verzeichnet ist. Auch andere Metadaten werden dem geneigten Seitenbesucher verheimlicht. Zwar findet man deutsche Videso zu Open Access, wenn man den Sprachfilter in der Suchfunktion nutzt, aber eine Sprachangabe in den Metadaten suche ich vergeblich.