Wikidata als Über-Klassifikation

Am Sonntag hat Lydia Pintscher in ihrem wöchentlichen Wikidata-Newsletter neue Properties bekannt gegeben. Und einige davon muten reichlich bibliothekarisch an:

impact factorMunicipality code (Denmark)USB IDHome worldCardinality of the groupInternet media typeBluebook abbreviationZ39.5 abbreviationISO 4 abbreviationCODENlanding siteUS Congress Bio identifierScopus Source IDScopus Affiliation IDScopus EIDScopus Author IDIPTC Media Topictopic’s main portalRegensburg ClassificationLibrary of Congress Classificationneutron number

Über die Nachnutzung der Daten (Scopus oder impact factor)  ließe sich im bibliothekarischen Kontext einiges schreiben. Besonders aufgefallen sind mir jedoch LoCC und RVK. Wenn die nun eine eigene Property haben, was denn noch?

Ein Blick in ein paar populäre Wikidata-Topics erhellt die Lage. Sport wurden folgende statements zugewiesen:

Welche Anwendungsmöglichkeiten gibt es? Reicht es künftig, auf ein Wikidata-Topic zu verlinken, um Ressourcen gleich in mehreren Klassifikationen zu verorten?

Blogstöckchen: Das beste/wichtigste LIS-Werk der letzten Jahre

Teil der Operation Frühjahrsputz, in deren Verlauf angefangene und nie beendete Postings einfach so veröffentlicht werden. Eigentlich wollte ich ausführlich begründen, warum das Buch so lesenswert ist. Das mache ich jetzt nicht mehr. Ich werfe das Stöckchen auch niemandem zu. Wer es aufheben möchte, soll das natürlich dennoch gerne machen!

Vor kurzem fragte ich:

Was mich zu der Frage bringt, ob Blogstöckchen schon so sehr außer Mode sind, dass man eine Vintage-Retro-Renaissance-Auflage mit der Frage starten kann, welche drei Bücher der letzten fünf Jahre für den LIS-Bereich persönlich am besten/wichtigsten gefunden wurden. Kann man?

Die Reaktion war einstimmig positiv. Ich erweitere die Auswahl allerdings auf Zeitschriftenartikel, Blogpostings und so weiter. Gleichzeitig reduziere ich die Anzahl auf ein einziges Werk. Mein Favorit, der mir nach nicht allzu langem Überlegen eingefallen ist:

Weinberger, David: Das Ende der Schublade : die Macht der neuen digitalen Unordnung. München: Hanser.

Dieses Buch sollte jeder lesen, der in irgendeiner Art und Weise mit Ordnungssystemen zu tun hat. Bibliothekswesen auf jeden Fall. Und auch jedem, der einfach gerne gut geschriebene Sachbücher liest, kann ich es ans Herz legen.

DDC in BASE

BASE setzt auf ein automatisches Verfahren zur Dokumentenklassifikation nach der Dewey-Dezimalklassifikation (DDC):

Es sei nicht verschwiegen, dass das automatische Klassifikationsverfahren nicht perfekt ist, da es auf der statistischen Analyse der Dokumenttexte basiert. Da die Wissenschaftssprache sehr komplex ist und sich zudem ständig verändert, kann es auch zu Fehlklassifikationen kommen.

In der Klassifikation stöbern kann man über die VuFind-eigene Browsing-Funktion.

Cablegategame: Verschlagwortung durch Crowdsourcing

Paul studiert Computer Sciences in den Niederlanden und er hat das Crowdsourcing-Spiel Cablegategame umgesetzt, mit dem Wikileaks-Cables getagged werden können. Er selbst hat mit den Daten gar nichts besonderes vor, sondern möchte sie frei zur Verfügung stellen. Aus den FAQ:

What are you going to do with this data?
Nothing, I’m hoping that other people know how to do the cool analysis part of this exercise. If you are that person than please go ahead and download the datasets.

Die Tags sind unterteilt in 5 Kategorien: Topic, Organization (Group), Name, Event und Place.

Auszug:

05BRASILIA1067|topic|Agriculture|1
05BRASILIA1067|group|Wto|1
08LISBON1808|topic|Allegation Of Nuclear Material Smuggling – Portugal|2
08LISBON1808|event|7/24/08|1
08LISBON1808|place|Chernobyl|3
07HAMBURG73|group|Consul General|1
07HAMBURG73|place|Hamburg|6
08LISBON1808|event|July 24,2008|3
07HAMBURG73|group|Scientology|4
09BERLIN168|name|Angela Merkel|7

Einen anderen, maschinellen Ansatz der Erschließung verfolgt der CableBot. Sicherlich gibt es noch zahlreiche andere Versuche, die Cables zu erschließen. Besonders interessante Ansätze bitte in die Kommentare!

[Cablegategame via @kprobiesch]