Scholia – Forschungsprofile aus Wikidata generieren

Scholia baut Forscherprofile aus in Wikidata vorhandenen Informaionen. Zum Beispiel werden bibliographische Informationen für die Darstellung von Koautorschaften genutzt. Scholia sieht mehr wie ein proof-of-concept aus, das Potential von Wikidata als zentralem Lieferanten von (nicht nur) Normdaten wird aber sofort klar ersichtlich.

Geographische Funktionen im Wikidata Query Service

Der Wikidata Query Service wird langsam aber sicher zu einem wirklich nützlichen Werkzeug. Neu hinzugekommen sind geographische Funktionen. Technische Details finden sich im entsprechenden Ticket und in dieser Mail.

Ein Anwendungsbeispiel könnte die Fragestellung sein, welche Bibliotheken es im Umkreis von 100 km rund um Hannover gibt – die auch in Wikidata inklusive Koordinaten erfasst sind.

Vielbefragter Wikidata Query Service

Die Nutzung des Wikidata Query Service ist seit einigen Tagen um ein zigfaches gestiegen, wie man der entsprechenden Monitoring-Seite entnehmen kann. Die Ursache ist anscheinend noch unklar. Vielleicht ein amoklaufendes Skript oder ein Dienst, der Wikidata produktiv eingebaut hat? Bemerkenswert ist allerdings, dass man als Normalnutzer nichts davon mitbekommt. Ein Lob an die Admins, deren betreute Infrastruktur diese Explosion einfach so auffängt.

[via Wikidata-List]

SPARQL für und “Units” in Wikidata

Eine große Woche für Wikidata. Nicht nur ist der SPARQL-Endpoint an den Start gegangen, auch Werte lassen sich nun eintragen:

As promised we just enabled support for quantities with units on Wikidata. So from now on you’ll be able to store fancy things like the height of a mountain or the boiling point of an element.

Mehr hier und hier. Wer kombiniert beides zu einem schönen Beispiel?

“Easter Eggs” in Wikidata

Es ist nicht besonders überraschend, dass Wikidata ein paar “Easter Eggs” enthält. Nachdem ich zufällig über eines stolperte, habe ich mal ein paar IDs ausprobiert. Mit folgendem Ergebnis:

Q13: Triskaidekaphobie
Q23: George Washington
Q24: Jack Bauer
Q42 : Douglas Adams
Q666: Sechshundertsechsundsechzig
Q1337: Leetspeak
Q2001: Stanley Kubrick

Q1984 ist nicht korrekt belegt, Q167 und Q51 sind auch verrutscht.

Über diesen Hinweis stieß ich noch auf Tim Berners-Lee, der Q80 vermutlich wegen des HTTP-Ports 80 erhielt. Und das Q404 nicht existiert, ist, wenn auch vielleicht nicht beabsichtigt, konsequent.

Es gibt sicherlich noch mehr. Welche habe ich übersehen?

SEO, Freebase und Wikidata

Freebase wird eingestellt, der Schreibzugriff wurde gerade schon abgestellt. Laut Wikidata-Office-Chat wird Wikidata zwar nun von Google unterstützt. Wikidata wird aber nicht die Rolle von Freebase für den Google Knowledge Graph übernehmen, was diverse SEOs anscheinend annehmen.

16:33:26 yeah, one problem is that SEOs think that Wikidata is replacing Freebase within the Google infrastructure
16:33:35 but we need guidelines on SEO on Wikidata
16:33:42 yes, that would be good
16:33:45 companies will come and edit wikidata a lot now
16:33:55 We’ve already seen a huge wave of spam of companies and “SEO experts”
16:33:55 also, Wikidata is not a free ticket into the Knowledge Graph as Freebase was
16:34:07 it is just one source among many
16:34:27 i think we really need to highlight this

Inzwischen wurde dieser Punkt auch in die Wikidata-FAQ übernommen:

No.

Whereas Freebase was the open core of the Knowledge Graph, this is not true for Wikidata. Wikidata is one source of the Knowledge Graph among many, but does not have the same standing as Freebase had.

The most important source of data for the Knowledge Graph is actually the Web itself. You can mark up your own Websites with schema.org and this will be read and processed by all major search engines.

Liebe SEOs, nehmt dies bitte zur Kenntnis. Und nein, ich möchte keine Links mit Euch tauschen. Danke.

Jakob Voß et al.: Normdaten in Wikidata

Jakob Voß, Susanna Bausch, Julian Schmitt, Jasmin Bogner, Viktoria Berkelmann, Franziska Ludemann, Oliver Löffel, Janna Kitroschat, Maiia Bartoshevska, Katharina Seljuzki: Normdaten in Wikidata

Abstract:

Wikidata ist eine freie, gemeinsame Datenbank und Projekt der Wikimedia-Foundation. Ziel ist es, strukturierte Daten zu zentralisieren und nutzbar zu machen. Dieses Handbuch bietet mit detaillierten und bebilderten Texten eine Anleitung zur Unterstützung des Wikidata-Projektes. Ein theoretischer und ein praktischer Teil erläutern die wichtigsten Begriffe und erklären Wikidata Schritt für Schritt. Dabei wird ein Schwerpunkt auf das Thema Normdaten in Wikidata gelegt. Ein Glossar sowie eine FAQ am Ende des Handbuchs geben Hilfestellung bei Begriffen und Fragen. Dieses Handbuch entstand im Rahmen eines Projektseminars im Sommersemester 2014 an der Hochschule Hannover. Alle Inhalte des Handbuchs stehen auf http://hshdb.github.io/normdaten-in-wikidata unter den Bedingungen der CC-BY-SA Lizenz zur freien Verfügung.

Hier geht’s zum Volltext.

Wikidata als Über-Klassifikation

Am Sonntag hat Lydia Pintscher in ihrem wöchentlichen Wikidata-Newsletter neue Properties bekannt gegeben. Und einige davon muten reichlich bibliothekarisch an:

impact factorMunicipality code (Denmark)USB IDHome worldCardinality of the groupInternet media typeBluebook abbreviationZ39.5 abbreviationISO 4 abbreviationCODENlanding siteUS Congress Bio identifierScopus Source IDScopus Affiliation IDScopus EIDScopus Author IDIPTC Media Topictopic’s main portalRegensburg ClassificationLibrary of Congress Classificationneutron number

Über die Nachnutzung der Daten (Scopus oder impact factor)  ließe sich im bibliothekarischen Kontext einiges schreiben. Besonders aufgefallen sind mir jedoch LoCC und RVK. Wenn die nun eine eigene Property haben, was denn noch?

Ein Blick in ein paar populäre Wikidata-Topics erhellt die Lage. Sport wurden folgende statements zugewiesen:

Welche Anwendungsmöglichkeiten gibt es? Reicht es künftig, auf ein Wikidata-Topic zu verlinken, um Ressourcen gleich in mehreren Klassifikationen zu verorten?

Ein Jahr Wikidata

Vor einem Jahr wurde das erste Wikidata-Objekt Q1 erstellt. Nun feiert Wikidata den ersten Geburtstag. Lydia Pintscher schreibt:

It is beyond what I could have hoped for when I said yes to joining the project. We have together:

  • removed more than 240 000 000 language links from the Wikipedias
  • created more than 21 000 000 statements
  • made more than 84 000 000 edits
  • become the 5th most active Wikimedia project with nearly 4000 active editors (5+ edits in the last 30 days)
  • nearly 600 editors who are very active (100+ edits in the last 30 days)
  • brought in nearly 5000 new Wikimedians for whom Wikidata is the first project they contributed to

Dies und mehr auf der Geburtstagsseite.

Frag doch einfach Wiri!

Talk to Wiri, obviously named after “Wiki” with an “r”, and nothing else!

Obviously. Und hinter Wiri stecken Wikidata und Magnus Manske. Das sollte man sich unbedingt mal ansehen.

Beispielfragen:

  • What is information?
  • Who is Ranganathan?
  • Who are the children of Thomas Mann?
  • Who are you?
  • Where is Cuxhaven?
  • Where is Hochschule Hannover?
  • Where is Waldo?

Hier geht’s zu Wiri. Bitte selbst testen, der Screencast ist nämlich leider ohne Ton.