SPARQL: PNDs aller Hochschullehrer einer Hochschule aus DBPedia

DBPedia gibt ruckzuck die Liste aller PPN PNDs von in Wikipedia vorhandenen Hochschullehrern einer bestimmten Hochschule aus. Wenn man weiß, wie es geht.
Am Beispiel der Hochschule Hannover:

1
2
3
4
5
6
7
SELECT DISTINCT ?individualisedPnd ?name WHERE {
    ?test <http://purl.org/dc/terms/subject> <http://de.dbpedia.org/resource/Kategorie:Hochschullehrer_(FH_Hannover)> .
    ?test foaf:name ?name .
    ?test dbpedia-owl:individualisedPnd ?individualisedPnd .
    ?test foaf:surname ?surname .
}
ORDER BY ?surname

Ausprobieren kann man das mit iSPARQL, hier das aufgeführte Beispiel. Dies für andere Hochschulen auszuprobieren, ist natürlich einfach: “Kategorie:Hochschullehrer_(FH_Hannover)” durch die entsprechende Kategorie ersetzen und fertig.

Man erhält natürlich nur die PPN PNDs der Hochschullehrer, die auch in der entsprechenden Kategorie erfasst sind.

Welche relevanten Autoren-IDs gibt es?

Annahme: Wenn man eine Hochschulbibliographie oder auch eine andere Bibliographie aufbaut, ist es sinnvoll, Autoren eindeutige Identifikatoren zuzuweisen, diese verfügbar zu machen und mit anderen Daten zu verknüpfen.

Fragen:

  1. Welche IDs sammelt man? Die Auswahl ist groß. Welche Identifikatoren sollten unbedingt genutzt werden? Falls ja, warum genau diese IDs?
  2. Gibt es bestimmte IDs, die für spezielle Fachcommunities unverzichtbar sind? Zum Beispiel für Ingenieure, Sozialwissenschaftler, oder Informatiker?
  3. Gibt es vielleicht eine ID to rule them all?
  4. Welche Kriterien sind wichtig für die ID-Wahl (Offenheit, freie Lizenzierung, …)?

Hier ist eine kleine Auswahl. Bitte rege kommentieren das Posting gerne weiterleiten und -verteilen!

Dieselbe Frage ist auch für Organisationen und Werke noch zu klären.

Neue gemeinfreie Werke 2010

Telepolis berichtet über Autoren, deren Werke seit 1. Januar 2010 gemeinfrei sind. Zum Beispiel die Werke Siegmund Freuds. Auch über die Wikipedia (auch über Umwege) kann man einige Autoren ausfindig machen, über WBIS (über Nationallizenz verfügbar, dies ist nur ein schnell zusammenklamüsertes Beispiel) noch viel mehr.

Wirklich effektiv wäre dagegen eine Möglichkeit, über ein API die PND nach “Sterbejahr 1939” abzufragen und mit den so gewonnenen PPNs direkt verschiedene Kataloge abzufragen. Was aber leider noch nicht möglich ist.

Permalinks für Katalogisate

In der Mailingliste NGC4LIB wird gerade eifrig darüber gestritten, in welcher Form Kataloge im Netz präsent sein sollten. Ausgangspunkt war eine Diskussion über das Semantic Web, aber schnell ist die Debatte zum Kernpunkt gekommen: Bislang sind Bibliotheken nicht einmal im “normalen” Web angekommen.

Tim Spalding fasst das Problem folgendermaßen zusammen:

1. Vendors don’t make linkable systems, mostly because libraries don’t
force them to.
2. OCLC maintains that libraries should stay off the web, and rely on
WorldCat to serve as their front-end to the world.

The result:

1. Libraries are almost NEVER in search results.
2. WorldCat is seldom visited. For example, WorldCat has HALF the
traffic of LibraryThing. It even has less traffic than Dogster.com,
the social network for people who REALLY love their dogs.

Spalding ist uneingeschränkt zuzustimmen. Man bedenke: OPAC steht für Online Public Access Catalogue. Der Gedanke war also ursprünglich, den Katalog online für den öffentlichen Zugang zur Verfügung zu stellen. Der Katalog an sich ist auch öffentlich zugänglich. Nun ist es an der Zeit, auch die Katalogisate öffentlich zugänglich zu machen. Was brauchen wir dazu? Suchmaschinentaugliche Permalinks auf Katalogisate.

Einen ersten Schritt in diese Richtung hat die VZG getan, als sie kürzlich sogenannte Zitierlinks in den GVK einbanden.

Beispiel: http://gso.gbv.de/xslt/DB=2.1/PPNSET?PPN=595545807

Dabei gibt es jedoch (abgesehen von der Benennung der Funktion, hinter der ich eigentlich eher die bibliographischen Daten in maschinenlesbarer Form vermutet hätte) zwei Probleme.

  1. PPNs sind nicht dauerhaft, sie können sich ändern oder gelöscht werden. Dann ändert sich auch der Zitierlink, was ihn insgesamt untauglich macht. Denn: Cool URIs don’t change. Vielleicht wäre es sinnvoll, eine übergreifende ID wie die Erstkatalogisierungs-ID (EKI) für diesen Zweck einzusetzen.
  2. Der Link entspricht nicht dem, was man sieht, wenn man aus einer Recherche dorthin gelangt. Das heißt, man muss den Zitier-Link extra anklicken. Dies problematisch z.B. beim Einsatz von Bookmarkingplugins. Ist die Session beendet, ist zum Beispiel dieser Link hier nicht mehr gültig.

Ändern könnte man dies, indem man das Vorgehen der OpenLibrary übernimmt. Sucht man dort nach “The Mahabharata” von Jean-Claude Carrière, findet man unter anderem folgenden Titel:

http://openlibrary.org/b/OL9587696M/The_Mahabharata

Dieser Link besteht aus dem Basis-Link für die OpenLibrary + alphanumerische ID + Titelstichwort. Der Titel ist für die Funktion des Links irrelevant. Ruft man die selbe ID mit einem anderen Titel auf, kommt man trotzdem zum gewünschten Titel:
http://openlibrary.org/b/OL9587696M/Harry_Potter_and_the_catalogue_of_death

Bestimmt sind auch andere technische Umsetzungen denkbar. Wichtig ist nur, dass durch dieses nur scheinbar unwichtige Detail unsere Kataloge endlich im Web ankommen. Überlegungen zur Umsetzung bestehen, jetzt kommt es darauf an, sie so schnell wie möglich umzusetzen.