Infobib

Permalinks für Katalogisate

←Der Bibliothekar (und sicherlich auch seine Kolleginnen) | Rekonstruktion der Bibliothek von Goethes Vater
27th Oktober 2009

Permalinks für Katalogisate

In der Mailingliste NGC4LIB wird gerade eifrig darüber gestritten, in welcher Form Kataloge im Netz präsent sein sollten. Ausgangspunkt war eine Diskussion über das Semantic Web, aber schnell ist die Debatte zum Kernpunkt gekommen: Bislang sind Bibliotheken nicht einmal im “normalen” Web angekommen.

Tim Spalding fasst das Problem folgendermaßen zusammen:

1. Vendors don’t make linkable systems, mostly because libraries don’t
force them to.
2. OCLC maintains that libraries should stay off the web, and rely on
WorldCat to serve as their front-end to the world.

The result:

1. Libraries are almost NEVER in search results.
2. WorldCat is seldom visited. For example, WorldCat has HALF the
traffic of LibraryThing. It even has less traffic than Dogster.com,
the social network for people who REALLY love their dogs.

Spalding ist uneingeschränkt zuzustimmen. Man bedenke: OPAC steht für Online Public Access Catalogue. Der Gedanke war also ursprünglich, den Katalog online für den öffentlichen Zugang zur Verfügung zu stellen. Der Katalog an sich ist auch öffentlich zugänglich. Nun ist es an der Zeit, auch die Katalogisate öffentlich zugänglich zu machen. Was brauchen wir dazu? Suchmaschinentaugliche Permalinks auf Katalogisate.

Einen ersten Schritt in diese Richtung hat die VZG getan, als sie kürzlich sogenannte Zitierlinks in den GVK einbanden.

Beispiel: http://gso.gbv.de/xslt/DB=2.1/PPNSET?PPN=595545807

Dabei gibt es jedoch (abgesehen von der Benennung der Funktion, hinter der ich eigentlich eher die bibliographischen Daten in maschinenlesbarer Form vermutet hätte) zwei Probleme.

  1. PPNs sind nicht dauerhaft, sie können sich ändern oder gelöscht werden. Dann ändert sich auch der Zitierlink, was ihn insgesamt untauglich macht. Denn: Cool URIs don’t change. Vielleicht wäre es sinnvoll, eine übergreifende ID wie die Erstkatalogisierungs-ID (EKI) für diesen Zweck einzusetzen.
  2. Der Link entspricht nicht dem, was man sieht, wenn man aus einer Recherche dorthin gelangt. Das heißt, man muss den Zitier-Link extra anklicken. Dies problematisch z.B. beim Einsatz von Bookmarkingplugins. Ist die Session beendet, ist zum Beispiel dieser Link hier nicht mehr gültig.

Ändern könnte man dies, indem man das Vorgehen der OpenLibrary übernimmt. Sucht man dort nach “The Mahabharata” von Jean-Claude Carrière, findet man unter anderem folgenden Titel:

http://openlibrary.org/b/OL9587696M/The_Mahabharata

Dieser Link besteht aus dem Basis-Link für die OpenLibrary + alphanumerische ID + Titelstichwort. Der Titel ist für die Funktion des Links irrelevant. Ruft man die selbe ID mit einem anderen Titel auf, kommt man trotzdem zum gewünschten Titel:
http://openlibrary.org/b/OL9587696M/Harry_Potter_and_the_catalogue_of_death

Bestimmt sind auch andere technische Umsetzungen denkbar. Wichtig ist nur, dass durch dieses nur scheinbar unwichtige Detail unsere Kataloge endlich im Web ankommen. Überlegungen zur Umsetzung bestehen, jetzt kommt es darauf an, sie so schnell wie möglich umzusetzen.

Kommentar-RSS für diesen Artikel: RSS 2.0. Kommentare und Trackbacks für diesen Artikel sind geschlossen.

Bisher 10 Kommentare oder Trackbacks zu “Permalinks für Katalogisate”

  1. 1 till am Oktober 27th, 2009:

    Das Problem ist schlicht: Bibliothekssysteme, die konzeptuell irgendwo tief in der vor-Web-Zeit verwurzelt sind, tun sich extrem schwer, mit solchen Links zu funktionieren.
    In einem uns ja gut bekannten OPAC-Produkt funktioniert das so: Benutzer macht Suche, Suchmaschine ermittelt Trefferset, Benutzer kann durch dieses Trefferset navigieren (und z.B. einzelne Treffer daraus ansehen), die Links darin sind alle nur innerhalb dieses Treffersets gültig. Da das Trefferset Ressourcen auf dem Server belegt, werden diese Ressourcen irgendwann wieder freigegeben, die Treffer sind weg und damit auch die URLs. Man könnte sagen, die Datensätze sind eigentlich gar nicht im Web, sie sind irgendwo dahinter tief in einer Datensammlung versteckt und tauchen nur temporär an der Oberfläche auf. Und das funktioniert nur mit abenteuerlichem Session-Management… Deswegen diese krude Lösung mit “Zitierlinks” in GVK (im Prinzip eine Suche nach der PPN, auch mit temporärem Trefferset usw.).
    Das Web (bzw. HTTP) funktioniert aber grundsätzlich zustandsfrei, ohne Zusammenhänge zwischen Requests oder Suchen und Treffern, ohne Sessions, ohne temporäre Treffersets usw. Request->Response, Request->Response, … kein Zusammenhang zwischen zwei Requests, keine Sessions, nix (bzw. erst dann, wenn sie gebraucht werden um zwei Requests des gleichen Benutzers zu erkennen). Dass das sehr elegant sein kann, wenn man es denn zu nutzen weiß, sieht man ja auch am Erfolg des REST-Konzepts…
    In einigermaßen moderner Katalogsoftware wie VuFind oder Blacklight funktionieren diese kontextfreien und zustandslosen Links auf einzelne Treffer (oder auch Suchen) hervorragend. Jede Seite kann man einfach mit der URL oben im Browser bookmarken, twittern, verlinken… Da funktioniert das “Backend” (Solr) aber auch entsprechend. In “legacy OPACs” könnte man sowas (brauchbare URLs) vielleicht mit viel Knauperei und Aufwand nachrüsten, halte ich persönlich aber schlicht für vertane Mühe. Weg damit! (PS: Auch die “Permalinks für Kataloge im GBV” werden nichts daran ändern, dass diese Permalinks immer noch nicht in der Adresszeile des Browsers stehen, sie sind nur eine konzeptionell erweiterte und verbesserte Umsetzung des aktuellen “Zitierlinks”).

    Merkwürdig ist allerdings, dass selbst “neue Produkte” einschlägiger Systemsoftwarelieferanten sich noch nicht von dem Konzept “ohne Session und kaputte URLs läuft hier gar nix” verabschieden. OK, wenn jede Suche ne Session auslöst, kann man auch einfacher Softwarepreise nach gleichzeitig erlaubten Nutzern im Katalog festlegen.

    Vielleicht ist die Nachfrage nach diesen Features wirklich zu gering?

  2. 2 Sebastian Wolf am Oktober 28th, 2009:

    Es gibt bereits einige Bibliotheken, die in ihren Katalogen “Perma-Links” oder kurze URLs anbieten, z.B. die USB Köln (KUG), UB Heidelberg und wir selbst(UB Bielefeld). Beispiel-URLs:
    http://kug.ub.uni-koeln.de/portal/connector/permalink/inst001/5249258/1/wikisource/index.html
    http://katalog.ub.uni-bielefeld.de/title/1965256
    http://katalog.ub.uni-heidelberg.de/titel/65664572

  3. 3 till am Oktober 28th, 2009:

    http://katalog.ub.uni-bielefeld.de/title/1965256 steht aber auch nicht oben in der Adresszeile des Browsers, wenn ich per Suche auf den Datensatz stoße.
    Da (Adresszeile) muss dieser Link aber hin! Das ist genau der Punkt, um den es geht.
    Bei OpenBib (KUG) funktioniert das, bei VuFind oder Blacklight auch.

  4. 4 CH am Oktober 28th, 2009:

    Richtig, genau darum geht es. Es funktioniert übrigens auch nicht in OPUS. Da gibt es zwar Permalinks und Links zum Dokument in verschiedenster Form, aber wenn ich über eine Suche auf das Dokument stoße, ist es nicht “bookmarkbar”.

    Merkwürdig ist allerdings, dass selbst “neue Produkte” einschlägiger Systemsoftwarelieferanten sich noch nicht von dem Konzept “ohne Session und kaputte URLs läuft hier gar nix” verabschieden. OK, wenn jede Suche ne Session auslöst, kann man auch einfacher Softwarepreise nach gleichzeitig erlaubten Nutzern im Katalog festlegen.

    Vielleicht ist die Nachfrage nach diesen Features wirklich zu gering?

    Das liegt IMHO daran, dass kaum jemand weiß, wozu das gut und wie wichtig das ist. Die Nachfrage kann ja nur entstehen, wenn das Bewusstsein fürs die Notwendigkeiten des Webs tatsächlich auf der Entscheiderebene angekommen wären. Was offensichtlich nicht der Fall ist. Mir stellt sich die Frage: Wie kann man das ändern?

  5. 5 till am Oktober 28th, 2009:

    Hmmm, für wen und was ist es wichtig? Bisher war es offenbar nicht wichtig, sonst hätten wir es. Oder es war (bisher?) nur für eine Minderheit wichtig. Oder die Wege, auf denen transportiert wird, was wichtig ist, versagen total…

    Ich bekomme ein bischen Bauchschmerzen bei dem aufkommenden linked data Hype, wenn solche eigentlich einfachen Konzepte schon nicht ernst genommen werden. linked data braucht genau solche Links (eigentlich eine Binsenweisheit), ist aber damit noch nicht erledigt (stabile URIs als Identifier sind aber eben eine Voraussetzung). Das ist ja vermutlich das, auf was Tim Spalding hinaus wollte: Wenn Webangebote diese minimale Hürde schon nicht nehmen (und es offenbar auch niemanden stört), warum sollen wir dann über “semantic web”, RDF und Ontologien diskutieren?

  6. 6 Jakob am Oktober 28th, 2009:

    20 Jahre nach Erfindung des WWW sind Bibliothekssysteme höchstens IM Web angekommen aber noch immer nicht TEIL DES Web. Das liegt vielleicht daran, dass sich Bibliotheken noch immer nicht als Teil des Web sehen. Ich empfehle die Lektüre der Original-Proposals von Tim-Berners Lee. Auch damals hat es bei jedem einige Zeit gedauert, bis die Idee verstanden wurde. Bibliotheken brauchen halt etwas länger. Nur trägt jede Bibliothek, die sich ein System ohne stabile URLs (die auch als primärer Zugang zu Katalogeinträgen in der Adresszeile auftauchen) aufschwatzen lässt, zur eigenen Marginalisierung bei.

    Welche Katalogsoftware bietet denn heute solche Permalinks? OCLC|PICA jedenfalls nicht und soweit ich weiß die Produkte von Ex-Sisis und ExLibris auch nicht. Das ist nur einer von mehreren Gründen warum proprietäre Bibliothekssoftware herausgeschmissenes Geld und kontraproduktiv ist. Entweder man vertraut seine Daten WorldCat local oder Google Books an oder man nimmt Open Source (bzw. bezahlt andere dafür dass sie für einen Open Source einsetzen, anpassen und ausbauen). Alles andere ist meiner Meinung nach unverantwortlich.

    P.S.: Nein, der Zugang zu den Quellen nur unter bestimmten Bedingungen, wie er bei verschiedener Bibliothekssoftware praktiziert wird, ist kein so-gut-wie-Open-Source sondern kein Open Source.

  7. 7 daniel am Oktober 28th, 2009:

    was ist denn dann die folge? die “entscheider”, wie ch meinte, haben in der regel keine ahnung von technischen dingen. andersherum: wer ahnung hat, darf nicht entscheiden. und die systemherstellen haben natürlich kein interesse, den status quo zu ändern, weil das ja arbeit macht.

    weg 1: der marsch durch die institutionen. die hier versammelten bibliotheksrevoluzzer werden selbst “entscheider” und sorgen für frischen wind.
    weg 2: für informationen und aufklärung sorgen. das dauert und ist frustbehaftet.
    weg 3: ???

  8. 8 Sebastian Wolf am Oktober 28th, 2009:

    Zitat von Nr. 3 (timm): “http://katalog.ub.uni-bielefeld.de/title/1965256 steht aber auch nicht oben in der Adresszeile des Browsers, wenn ich per Suche auf den Datensatz stoße.”

    Das ist richtig. Allerdings ist die lange URL, die in der Adresszeile beim Aufruf des Treffers steht, genauso permanent und bookmarkfähig, wie die kurze URL, die unten zusätzlich angegeben wird. Wichtig ist nur die Angabe ‘katkey’ – die restlichen Paramter werden nur für die Exportfunktion und die Navigation in der Trefferliste benötigt.

    Ich denke mal, ob eine URL nun kurz ist oder über 3 Zeilen geht, ist eher zweitrangig, solange sichergestellt ist, dass sie sich nicht verändert.

  9. 9 CH am Oktober 29th, 2009:

    Wenn nur die Angabe ‘katkey’ wichtig ist: Wieso muss der restliche Kram denn dann überhaupt in der Adresse auftauchen? Das sorgt für schlechte “soziale Bookmarkbarkeit”. Beispiel: Ich suche nach “Grundlagen” und klicke den 3. Treffer an. Ich komme auf folgende Seite:

    http://katalog.ub.uni-bielefeld.de/cgi-bin/titel.cgi?katkey=561740&teil=&teil2=&start=1&pagesize=10&sess=c932ce9f1c539efa0203052dfed0d613&art=f&kat1=freitext&kat2=ti&kat3=aup&op1=AND&op2=AND&var1=grundlagen&var2=&var3=&vr=1&pagesize=10

    Den gleichen Titel kann ich auch aufrufen, indem ich nach edv-grundlagen suche und den 1. Titel wähle:

    http://katalog.ub.uni-bielefeld.de/cgi-bin/titel.cgi?katkey=561740&teil=&teil2=&start=1&pagesize=10&sess=17cf2d0d3a321b66da4ceb26ec73af2a&art=f&kat1=freitext&kat2=ti&kat3=aup&op1=AND&op2=AND&var1=EDV-Grundlagen&var2=&var3=&vr=1&pagesize=10

    Wenn ich jetzt eines der beiden bookmarke, ist die Chance, dass ich z.B. über Delicious Gleichgesinnte finde, die dieses Buch ebenfalls interessiert gleich Null. Diejenigen müssten schon über den selben Weg dorthin gelangt sein. Es wird allerdings noch ein bißchen konfuser: Als Link für Bibsonomy wird mir http://katalog.ub.uni-bielefeld.de/cgi-bin/bibsonomy.cgi?katkey=561740 angeboten, als “bookmarkfähiger” Link http://katalog.ub.uni-bielefeld.de/title/561740.

    Es geht (mir) nicht nur um permanente Verfügbarkeit von Links auf Katalogisate. Es geht auch darum, ein Werk mit einer URL versehen zu können, die es identifizierbar macht.

  10. 10 CH am Oktober 29th, 2009:

    Ergänzung: Es geht ja jetzt schon, aber es sollte automatisch passieren, nicht erst durch bewusstes Nutzen einer Permalink-Funktion.

Ähnliche Artikel

  • Kategorien

  • Archiv: