Vascoda und dann?

Im Vascoda-Blog heißt es zur Zukunft von Vascoda:

Vereinbart wurde, dass bis Mitte 2011 ein Wirtschafts- und Arbeitsplan für die Zeit ab 2012 erarbeitet wird. Darin sollen verschiedene Varianten zur Fortführung des Vereins aber auch Optionen zur Weiterführung der von den Mitgliedern gewünschten Aufgaben in anderer Form darstellt und für diese Varianten möglichst die konkreten (finanziellen) Verpflichtungen der dann verbleibenden Mitgliedseinrichtungen bzw. Beteiligten benannt werden.

Darüber hinaus wurde einstimmig beschlossen, das bisherige vascoda-Portal als Recherche- und Einstiegsportal zum Jahreswechsel 2010/2011 abzuschalten bzw. durch das vascoda-Blog zu ersetzen. Dies wird noch in dieser Woche vollzogen. Mittels eines Redirects wird in einem ersten Schritt von allen Seiten unter http://www.vascoda.de automatisch auf das vascoda-Blog (http://vascoda.wordpress.com) weitergeleitet. Eine Suche im vascoda-Suchraum wird nicht mehr möglich sein. Solange unklar ist, ob und wie es mit dem Verein weitergeht, sind größere Aufwände für das Einrichten eines neuen Webauftritts sicher nicht zu rechtfertigen. An das vascoda-Portal gekoppelt ist das Linkresolver-Gateway, welches von verschieden Fachportalen als Dienst zur lokalen Verfügbarkeitsprüfung genutzt wird. Dieser Dienst soll weiter angeboten werden, muss aber zwingend überarbeitet und aktualisiert werden. Verschiedene Ideen für die Ausgestaltung gibt es schon, wann diese wie umgesetzt werden, muss aber noch geklärt werden. Bis dahin wird das vascoda-Blog erst mal nicht unter der Domain www.vascoda.de betrieben, wird aber natürlich durch die Weiterleitung über diese Adresse zu erreichen sein.

Eine Möglichkeit, die Suchräume der einzelnen Fachbibliotheken sinnvoll zu nutzen wäre vielleicht, sie in einer Form anzubieten, wie es mit dem kooperativen Solr/Lucene-Index des GBV geplant ist. Till Kinstler illustriert die Idee in den folgenden Folien:

Würden die einzelnen Indices frei zur Verfügung gestellt werden, könnten Bibliotheken die fachlich jeweils relevanten lokal aggregieren. Dies würde zu einer erheblichen Mehrnutzung der von den Fachportalen gesammelten Informationen führen. Sinnvolle Idee?

7 Gedanken zu „Vascoda und dann?“

  1. Das (verteilte Suche über mehrere Indices) funktioniert nur unter sehr genau definierten Bedingungen gut. Sonst landet man bei dem, was Vascoda ja ganz am Anfang mal war: Klassische Metasuche.
    Bei Vascoda ging es dann weiter mit “Suchmaschinentechnologie”. Da man nicht alle Daten zentral in einem Index haben konnte, kam dort die Idee einer “Suchmaschinenföderation” auf. Christian Kohlschütter hatte mit Kollegen dazu ein Konzept entwickelt und beschrieben, das sehr schön die Theorie dahinter darstellt (was ist notwendig, um verteilte Suche unter Beibehaltung von “Suchmaschineneigenschaften” mit TF/IDF-basiertem Ranking, Facetten usw. effizient(!) machen zu können?), finde das Paper leider nicht mehr frei im Netz. Diese Folien zur praktischen Umsetzung mit Fast und Lucene Suchmaschinen zeigen aber schon das Kernproblem: http://opus.bsz-bw.de/swop/volltexte/2008/337/pdf/kohlschuetter_lucene_workshop.pdf
    Es funktioniert nur unter sehr engen Rahmenbedingungen. Das “Plugin”, dass da genannt wird, ist (nach meinem Verständnis :-)) nix anderes als die Reindexierung aller Datenbestände in einheitlichen Lucene-Indices. Das ist also (technisch :-)) keine Föderation aus Fast und Lucene, sondern eine aus reinen, vereinheitlichten Lucene-Indices 🙂 Ist aber auch nicht überraschend. Man kann z.B. die Termstatistiken aus zwei vollkommen unterschiedlichen Suchmaschinenimplementierungen nicht einfach zusammenwerfen. Insbesondere wenn die eine geschlossene Software ist und man deswegen gar nicht weiß, was da in der Blackbox berechnet wird (und man auch gar nicht (offiziell) an diese Daten kommt). Sonst hat man wieder Metasuche…
    Diese “kooperativen Solr/Lucene”-Indices können auch nur funktionieren, wenn man sich auf Einsatz der gleichen Technik (Solr) unter zumindest im Kern gleichen Bedingungen (im Kern gleiche Index-Schemata) einigt. Das geht innerhalb eines Verbundes bzw. einer Verbundzentrale sehr viel einfacher als mit vielen unterschiedlichen Beteiligten. Inwieweit und warum das schonmal nicht funktioniert hat, kann man vermutlich genau an Vascoda studieren. Es hat sicher nicht nur technische Gründe…

  2. Besten Dank für die Infos! Heißt das dann, daß, wenn z.B. die ViFa medien bühne film auf Solr/Lucene setzt (laut S. 20, PDF), könnte man den Index einigermaßen unfallfrei übernehmen, wenn man sich auf ein Index-Schema einigt?

    Klingt technisch machbar, organisatorisch möglicherweise schwieriger.

  3. Sich überhaupt erstmal auf ein gemeinsames Metadatenschema bzw Kernset an Metadatenelementen zu einigen, war ja schon ein langer Prozess. Das vascoda Application Profile zur Standardisierung von Metadatenlieferungen an vascoda hat letztlich auch nur einen empfehlenden Charakter, es dient sozusagen als Leitfaden, an den sich die Meisten beteiligten dann auch grob gehalten haben. Sich dagegen auf ein einheitliches Index-Schema zu einigen, ist aus meiner Sicht tatsächlich nicht möglich (es sei denn man hat nur einen gemeinsamen zentralen Index). Dafür gibt es bei den verschiedenen Anbietern und den verschiedenen Systemen, die eingesetzt werden – die teils über die Jahre gewaschsen sind und für die teils große Aufwände betrieben wurden – doch zu viele Eigenheiten und Eigenwünsche.

    Till hat die Anfänge und Probleme der föderierten Suche in vascoda, denke ich, ganz gut zusammengefasst. Wir sind da dann ja unserer Suche über verteilte Indices einen ganz pragmatischen Weg gegangen (mussten ihn gehen), den wir zwar föderierte Suche nennen, der aber wohl nach harten Kriterien keine föderierte Suche ist, sondern vielleicht doch nur ein schnelle und erweiterte Metasuche über Suchmaschinenindices, bei der neben bibliographischen Informationen z.B. auch Drill-Down-Informationen ausgetauscht werden. Über Begriffe kann man sich streite, will ich aber gar nicht.

    Den Grundgedanken, dass jede Bibliothek, jedes Fachportal sich ihre relevanten Datenkollektionen aus dem vascodo-Suchraum (dem verteilten Index) holt und lokal ins eigene Suchsystem einbindet, haben wir ja verfolgt. Auf Basis der Föderation war dies ja tatsächlich auch schon prototypisch möglich, für den breiten Einsatz hätte wir hier noch etwas Arbeit reinstecken müssen. Nun, das ist jetzt hinfällig, die Grundidee aber vielleicht nachnutzbar und ausbaufähig.

    Der Gedanke, der auf alle Fälle weiterverolgt werden sollte ist, ob die Fachportale ihre Daten oder jedenfalls Teile ihrer Datenbestände als Linked Open Data zur Verfügung stellen.

  4. Ob die Daten in einem zentralen oder verteilten Index oder via SPARQL abfragbar sind, und ob es Portale gibt die eine Teilmenge nutzen oder die kompletten Metadaten – alle diese Szenarien können ihre Anwender finden. Deshalb würde ich mir wünschen dass die Metadaten mit einer CC0 Lizenz versehen würden. Danach werden, mit der Zeit, die Daten in den verschiedensten Dienste genutzt werden.

Kommentare sind geschlossen.