BASE: Weniger Quellen, höhere Volltextquote?

Klaus Graf kritisiert ein Interview von Richard Poynder mit Clifford Lynch  (PDF).

Poynder sagt, dass BASE keine Volltexte erfassen kann, wenn es keine Volltexte gibt. Nur ca. 60 % des Inhalts seien Volltexte. Poynder übersieht, dass BASE so gut wie keine Volltextsuche anbietet, das allermeiste sind OAI-PMH-Metadaten (auch von Volltexten). Dass BASE nicht nur Peer Review Beiträge bietet (Poynder denunziert die Suchmaschine, weil sie einen Blogpost von mir enthält) ist für mich absolut in Ordnung. Qualitäts-Fetischisten, die nur Peer Review Inhalte akzeptieren, können in der Geschichtswissenschaft schätzungsweise mehr als 99 % der Gesamtproduktion seit der Renaissance in die Tonne drücken. Retrodigitalisate und Dissertationen, die BASE erfreulicherweise nachweist, unterliegen/unterlagen keinem Peer Review.

Das soll eine Denunziation sein? Egal, kommen wir zum Inhaltlichen: Die Forderung nach Peer-Review-Kennzeichnung verkennt tatsächlich die Vielfalt der wissenschaftlichen Kulturen. Es ist gerade eine Stärke von BASE, auch Abschlussarbeiten etc. in großer Zahl nachzuweisen. Wo findet man sonst Bachelorarbeiten?

Poynders Kritik an der zu geringen Volltextquote in BASE teile ich allerdings, und das seit vielen Jahren. Etliche Quellen sollten einfach gestrichen werden. Was BASE vielleicht gut tun würde, ist ein radikaler Schnitt, wie ihn DOAJ gerade durchführt. Alle Quellen auf den Prüfstand. Alle anschreiben, ein Sigel ausschreiben. Kein kostenpflichtiges und sehr aufwändiges wie das DINI-Zertifikat. Eines, das deutlich weniger, aber sehr wichtige Kriterien abprüft. Als erstes: Gibt es ein OAI-Set, das nur OA-Volltexte enthält. Würde man diese dann zum “Kernbestand” des BASE-Index machen, hätte man tatsächlich eine OA-Suche, die zwar immer noch nur die Metadaten durchsucht und nicht die Volltexte, deren Treffer aber immerhin garantiert zum Volltext führen.

Es ist schon bezeichnend, dass die Facette “Open Access” nur noch 37 Mio Dokumente übrig lässt. Davon übrigens sehr viele aus Pubmed Central, DOAJ und CiteSeerX, Dubletten sind da wohl sehr wahrscheinlich. Beispielsuche in BASE nach The diploid genome sequence of an individual human: sieben Treffer für ein und denselben Artikel. Dubletten-Bereinigung ist nicht trivial, ist aber gerade bei Green OA ein sinnvolles Ziel. Das ist etwas, was Google Scholar deutlich besser macht. Dort gibt es nur einen Treffer – und 34 Orte, an denen man zum Text kommen soll.

BASE ist ein sehr gutes Werkzeug, das ich nahezu werktäglich einsetze. Aber es ist – und das ist keine Schande – tatsächlich noch Luft nach oben.

PLoS-Artikel endlich(!) in DOAJ

Aus dem DOAJ-Blog:

Finally, after saying: “It’s coming” for almost a year, DOAJ has added the entire PLoS catalogue to DOAJ. A total of 182,500 articles were added and the harvester is set to go out and collect new articles at 5.30am every morning. The harvester collects the metadata from Europe PMC.

Hier geht’s zum erwähnten PLoS-Katalog im DOAJ. Und von da aus dann in den Findex (via GBV-DOAJ?) und von dort bald in unseren VuFind-Katalog.

Europeana-Kollektionen

Neuerdings bietet Europeana Kollektionen an, um den Einstieg in verschiedene Themen (Musik und Kunstgeschichte) einfacher gestalten zu können.

Übrigens hat auch die PLoS seit einigen Monaten Kollektionen. Für die werte Infobib-Leserschaft am interessantesten sind vermutlich die zu Research Analysis & Science Policy und Computer & Information Sciences.

Ich frage mich bei diesen Kollektionen oft, wer die Zielgruppe ist. Sind diese Kollektionen primär ein Instrument der Öffentlichkeitsarbeit?

VuFind (VZG) an der Bibliothek der Hochschule Hannover

Seit einiger Zeit ist bekannt, dass die VZG eine Discovery-Lösung selbst entwickelt hat. Wir in der Bibliothek der Hochschule Hannover setzen eine VuFind-Lösung der VZG ein. Nicht als primäres Recherche-Instrument für unsere NutzerInnen, da auch nach einigen Jahren die Verfügbarkeitsinformationen immer noch nicht korrekt dargestellt werden, aber für jeden zugänglich: http://katalog.bib.hs-hannover.de

Die Entscheidung der VZG zur Eigenentwicklung kam nicht nur für uns sehr überraschend. Auf der Wiki-Seite der FAG Technische Infrastruktur ist nach wie vor von der “Entwicklung des zentralen GBV Discovery Angebotes auf Basis von VuFind und GBV Zentral” die Rede, in den Protokollen der letzten beiden Fachbeirats-Sitzungen wird sie auch nicht erwähnt. Ebenso findet sich VuFind in den “Ziel- und Leistungsvereinbarungen 2015” des GBV lediglich in dem Zusammenhang, dass eine Implementierung für den FID Pharmazie geplant ist.

Zu den technischen Aspekten dieser Entscheidung hat sich Oliver Goldschmidt schon detaillierter geäußert, als ich es je könnte.

Wir als bisherige VuFind-Anwender sind mit VuFind eigentlich soweit zufrieden, dass wir keinerlei Leidensdruck zu einem Umzug verspüren. Im Gegenteil sehen wir in der stetig wachsenden, gerade deutschsprachigen Anwender-Community mit finc, Beluga & Co einen großen Vorteil für VuFind, den ein anderes System so schnell nicht einholen kann – zumal essentielle Dinge wie Community-Beteiligung bei der noch namenlosen Neuentwicklung noch völlig unklar sind.

Es ist schade, dass die VZG diese Community nicht weiter unterstützt. Aber die Bibliothek der Hochschule Hannover sieht keinen Grund, auf ein anderes System umzuschwenken.

PS: Das Beluga-Team hat sich auch zur Zukunft von VuFind geäußert.

Right Relevance

Alte Knochen aus dem Biblioblogwesen erinnern sich vielleicht an Googles Blogsuche oder sogar noch an Technorati, eine damals revolutionäre Blogsuchmaschine. Twingly & andere Nachfolger konnten die Lücke nach ihrer Schließung (bzw. Verkümmerung) nicht schließen. Nun macht sich mit Right Relevance ein neuer Kandidat mit einem vielversprechenden Ansatz auf den Weg, interessanten Nischen-Content auffindbar zu machen. RR über sich selbst:

Right Relevance is the quickest and simplest way to search and discover highly relevant deep topical content.
We mine the social web to identify and rank topical influencers. The inherent trust of the influencers communities is applied to finding the most relevant articles and conversations.

Social Web heißt hier in erster Linie (oder sogar ausschließlich?) Twitter. Und die Ergebnisse sind zumindest bei meinen Stichproben relevant und interessant. Ob zum Mars, zu Open Access, R oder VW, es finden sich überall interessante Neuigkeiten. Eine klassische Suchmaschine ist RR zwar nicht, aber ein interessantes Werkzeug, um neue Quellen zu verschiedenen Themen zu finden. Leider noch nicht auf Deutsch verfügbar, deutsche Quellen werden aber auch aufgeführt.

Ein paar Hintergrundinfos zu RR gibt es hier.

Kooperationsvereinbarung zwischen BSZ und VZG

Die Kooperationsvereinbarung zwischen BSZ und VZG (PDF) ist online verfügbar. Die Kernpunkte:

  • Vereinigung der Verbundkataloge des BSZ und der VZG in einer Produktivumgebung.
  • Anpassung der technischen Strukturen der Pica-Systeme beider Verbünde.
  • Einführung eines gemeinsamen Internformats und einheitlicher Katalogisierungs- und Anwendungsrichtlinien.
  • Arbeitsteiliger Aufbau einer gemeinsam genutzten Infrastruktur für den Nachweis und die Administration von E-Ressourcen wie z.B. E-Books für die Verbundzentralen und ihre teilnehmenden Bibliotheken.
  • Aufbau und arbeitsteiliger Betrieb von Infrastruktur und Support für lokale Bibliothekssysteme und Discovery-Services.
  • Gemeinsame Bereitstellung eines Workflow-Systems zur retrospektiven Digitalisierung.
  • Einführung einer arbeitsteiligen Infrastruktur für Dienstleistungen zur Langzeitarchivierung.
  • Abstimmung von Personalentwicklung, Kompetenz- und Leistungssaufbau, um Redundanzen zu vermeiden und Synergien zu nutzen.

>

Nach vier Jahren wird die Kooperation von der Verbundleitung des GBV und dem Kuratorium des BSZ evaluiert.