BASE: Weniger Quellen, höhere Volltextquote?

Klaus Graf kritisiert ein Interview von Richard Poynder mit Clifford Lynch  (PDF).

Poynder sagt, dass BASE keine Volltexte erfassen kann, wenn es keine Volltexte gibt. Nur ca. 60 % des Inhalts seien Volltexte. Poynder übersieht, dass BASE so gut wie keine Volltextsuche anbietet, das allermeiste sind OAI-PMH-Metadaten (auch von Volltexten). Dass BASE nicht nur Peer Review Beiträge bietet (Poynder denunziert die Suchmaschine, weil sie einen Blogpost von mir enthält) ist für mich absolut in Ordnung. Qualitäts-Fetischisten, die nur Peer Review Inhalte akzeptieren, können in der Geschichtswissenschaft schätzungsweise mehr als 99 % der Gesamtproduktion seit der Renaissance in die Tonne drücken. Retrodigitalisate und Dissertationen, die BASE erfreulicherweise nachweist, unterliegen/unterlagen keinem Peer Review.

Das soll eine Denunziation sein? Egal, kommen wir zum Inhaltlichen: Die Forderung nach Peer-Review-Kennzeichnung verkennt tatsächlich die Vielfalt der wissenschaftlichen Kulturen. Es ist gerade eine Stärke von BASE, auch Abschlussarbeiten etc. in großer Zahl nachzuweisen. Wo findet man sonst Bachelorarbeiten?

Poynders Kritik an der zu geringen Volltextquote in BASE teile ich allerdings, und das seit vielen Jahren. Etliche Quellen sollten einfach gestrichen werden. Was BASE vielleicht gut tun würde, ist ein radikaler Schnitt, wie ihn DOAJ gerade durchführt. Alle Quellen auf den Prüfstand. Alle anschreiben, ein Sigel ausschreiben. Kein kostenpflichtiges und sehr aufwändiges wie das DINI-Zertifikat. Eines, das deutlich weniger, aber sehr wichtige Kriterien abprüft. Als erstes: Gibt es ein OAI-Set, das nur OA-Volltexte enthält. Würde man diese dann zum “Kernbestand” des BASE-Index machen, hätte man tatsächlich eine OA-Suche, die zwar immer noch nur die Metadaten durchsucht und nicht die Volltexte, deren Treffer aber immerhin garantiert zum Volltext führen.

Es ist schon bezeichnend, dass die Facette “Open Access” nur noch 37 Mio Dokumente übrig lässt. Davon übrigens sehr viele aus Pubmed Central, DOAJ und CiteSeerX, Dubletten sind da wohl sehr wahrscheinlich. Beispielsuche in BASE nach The diploid genome sequence of an individual human: sieben Treffer für ein und denselben Artikel. Dubletten-Bereinigung ist nicht trivial, ist aber gerade bei Green OA ein sinnvolles Ziel. Das ist etwas, was Google Scholar deutlich besser macht. Dort gibt es nur einen Treffer – und 34 Orte, an denen man zum Text kommen soll.

BASE ist ein sehr gutes Werkzeug, das ich nahezu werktäglich einsetze. Aber es ist – und das ist keine Schande – tatsächlich noch Luft nach oben.

Preis für Abschlussarbeiten über “Open Source”

Ausgezeichnet werden Arbeiten, die den Einsatz von Open Source-Software für professionelle Anwender attraktiver machen. Eine Einschränkung auf bestimmte Fachbereiche besteht nicht.

Der Gewinner des Absolventenpreis erhält € 2.000 Preisgeld, der Zweitplatzierte € 1.000 und der Drittplatzierte gewinnt € 500.

Mehr Infos auf Absolventenpreis.de.

[via Heise.de]

Schmitt & Stehle: Der OPAC aus dem Baukasten

Jörg Schmitt und Marcel Stehle: Der OPAC aus dem Baukasten : Realisierung eines Katalog 2.0 unter Einbeziehung der Community
(PDF)

Abstract:

Die vorliegende Bachelorthesis beschreibt die exemplarische Erstellung des Katalog 2.0 „bachelopac“ unter Verwendung der Open-Source-Software VuFind. Die Frage, inwieweit dies, mit den erlernten Kenntnissen und erworbenen Fähigkeiten während des Studiums Bibliotheks- und Informationsmanagement der HAW Hamburg, realisierbar ist, wird beantwortet. Hierzu werden vom Gemeinsamen Bibliotheksverbund (GBV) zur Verfügung gestellte Metadaten des Bibliotheksystems der HAW Hamburg verwendet. Die Vor- und Nachteile, die durch den Einsatz von Open-Source-Software in Bibliotheken entstehen, werden ebenso erläutert wie die Notwendigkeit zeitgemäßer Kataloge und deren Umsetzung im Hinblick auf Bibliothek 2.0 und Katalog 2.0. Angelehnt an eine Machbarkeitsstudie werden Projektaufgaben und Projektziele sowie ein Kriterienkatalog zur Beurteilung der eigenen Kenntnisse entwickelt und durchgeführt. Der praktische Teil dieser Arbeit befasst sich mit den Problemen und Schwierigkeiten der technischen Umsetzung, beschreibt aber auch Lösungswege und -konzepte. Neben der aktiven Unterstützung durch die Community wird auch die Möglichkeit zur Nachnutzung von bereits bestehenden Lösungen aufgezeigt.

Zwei Punkte aus der Arbeit möchte ich herausgreifen. Zuerst auf S. 18 im Kapitel “Zum Einsatz von Open-Source-Software im Kontext von Bibliothek 2.0”:

Da die Entwicklung von OSS nicht an einen bestimmten Hersteller gebunden ist, durch den eine Gewährleistung oder Garantie erfolgen könnte, liegt es an der Community, die Entwicklung ihrer Programme voranzutreiben. Für Bibliotheken birgt dies aber auch eine große Chance, da sie so „Betrieb, Anpassung und Entwicklung ihrer “Informationstechnik”(!) als Teil ihres Kerngeschäfts begreifen und entsprechend professionell(!) betreiben.“ können.

Das Zitat im Zitat stammt aus einem Kommentar von Till Kinstler im Beluga-Blog. Ich würde den Einsatz von OSS nicht nur als Chance, sondern als zwingende Voraussetzung für die Professionalisierung des Bibliothekswesen bezeichnen. Momenten ist es noch viel zu oft der Fall, dass die grundlegen Instrumente und Werkzeuge nicht im Einflußbereich der Bibliothek liegen. Konkret kann das zum Beispiel bedeuten, dass man Kleinigkeiten an Katalogen selbst ändern kann, was faktisch vielen Bibliothekswesen zur Zeit nicht möglich ist. Dazu aus einem meiner Allzeitlieblingskommentare von Jakob Voss:

Ich kann nur für den Bereich Software und Webseiten sprechen: dort habe ich den Eindruck, dass sich Bibliotheken viel zu oft über den Tisch ziehen lassen und alles dem Hersteller überlassen, anstatt durch Eigenentwicklungen dringend benötigte Kompetenzen aufzubauen und zu erhalten. Wieviele Mitarbeiter sich jeweils an einem Projekt (sei es eine Konferenz oder die Entwicklung eines Katalogs) beteiligen sollten, hängt vom Einzelfall ab – in jedem Fall werden die Mitarbeiter jedoch nicht “freigestellt” sondern “eingesetzt”! Fortbildung und Projektarbeit außerhalb der alltäglichen Arbeit ist nichts zusätzliches sondern gehört zum “lebenslangem Lernen”, ohne dass jede Bibliothek mittel- bis langfristig einpacken kann!

Zweitens möchte ich noch auf die “Nicht gelösten Probleme” (S. 118 ff) hinweisen. Solch ein Kapitel sollte verpflichtend in allen Projektberichten enthalten sein, da dort sinnvolle Ansätze für vertiefende Projekte zu finden sind. Wer Scheitern – ob im Ganzen oder in Teilbereichen – nicht dokumentiert, stellt nachfolgende Projekte wieder vor die Aufgabe, eigentlich bekannte zu umschiffende Klippen noch einmal zu entdecken.

[via Bachelopac-Blog]

Christian Stelzenmüller: Mashups in Bibliotheken

Mashups können durch die Kombination von Daten einen Mehrwert gegenüber den ursprünglichen Informationsquellen bieten. Diese Arbeit stellt Mashups vor und zeigt, wie Bibliotheken Mashups bislang für sich nutzen. Des weiteren wird untersucht, wie verbreitet sie auf ausgewählten Websites wissenschaftlicher Bibliotheken sind. Abschließend wird anhand eines einfachen, praktischen Beispiels erläutert, wie ein Mashup realisiert werden kann, und welche Schritte dafür notwendig sind.

Die Bachelorarbeit von Christian Stelzenmüller “Mashups in Bibliotheken : Untersuchung der Verbreitung von Mashups auf Webseiten wissenschaftlicher Bibliotheken und Erstellung eines praktischen Beispiels” ist hier online verfügbar.

Das im Abstract erwähnte praktische Beispiel ist eine Karte sämtlicher wissenschaftlicher Bibliotheken,

die am BIX-WB im Jahr 2007 teilgenommen haben. Es wird neben der Adresse und den BIX-Ergebnisdaten der Bibliotheken auch ein Link zur Homepage der einzelnen Bibliotheks-Website angezeigt.

Diese Bachelorarbeit zeigt sehr schön, dass

  1. Mashups keine Zauberkunst sind, und
  2. durchaus praktische Anwendung finden können.

Somit ist sie ein weiteres Argument dafür, dass auch Bachelorarbeiten oft veröffentlichungswürdig sind.