Dezentrale OAIster-Alternative mit YaCy

In einer Mail an NGC4LIB, einer Mailingliste, in der das Ende des OAIster derzeit heftig debattiert wird, habe ich vorgeschlagen eine dezentrale Alternative mit YaCy aufzubauen.

A lot of people don’t seem to be very happy with OCLCs decision on OAIster. There’s a general problem with centralized services like OAIster. Too much can happen to that single service, and if it’s down it’s down. That’s why I thought about a distributed OA search for some time now and the OAIster decision gave reason to me to ask the YaCy [1] developer Michael Christen if YaCy could be used for such a search. To make it short: he’s quite optimistic.

Right now YaCy is not able to import data via OAI-PMH but that should be possible to realize. Of course there’s still some work to be done, for example the proper implementation of dublin core. On page 2 of http://yacy.net/material/YaCy_LT2009_Flyer_216x303.pdf (in German) you can find an example of the current possibilities of YaCy with dublin core. BTW: It’s SRU compliant.

We’d like to set up a Yacy instance as a proof of concept. In future it should be possible to cluster some of these instances to a large network of open access search engines. Just to mention the name of this mailing list: kind of a “next generation catalog for libraries”, I guess.

Opinions, anyone? Do you think a distributed OA search could be useful?

Kritik, Vorschläge und andere Äußerungen dazu bitte in die Mailingliste oder hier in die Kommentare. Gerne auch direkt per Mail. Hätte solch ein Projekt Zukunft? Was wären die Anforderungen?

OCLC stampft OAIster ein. Was tun?

Klaus Graf machte kürzlich darauf aufmerksam, was OCLC mit OAIster vorhat. Verständlicherweise brach ein Sturm der Entrüstung los. Nun beantwortet Roy Tennant zumindest einige der aufgetretenen Fragen. Ein paar der spannendsten Punkte:

Starting in October, the records will be freely discoverable along with all the other content in WorldCat.org. However, it will not be possible to limit a search to OAIster records alone.

[…]

Contributors of OAIster records can receive free access to the OAIster aggregation in FirstSearch by request. Contributors were recently contacted to offer them such access and many have already responded that they would like to have such access.

Only data providers that request that we not harvest their records will be removed from the aggregation. We feel strongly that one of the main benefits of OAIster has been the aggregation of records from the vast majority of repositories worldwide. Therefore, unless a repository denies us permission to harvest their records, we will seek to include them.

[…]

We are exploring options for machine access. Z39.50 access to OAIster is available to FirstSearch subscribers now, and we are considering whether additional options should be supported. The University of Michigan did not offer an OAI-PMH or Web Services interface, although they did offer an rsync option. Learning the needs of the community will help inform what we do in this area.

Eine höchst unbefriedigende Situation. Es spricht meines Erachtens nichts dagegen, dass der OAIster in irgendwelche OCLC-Produkte eingebunden wird, aber der OAIster oder ein adäquater Nachfolger sollte unbedingt erhalten bleiben. Ist das OCLCs verfrühter Beitrag zur Open-Access-Week?

Im Posting erklärt Tennant noch, wie kompliziert es sei, Metadaten per OAI-PMH zu harvesten. Vielleicht wäre es ja eine Aufgabe für einen oder mehrere Bibliotheksverbünde, eine Schnittstelle zur Verfügung zu stellen, auf die andere Suchdienste aufbauen könnten. Konkret könnte das so aussehen, dass ein Server alle greifbaren Daten aggregiert, normalisiert und zum Beispiel per SRU (nur als Beispiel) durchsuchbar macht oder auch als komplettes Datenpaket zum Download anbietet. Das wäre wirklich ein Fortschritt für die Open-Access-Bewegung. Und der Ausfall einer Suchoberfläche kein Problem mehr, da ruckzuck eine weitere aufgebaut werden könnte.

Erst die Kontroverse über die OCLC-Policy, nun dies. Das Fazit kann nur sein, OCLC nicht mehr Verantwortung und Daten in die Hand zu geben, als unbedingt notwendig ist.

Geschäftstüchtige British Library

Vorgeschichte: Vor einiger Zeit haben zwei Infobiber einen Artikel zur Vermittlung von Informationskompetenz veröffentlicht, der nach einer gewissen Frist vom Verlag für Open-Access-Repositorien freigegeben wurde. Dies haben wir dann auch gerne wahrgenommen. Nun ist es so, dass damit für Dritte der Weg frei ist, um mit einem solchen Artikel den einen oder anderen Euro zu verdienen. Wie z.B. bei Emerald (GBP £13.00 plus handling charge of GBP £1.50 and VAT where applicable), bei Amazon (erfreulich günstig für nur $5,95) oder aber in der Premiumversion bei Research & Markets für sensationelle 34 Euro!

Nun ja, das kann man mehr oder weniger gut finden, vielleicht sogar unverschämt. Aber es ist alles rechtens, kein Einspruch möglich oder angebracht. Was ich jedoch ein wenig schräg finde, ist das Angebot der British Library, den Artikel via British Library Direct gegen Entgelt zu beziehen:

To buy the full text of this article you pay: £5.00 copyright fee + service charge (from £7.65) + VAT, if applicable

Copyright fee? Aha!

Fazit: Sollte jemand nach Publikationen suchen, ist British Library Direct für die Recherche vielleicht geeignet. Hat man das Gesuchte jedoch gefunden, sollte man lieber nochmal gegenprüfen (z.B. via BASE oder OAIster), ob man das Gewünschte nicht auch kostenfrei bekommen kann.