Die ViFa medien buehne film nutzt nun YaCy für die Suche in Webseiten. Schön zu sehen, wie Ideen aus Bibcamp-Sessions irgendwann Realität werden!
Schlagwort: yacy
Duckduckgo: !bang für Plan3t.info
Vor ein paar Tagen habe ich DuckDuckGo vorgeschlagen, ein !bang für Plan3t.info einzurichten. Kurze Zeit später erreichte mich folgende Mail:
!plan3t is now live on DuckDuckGo!
Nun kann man mit Hilfe des !bangs !plan3t aus Duckduckgo direkt in Plan3t.info suchen. Zum Beispiel führt folgende Eingabe “!plan3t bestandaufbau” …
… direkt zur Ergebnisliste in Plan3t.info:
Es gibt noch viele weitere !bangs, z.B.:
- !latex und !tex
- !wp (WordPress)
- !wde (Wikipedia DE)
Academic: !academic !ads !arxiv !buej !cfp !citeul !collegeconfidential !dlss !duc !jstor !legal !mendeley !novoseek !scholar (!gsc) !searchworks !sep !ted !tsr
- !pubmed !wolframalpha
- !yacy
Und viele, viele andere. Base fehlt übrigens noch.
Trend Nr. 1 für 2011: Peer-to-Peer (P2P)
Teil der Operation Frühjahrsputz, in deren Verlauf angefangene und nie beendete Postings einfach so veröffentlicht werden. Dieses Posting finde ich aus bloghistorischer Sicht besonders interessant. Ich lag übrigens mächtig daneben mit meiner Prognose.
Mit meiner Trend-Ansage für 2010 lag ich einigermaßen richtig. Linked (Open) Data ist wirklich ein Dauerthema geworden. Immer noch auf dem aufsteigenden Ast, aber inzwischen im bibliothekarischen Bewusstsein verankert. Auch beim anderen prophezeiten Trend, mobile Bibliotheksanwendungen, ist noch Luft nach oben. Thema waren sie jedoch auch jeden Fall. Daher wage ich es, auch für das nächste Jahr eine Prognose abzugeben.
Trend Nr. 1 für 2011 werden Peer-to-Peer-Anwendungen (P2P) verschiedenster Art sein. Verschiedene Vorgänge der jüngeren Vergangenheit haben auch Laien drastisch vorgeführt, wie fragil digitale Kommunikation ist. In Ägypten wurde das Netz kurzerhand abgeschaltet
Zentral | Dezentral | Identi.ca |
---|---|
Diaspora | |
Yacy |
http://webzwonull.ishp.de/allgemein/amazon-facebook-twitter-und-das-hausrecht-in-der-cloud/
http://annalist.noblogs.org/post/2011/01/08/us-justiz-holt-die-netze-ein/
PS: Der erste Monat des Jahres ist schon wieder herum, und dieses Posting harrte immer noch der Fertigstellung. Daher ist es nun in nicht so ausführlicher Form wie ursprünglich geplant.
YaCy als Open-Access-Suchmaschine
Im letzten Herbst wünschte ich mir eine dezentrale Alternative zum OAIster. Der YaCy-Entwickler Michael Christen fand die Thematik spannend und teilte mir mit, dass YaCy intern auch schon einige Vorraussetzungen beherrscht, um bibliographische Daten zu bearbeiten, unter anderem den Umgang mit Dublin Core. Im Bibcamp-Blog schrieb ich im Oktober recht optimistisch:
Ein interessante Frage stellt sich aktuell durch die drohende OAIster-Wegschließung: Wie kann man man eine dezentrale Alternative zu OAIster schaffen? Bis zum Bibcamp wird vermutlich ein YaCy-Prototyp für die Suche in Dokumentenservern stehen. Das Bibcamp bietet eine hervorragende Gelegenheit, diesen Prototypen auf Herz und Nieren zu prüfen und vielleicht sogar direkt vor Ort zu verbessern!
Der Prototyp ist da, und werden mehrere YaCysten beim Bibcamp sein, die sicherlich gerne über bibliothekarische Anwendungen von YaCy diskutieren würden. In einer indischen Bibliothek wird es schon für eine digitale Bibliothek eingesetzt, die mehr als 2TB Audio, Video und E-Books
und eine HTML-Oberfläche mit über 800.000 Seiten umfasst. Denkbar und sinnvoll wäre eine Anwendung zum Beispiel in Virtuellen Fachbibliotheken. Wenn man sie schon mit viel Aufwand konstruiert und mühsam Webquellen sammelt, könnte man den Index auch anderen zur Verfügung stellen. Und genau dies ist mit YaCy möglich.
Ich habe die neueste Version übrigens mal testweise auf meinem Desktoprechner installiert und innerhalb kürzester Zeit 20 Repositories mit bis zu 35.000 Dokumenten indexiert. Geht ganz einfach, und ist hier erklärt. Für einen Prototypen sehr respektabel, wie ich finde.
Dezentrale OAIster-Alternative mit YaCy
In einer Mail an NGC4LIB, einer Mailingliste, in der das Ende des OAIster derzeit heftig debattiert wird, habe ich vorgeschlagen eine dezentrale Alternative mit YaCy aufzubauen.
A lot of people don’t seem to be very happy with OCLCs decision on OAIster. There’s a general problem with centralized services like OAIster. Too much can happen to that single service, and if it’s down it’s down. That’s why I thought about a distributed OA search for some time now and the OAIster decision gave reason to me to ask the YaCy [1] developer Michael Christen if YaCy could be used for such a search. To make it short: he’s quite optimistic.
Right now YaCy is not able to import data via OAI-PMH but that should be possible to realize. Of course there’s still some work to be done, for example the proper implementation of dublin core. On page 2 of http://yacy.net/material/YaCy_LT2009_Flyer_216x303.pdf (in German) you can find an example of the current possibilities of YaCy with dublin core. BTW: It’s SRU compliant.
We’d like to set up a Yacy instance as a proof of concept. In future it should be possible to cluster some of these instances to a large network of open access search engines. Just to mention the name of this mailing list: kind of a “next generation catalog for libraries”, I guess.
Opinions, anyone? Do you think a distributed OA search could be useful?
Kritik, Vorschläge und andere Äußerungen dazu bitte in die Mailingliste oder hier in die Kommentare. Gerne auch direkt per Mail. Hätte solch ein Projekt Zukunft? Was wären die Anforderungen?