Open-Source-Recommender easyrec

Die Recommender-Software easyrec ist seit sechs Tagen komplett Open Source.

Benötigt werden für die Installation auf einem eigenen Server:

  • Java 5 SE [1] or later
  • Application Server Tomcat 6.0 [2] or later recommended or see other Application Servers
  • Database Server MySQL 5.1 [3] or later

Man kann den Dienst jedoch auch über eine API ausprobieren. Wer hat Zugriff auf einen Katalog und traut sich, das mal einzubauen? Mich würde doch sehr interessieren, ob die Ergebnisse so viel schlechter als die von Bibtip sind. Bibtip ist ein Projekt, dass zwar aus öffentlichen Mitteln finanziert wurde, aber dennoch sogar für öffentliche Einrichtungen kostenpflichtig ist. Kostenpflichtig für Hosting und Support würde ich ja noch verstehen. Wie auch immer: Easyrec wird z.B. beim Film-Shop Flimmit genutzt. Interessiert man sich z.B. für Plattfuss am Nil, wird sofort weitere Unterhaltungsware der schlagkräftigen Art angeboten (“Sie könnten auch an folgenden Produkten interessiert sein”).

Bibsonomy bald quelloffen / Open-Access-Projekt PUMA

Im Bibsonomy-Blog wurden ein paar Neuigkeiten zur Zukunft des Projekts gepostet. Das Wichtigste in Kürze:

  • Die Bibsonomy-Technologie wird in das PUMA-Projekt eingebracht, das, wenn ich die Projektbeschreibung richtig verstanden habe, Open Access aus Nutzersicht attraktiver machen möchte. Prinzipiell eine gute Idee. Warum die Beispielimplementation an DSpace ausgerichtet wird, könnte ich mir dadurch erklären, dass OPUS m.E. nicht wirklich Open Source ist. Man kann zwar den kompletten Quellcode einsehen, aber eine Testinstallation ist nicht ohne weiteres möglich.
  • Alle Bestandteile des Projektes werden unter als FLOSS veröffentlicht. Also auch Bibsonomy, leider aber erst nachdem das Projekt beendet ist. Wann das sein wird, ist leider weder im Blogposting noch auf der Projektwebseite angegeben.

Schön, dass der Open-Source-Gedanke Einzug hält in die DFG-Projekt-Landschaft. Es ist ja schließlich wirklich schwer vermittelbar, warum Projekte wie Bibtip, die von Steuermitteln angeschoben wurden um eine dauerhafte Verbesserung der Informationsinfrastruktur wissenschaftlicher Bibliotheken in Deutschland zu ermöglichen, nicht allen die an eben jener Verbesserung arbeiten möchten, open source zur Verfügung steht.

[via acka47]

Hahn, Schulze: Katalogerweiterungen, Mashups und Elemente der "Bibliothek 2.0" in der Praxis

Im aktuellen Bibliotheksdienst (43 (2009), H. 1, S. 20-38), beschreiben Ulrich Hahn und Matthias Schulze, wie der Katalog der UB der Helmut-Schmidt-Universität mit allerlei Nützlichkeiten aufgebohrt wurde. Zuerst wären da:

Im Artikel wird gut deutlich, mit welch geringem Aufwand sich ein Mehrwert für Biblioteksnutzer schaffen lässt. Aber, ohne jemandem die Geschäftsgrundlage zu mißgönnen: Für Lagepläne im OPAC braucht man meines Erachtens keine Firma engagieren. Die Integration von verlinkten Standorten funktioniert zumindest in PICA-OPACs, wie man im Katalog der TUB HH sehen kann. Und wie man mit einfachen (und kostenlosen) Mittel Lagepläne erstellt, beschreibt Tobias Zeumer.

Auch bei Bibtip handelt es sich um eine kommerzielle Dienstleistung, die, obwohl es sich um ein DFG-Projekt zur dauerhaften Verbesserung der Informationsinfrastruktur wissenschaftlicher Bibliotheken in Deutschland. handelt, entgegen einer DFG-Empfehlung (PDF) nicht im Quelltext verfügbar ist.

Mit meinen Einwänden möchte ich diesen Dienste auf keinen Fall die Praxistauglichkeit absprechen.

Im Artikel geht’s weiter mit der Einbindung von Daten und Coverbildern über die API der Google-Buchsuche. Dies wird zu Recht als “klassisches Mashup” bezeichnet. Für die Zukunft werden unter anderem zusätzliche Erweiterungen des Katalogs und der Einsatz von Videocasts versprochen. Dem Schlußsatz kann ich mich nur anschließen: “Wir denken aber, dass unser Katalog durchaus ein klein wenig besser geworden ist.”

Tim Spalding zu Recommendersystemen

Librarythings Tim Spalding reagiert via NGC4LIB auf einen Bibtip-Artikel in DLIB:

1. You can’t draw conclusions based upon a small number of overlapping “trips.” If one trip were enough and you knew I’d looked at something super-obscure, you could probably figure out the other pages I’d looked at too. Just go to the page you saw me browsing and see what appears in the “people who looked at this also looked at…” box. If my obscure book of Hellenistic poetry overlaps with “Having an Affair for Dummies,” I’m in trouble with the missus.

Korrekt. Doch dagegen setzt Bibtip auf ausschließliches Anzeigen multipler Übereinstimmungen. Doch:

2. But if you need multiple overlaps, the amount of usable data goes way down. This is, I submit, what Ann Arbor’s recommendation system showed. You need a lot of data in a recommendation system for it to work. The worse the data, the more you need. (On LibraryThing, we do not generally even *try* to make a recommendation when there are fewer than 15 copies of a book in the system, and those aren’t books you casually looked at, those are books in people’s personal collection.)

“A lot of data” kann man auch generieren. Ich vermute, dass gerade dazu die lange “Inkubationszeit” zwischen Installation und Ergebnisanzeige bei Bibtip zu diesem Zweck dient.

3. Like other systems that follow where users go, not whether they liked it there and what they did there, BibTip is susceptible to “ant navigation” problems. You know how ants find their way about? They follow the trail put down by other ants. This works well in general, but it can also go bad. An ant gets lost. Another ant happens on the trail, and gets lost too, a third and sees a really strong trail, so three are lost, etc. At its worst you have the famous phenomenon of ants going round and round in a circle, following other ants and their ever-stronger trail, until all the ants die of exhaustion!

Diesem Manko könnte man nur entgegen treten, wenn man Ausleihzahlen mit in die Auswertung aufnehmen würde. Das wirft in der Praxis jedoch erhebliche Probleme auf. Genannt seien hier Datenschutz und mangelnde Schnittstellen der Bibliothekssysteme.

I ask you: Do we want library patrons dying of exhaustion?

Zumindest nicht oft.

4. In all seriousness, the ant problem is real. Every time the catalog sends you somewhere you don’t want to go, you’ve made a trail telling the next guy to go there too. If library catalogs worked, ant-tracking would too. But when I type “Harry Potter” into the search box of a large public library I use all the time, I don’t get a real-live English-language Harry Potter book until item number nine!

Prinzipiell hat Spalding Recht, nur sehe ich den Zusammenhang zu Katalogrankings nicht. Meist ist dort eine spezielle Sortierung voreingestellt, oft nach Erscheinungsjahr oder nach Datum der Katalogisierung. Was wirklich nichts mit Recommendersystemen oder Benutzerempfehlungen zu tun hat. Vielleicht geht Spalding allerdings auch von suchmaschinengestützten Katalogen aus?

HIPpie

HIPpie-Logo

Wer einen HIP-OPAC einsetzt, kann ihn nun (einstweilen) kostenlos mit den HIPpie-Tools von Dave Pattern veredeln. Mit ein paar Zeilen Javascript kann man dann auf folgende Features zurückgreifen.

  • RSS feeds for keyword searches
  • “did you mean” spelling suggestions
  • email alerts for keyword searches
  • user reviews
  • user ratings

Im Gegensatz zu Bibtip, das sich auf ähnliche Weise einbinden lässt, also ohne Fördermittel entstanden, und dennoch gratis verfügbar.