Google Minus: Immer weniger Suchmaschine. -1

Teil der Operation Frühjahrsputz, in deren Verlauf angefangene und nie beendete Postings einfach so veröffentlicht werden. Die hier erwähnten Beispiele funktionieren teils nicht mehr, da Google das Pluszeichen nun anderweitig verwendet.

Alle reden über Google+, dabei ist Google- mindestens ebenso spektakulär. Und von der Bedeutung für die Google-Nutzer zum jetzigen Zeitpunkt als wesentlich gravierender einzuschätzen. Gemeint ist damit die schleichende Verschlechterung der Suchmaschine, die Google einst auszeichnete.

1. Exakte Suche

Suche ich nach Informationen zum Markt in der französischen Gemeinde Schwoben, ist mir Google keine Hilfe. Gebe ich “markt schwoben” in den Suchschlitz, wird nach “markt schwaben” gesucht. Nicht das, was ich wollte.

Nun wird mir – wie im Screenshot ersichtlich – angeboten, nach “markt schwoben” zu suchen. Wie gelesen, so geklickt. Was passiert?

Immerhin die drei der ersten zehn Treffer enthalten die gewünschten Suchbegriffe. Bei den restlichen sieben werden ähnliche Begriffe wie “Schwoba” oder wieder “Schwaben” in die Ergebnisse gemischt.

Eine exakte Suche in Google ist nur noch möglich, wenn man entweder die Phrasensuche (in Anführungszeichen) verwendet oder ein Plus-Zeichen vor den gewünschten Begriff setzt. Mit “+markt +schwoben” erhält man tatsächlich Seiten, in denen beide Begriffe auftauchen.

Shelflife

Anne Christensen macht auf Plan3t.info auf Shelflife (hatten wir hier schon einmal) aufmerksam. Dabei handelt es sich um einen pfiffigen Versuch, den Mehrwert des Stöberns am Regal in die digitale Welt zu übertragen.

Am meisten beeindruckt bin ich davon, dass die Farbe der Buchrücken die Relevanz der jeweiligen Titel abbildet, und zwar auf Grundlage von lokalen Ausleihdaten sowie der Verwendung der Titel in Kursen und Seminaren der Universität. “Community Relevance” heißt dieser Faktor, den das clevere Entwicklungsteam einführt und damit bestehende interessante Vorschläge zur Integration von Popularitätsdaten in Ranking-Algorithmen aufgreift.

Mehr dazu im Video:

Tutorial from Harvard Library Innovation Lab on Vimeo.

Und natürlich (auch weiterführende Links) in Annes Posting auf Plan3t.info.

ShelfLife und LibraryCloud

David Weinberger stellt in seinem Blog zwei seiner Projekte vor, ShelfLife und LibraryCloud:

Upon the announcement of the beta sprint in May, we partnered up with folks at thirteen other institutions…an amazing group of people. Our small team at Harvard , with generous internal support, built ShelfLife and LibraryCloud on top of the integrated catalogs of five libraries, public and university, with a combined count of almost 15 million items, plus circulation data. We also pulled in some choice items from the Web, including metadata about every TED talk, open courseware, and Wikipedia pages about books. (Finding all or even most of the Wikipedia pages about books required real ingenuity on the part of our team, and was a fun project that we’re in the process of writing up.)

The metadata about those items goes into LibraryCloud, which collects and openly publishes that metadata via APIs and as linked open data. We’re proposing LibraryCloud to DPLA as a metadata server for the data DPLA collects, so that people can write library analytics programs, integrate library item information into other sites and apps, build recommendation and navigation systems, etc. We see this as an important way what libraries know can become fully a part of the Web ecosystem.

ShelfLife baut auf verschiedenen Annahmen auf. Unter anderem: Libraries are social systems. Library items are social objects. A library navigation system should be social as well.

Einen Prototypen gibt es auch. Mehr Infos in seinem Blog.

Innovation gegen anfänglichen Widerstand: Amazon-Recommender

Greg Linden beschrieb 2006, wie er die Recommender-Funktion bei Amazon gegen den Widerstand des Managements durchsetzte. Nachdem er die Idee dazu hatte, setze er erst einmal einen Prototypen auf und führte ihn verschiedenen KollegInnen vor.

While the reaction was positive, there was some concern. In particular, a marketing senior vice-president was dead set against it. His main objection was that it might distract people away from checking out — it is true that it is much easier and more common to see customers abandon their cart at the register in online retail — and he rallied others to his cause.

Linden wurde die Weiterentwicklung des Prototypen verboten. Er widersetzte sich diesem Verbot und bereitete eine Version vor, die im Echtbetrieb getestet werden konnte. Gegen sein Ansinnen, diesen Test dann auch durchzuführen, gab es keine schlagkräftigen Argumente. Im Testbetrieb zeigte sich dann, was für ein enorm wichtiges Instrument die Recommender-Funktion für Amazon sein könnte. Sein Fazit:

Creativity must flow from everywhere. Whether you are a summer intern or the CTO, any good idea must be able to seek an objective test, preferably a test that exposes the idea to real customers.

Everyone must be able to experiment, learn, and iterate. Position, obedience, and tradition should hold no power. For innovation to flourish, measurement must rule.

Mein Fazit: dito. Wer ausschließlich oder auch nur vorwiegend Top-Down denkt, schließt die Entwicklung einer innovativen Organisation aus. Dies ist eine Binsenweisheit, hat sich aber noch nicht überall herumgesprochen.

[via Daniel Lemire]

Open-Source-Recommender easyrec

Die Recommender-Software easyrec ist seit sechs Tagen komplett Open Source.

Benötigt werden für die Installation auf einem eigenen Server:

  • Java 5 SE [1] or later
  • Application Server Tomcat 6.0 [2] or later recommended or see other Application Servers
  • Database Server MySQL 5.1 [3] or later

Man kann den Dienst jedoch auch über eine API ausprobieren. Wer hat Zugriff auf einen Katalog und traut sich, das mal einzubauen? Mich würde doch sehr interessieren, ob die Ergebnisse so viel schlechter als die von Bibtip sind. Bibtip ist ein Projekt, dass zwar aus öffentlichen Mitteln finanziert wurde, aber dennoch sogar für öffentliche Einrichtungen kostenpflichtig ist. Kostenpflichtig für Hosting und Support würde ich ja noch verstehen. Wie auch immer: Easyrec wird z.B. beim Film-Shop Flimmit genutzt. Interessiert man sich z.B. für Plattfuss am Nil, wird sofort weitere Unterhaltungsware der schlagkräftigen Art angeboten (“Sie könnten auch an folgenden Produkten interessiert sein”).

Google News Timeline

Google News lassen sich nun auch in einer Zeitleiste darstellen:

Leider habe ich keine Möglichkeit gefunden, bestimmte Zeitleisten zu verlinken. Interessant ist auf jeden Fall, dass der Youtube-Channel der Associated Press ausgewertet und eingebunden wird. Auf diese Weise bekommt man bei der Suche nach “climate change” food z.B. diese Obama-Rede angeboten.

Genauere Infos (auch zur neuen Recommender-Funktion bei der Google-Bildsuche gibt’s im eingebundenen Video oder bei Golem.

Tim Spalding zu Recommendersystemen

Librarythings Tim Spalding reagiert via NGC4LIB auf einen Bibtip-Artikel in DLIB:

1. You can’t draw conclusions based upon a small number of overlapping “trips.” If one trip were enough and you knew I’d looked at something super-obscure, you could probably figure out the other pages I’d looked at too. Just go to the page you saw me browsing and see what appears in the “people who looked at this also looked at…” box. If my obscure book of Hellenistic poetry overlaps with “Having an Affair for Dummies,” I’m in trouble with the missus.

Korrekt. Doch dagegen setzt Bibtip auf ausschließliches Anzeigen multipler Übereinstimmungen. Doch:

2. But if you need multiple overlaps, the amount of usable data goes way down. This is, I submit, what Ann Arbor’s recommendation system showed. You need a lot of data in a recommendation system for it to work. The worse the data, the more you need. (On LibraryThing, we do not generally even *try* to make a recommendation when there are fewer than 15 copies of a book in the system, and those aren’t books you casually looked at, those are books in people’s personal collection.)

“A lot of data” kann man auch generieren. Ich vermute, dass gerade dazu die lange “Inkubationszeit” zwischen Installation und Ergebnisanzeige bei Bibtip zu diesem Zweck dient.

3. Like other systems that follow where users go, not whether they liked it there and what they did there, BibTip is susceptible to “ant navigation” problems. You know how ants find their way about? They follow the trail put down by other ants. This works well in general, but it can also go bad. An ant gets lost. Another ant happens on the trail, and gets lost too, a third and sees a really strong trail, so three are lost, etc. At its worst you have the famous phenomenon of ants going round and round in a circle, following other ants and their ever-stronger trail, until all the ants die of exhaustion!

Diesem Manko könnte man nur entgegen treten, wenn man Ausleihzahlen mit in die Auswertung aufnehmen würde. Das wirft in der Praxis jedoch erhebliche Probleme auf. Genannt seien hier Datenschutz und mangelnde Schnittstellen der Bibliothekssysteme.

I ask you: Do we want library patrons dying of exhaustion?

Zumindest nicht oft.

4. In all seriousness, the ant problem is real. Every time the catalog sends you somewhere you don’t want to go, you’ve made a trail telling the next guy to go there too. If library catalogs worked, ant-tracking would too. But when I type “Harry Potter” into the search box of a large public library I use all the time, I don’t get a real-live English-language Harry Potter book until item number nine!

Prinzipiell hat Spalding Recht, nur sehe ich den Zusammenhang zu Katalogrankings nicht. Meist ist dort eine spezielle Sortierung voreingestellt, oft nach Erscheinungsjahr oder nach Datum der Katalogisierung. Was wirklich nichts mit Recommendersystemen oder Benutzerempfehlungen zu tun hat. Vielleicht geht Spalding allerdings auch von suchmaschinengestützten Katalogen aus?

Related Tags bei Amazon

Irgendwo hatte ich kürzlich begeisterte Berichte von Amazons “Related”-Funktionen gelesen. Doch was muss ich da bei einem Artikel aus der edlen Feder zweier Infobib-Autoren sehen?

Amazon - Sponsored Links

Tanz die Informationskompetenz! Und bei den Tags hört’s dann ganz auf:

Amazon - Related tags

Magic? Natürlich. For ed -ucation? Sicher! Den Rest möchte ich mir höflichst verbitten. Schon spannend, welche Tags bei bisher nicht getaggten Items angezeigt werden.

Übrigens, man sollte diesen Artikel nicht zu einem überteuerten Preis kaufen, man kann ihn nämlich auch gratis bekommen.