Open Access Repository Ranking

Bei den Open Access Tagen 2014 wurde das Open Access Repository Ranking (OARR) vorgestellt und veröffentlicht. Neben der erfreulichen und gleich für die Öffentlichkeitsarbeit ausgeschlachteten Platzierung des von mir betreuten SerWisS ist positiv anzumerken, dass es endlich eine Alternative zum Ranking web of repositories gibt. Einer von vielen Unterschieden: OARR kommuniziert zwar auf Englisch, hat bisher(?) aber ausschließlich Repositories aus Deutschland im Fokus.

Die MacherInnen sind offen für Verbesserungsvorschläge, fordern sie sogar aktiv ein (ganz unten im Tab “Contribute” – Achtung, Ghostery & Co verhindern evtl. die Anzeige des Formulars).

#lib2011: Live-Visualisierung mit OpenCPU & R

Jemand (Najko Jahn?) hat im Libreas-Blog kürzlich vorgestellt, wie man OpenCPU nutzen kann, um sich ein eigenes Tweet-Archiv anzulegen und dies auch gleich zu visualisieren. Er/sie tat dies am Beispiel #oebt11. Hier ein anderes Beispiel, die aktuell durchgeführte Library 2.011:

CSV dazu:
http://beta1.opencpu.org/R/call/store:tmp/8f81a308a4f8898f0aff6ba41bead5e4/csv?tag=”lib2011″

Einige Tweets sind tatsächlich mit dem Datum 26. – 30.11. versehen. Wo der Fehler liegt, vermag ich nicht zu sagen.

Update, siehe Kommentare:

Piwik in Bibliothekskatalogen

Piwik ist ein Tracking-Tool, das als Open-Source-Lösung eine Alternative zu Google Analytics bietet. Da die erfassten Daten anonymisierbar sind und bei Selbsthosting nicht an Dritte fließen, ist ein Einsatz mit dem Datenschutz und den dazugehörigen Beauftragten sicherlich vereinbar. An einigen Bibliotheken wird Piwik bereits eingesetzt. Gefunden habe ich Piwik zum Beispiel auf den Webseiten der UB der Ruhr-Universität Bochum, der ULB Düsseldorf, SUB Bremen oder der ULB Bonn.

In Katalogen direkt habe ich nur wenige Verwendungen gefunden:

Gibt es Erfahrungsberichte, seit wann, wie und mit welchem Ergebnis die Katalogverwendung getrackt wurde? Oder auch dokumentierte Überlegungen, die zur Nichtverwendung oder Nicht-Mehr-Verwendung solcher Tracker führten? Für Hinweise oder sogar Berichte wäre ich dankbar!

Interessante Fragen wären beispielsweise:

  • Wird das Tracking regelmäßig ausgewertet?
  • Welche Vereinbarung mit dem Datenschutzbeauftragten ging voraus?
  • Hat das Tracking Konsequenzen für die Gestaltung der Webseite oder den Bestandsaufbau?

PS: Ein weiterer Tracker, den ich gefunden habe, ist eTracker auf der Webseite der ZBW Kiel. Die Bibliothek der Leuphana (auch in Touchpoint) setzt Google Analytics ein. Ebenso bibnet.org.

Blekko: Grep the Web

Letzten Monat hat Blekko den Web-Grepper angekündigt:

The way it works is simple. Everyday, we will run 2 map jobs against our crawl of 4 billion pages. These will be greps for strings, patterns, regex expressions that blekko users submit to us and decide are cool. Got a grep you want to run? Submit it here. If enough people agree with you that this grep is interesting (by voting it up), we’ll run it. And we’ll post the results here. We make the top 500 results for every grep available for free to anyone who wants it. Pretty cool, eh?

Auf den Seiten von Blekko kann man Web-Greps sowohl vorschlagen als auch einen kleinen Ausschnitt der durchgeführten Greps einsehen.

Eine Anfrage galt zum Beispiel dem Mikroformat class=”hrecipe”. Das Ergebnis: Die Zeichenkette wurde 869.396 Mal auf 1.698 Domains gefunden.

Republik Infobib größer als Vatikan

Der Sharenators bietet anschauliche Vergleiche und Visualisierungen zur Größe der Nutzerschaft einzelner Webseiten. Für Infobib.de heißt das:

If Infobib.de were a country, it would be larger than Vatican City.
1 in every 500,000 internet users visit Infobib.de daily.

Die Schätzungen basieren auf Alexa, kommen aber in der Größenordnung für die Webseiten, bei denen ich es einschätzen kann, einigermaßen hin.

Infobib im Perlentaucher

Kleine Nabelschau zum Wochenende: Die Materialsammlung zum Heidelberger Appell wurde im Perlentaucher erwähnt:

Das Bibliotheksblog Infobib bietet seit einiger Zeit eine nützliche Linkliste zur Debatte um den “Heidelberger Appell”.

Schön, das Wort Bibliotheksblog mal in Mainstream-Medien zu lesen. Für die Hobby-SEOs: Die Auswirkungen auf den Traffic ist äußerst gering. Am selben Tag kamen nur 86 Besucher vom Perlentaucher. Zum Vergleich: Stefan Niggemeiers Hinweis führte fast 200 Besucher zur Materialsammlung.

Windows vs. Linux vs. OS/X vs. …

Heise berichtet, dass der Linux-Anteil bei den Desktopbetriebssystemen die 1%-Grenze durchbrochen hat. Die Zahl der Kommentare bei diesem nach Trollerei lechzenden Artikel steigt unaufhörlich. Tatsächlich sind darunter auch wieder ein paar interessante Informationen, zum Beispiel diese Vergleichszahlen aus dem universitären Bereich:

58% MS-Systeme
17% Mac-Systeme
24% Linux-Systeme (meist Ubuntu oder Debian,
vereinzelt SuSE und Fedora)

Leider ist dort nicht zu lesen, wie die Zahlen erfasst wurden. Da diese Zahlen meinen Schätzungen für den akademischen Bereich wesentlich näher kommen als die im Heise-Artikel genannten, würde mich sehr interessieren, wie es tatsächlich an den Hochschulen aussieht. Hat jemand belastbares Zahlenmaterial? Dies wäre auch als Argumentationshilfe bei Diskussionen mit Softwareanbietern (z.B. von Literaturverwaltungsprogrammen) überaus hilfreich. Dort wird Linux oft als Nischenprodukt gesehen, dass es m.E. im universitären Bereich jedoch längst nicht mehr ist.

Technorati baut um

Technorati wollte sich der Spam-Problematik annehmen und Ranking und Indexierung allgemein verbessern:

As an active blogger already in the Technorati index, we will continue to crawl and index your blog as before. We hope that your Technorati experience will improve. Our service should be faster, search results and blog reactions should be cleaner, and the number of legitimate blogs accidentally caught by our spam filters should decrease.

Links from new sites will be attributed to blog reactions and Technorati Authority when the new site is approved and indexed.

Diese Umbauarbeiten erklären vielleicht auch, warum neuere Blogs bei WordPress.com seit einiger Zeit von Technorati kaum noch erfasst werden. Das neue Vorgehen anhand der Technorati Blog Quality Guidelines hat auch Auswirkungen auf Nicht-Blogs mit RSS-Feed, die bislang meist aufgenommen wurden:

* Forums, social networks, chat streams, web pages or standalone feeds.
* Aggregation Sites that are aggregation of blogs or posts from other blogs, planet sites, feed splicers, etc. However, each blog can be indexed individually under its original blog URL.
* Standalone Feeds: Technorati indexes blogs via the blog home page with assistance of feeds only
* Permalinks: please do not ping with your permalink URLs

Gute Nachrichten. Die gibt es laut Technorati auch bald für Christian Spließ, dessen Posting auf das baldige 40. Jubiläum seines Blogs schließen lässt:

Antike Blogs bei Technorati

Halten wir fest: Technorati ist und bleibt zu unzuverlässig, um wirklich belastbare Informationen über die Blogosphäre gewinnen zu können. Rankings wie die Wissenschaftsblogcharts, die auf Technorati beruhen, sind somit höchstens als blogosphärisches Gesellschaftsspiel