R 3.0

Via Heise:

Die Programmiersprache R, die als Softwareumgebung speziell für statistische Berechnungen und Graphen ausgelegt ist, ist in Version 3.0 erschienen. Zentrale Neuerung der unter dem Codenamen Masked Marvel entwickelten Sprachversion, die den ersten Versionssprung seit achteinhalb Jahren darstellt, sind die Unterstützung für 64-Bit-Integer-Werte auf allen R-Plattformen. Für R 3.0 bedeutet das insbesondere die Einführung langer Vektoren mit mehr als 231 Elementen auf 64-Bit-Systemen.

Eine Liste mit vielen Änderungen ist auf der Mailingliste R-Announce veröffentlicht worden.

Open-Data-Portal der EU

Nachdem viele Mitgliedsländer der EU bereits nationale Open-Data Plattformen etabliert haben oder dabei sind diese zu entwickeln, hat die Europäische Kommission heimlich, still und leise, pünktlich zum Weihnachtsfest die Beta-Version des brandneuen EU Open-Data Portals mit über 5800 Datensätzen (ca. 5600 davon kommen von Eurostat) gelauncht!

Mehr bei Open Everything. Und hier geht’s zum Portal.

#lib2011: Live-Visualisierung mit OpenCPU & R

Jemand (Najko Jahn?) hat im Libreas-Blog kürzlich vorgestellt, wie man OpenCPU nutzen kann, um sich ein eigenes Tweet-Archiv anzulegen und dies auch gleich zu visualisieren. Er/sie tat dies am Beispiel #oebt11. Hier ein anderes Beispiel, die aktuell durchgeführte Library 2.011:

CSV dazu:
http://beta1.opencpu.org/R/call/store:tmp/8f81a308a4f8898f0aff6ba41bead5e4/csv?tag=”lib2011″

Einige Tweets sind tatsächlich mit dem Datum 26. – 30.11. versehen. Wo der Fehler liegt, vermag ich nicht zu sagen.

Update, siehe Kommentare:

SOAP-Daten in Google Fusion Tables

Die Daten aus der SOAP-Umfrage sind nun als Google Fusion Table verfügbar. Damit lassen sich mit ein paar Klicks nette Visualisierungen machen. Eigentlich lassen sich die Daten auch als interaktive Widgets einbinden. Da dies (zur Zeit?) nicht verlässlich funktioniert, hier nun drei Beispiele als Screenshots:

Verteilung aller Teilnehmer der SOAP-Umfrage:
Verteilung gesamt

Verteilung der Teilnehmer, die als “Main Discipline” Social Sciences angeben:

Verteilung der Teilnehmer, die die Frage “Who decides where to submit” mit “I am advised where to publish by a senior colleague” beantwortet haben:

Die Daten aus Fusion Tables sind auch via API nutzbar. Möge es nutzen.

SOAP-Daten unter CC0 zum Download

Wie angekündigt sind die Rohdaten des SOAP-Projekts (Study of Open Access Publishing) nun unter CC0 frei verfügbar.

  • Ankündigung auf der Projektseite mit Downloadmöglichkeiten (CSV, XLS. Der Downloadlink für XLSX ist defekt [1]Wieder einmal ein Hinweis darauf, dass Shortlinks nirgendwo verwendet werden sollten, wo nicht wirklich Zeichen eingespart werden müssen! Das Data Manual wird hier verlinkt, sobald es nicht nur via … Continue reading )
  • Download hier als CSV (ca. 25 MB)
  • Download hier als ODS (ca. 4,5 MB) [2]Kann mir jemand erklären, warum die ODS-Datei nur knapp ein Fünftel der Größe der CSV-Datei hat? Liegt es daran, dass mehrfach auftretende Werte in der CSV-Datei jedes einzelne Mal in voller … Continue reading

Nun ist der Weg frei für Untersuchungen und Stichproben jeglicher Art. Als kleines Beispiel habe ich einmal die Zustimmung der Wissenschaftler, die sich hauptsächlich den Historical and Philosophical Studies zugehörig fühlen, zur These “OA articles are likely to be read and cited more often than those not OA” untersucht.

Strongly Agree 315
Agree 449
Neither agree nor disagree 265
Disagree 73
Strongly disagree 10
Keine Antwort 70
Summe 1182

Dies ist Stoff für Dutzende von Abschlußarbeiten und hervorragendes Argumentationsmaterial für Bibliothekswesen!

References

References
1 Wieder einmal ein Hinweis darauf, dass Shortlinks nirgendwo verwendet werden sollten, wo nicht wirklich Zeichen eingespart werden müssen! Das Data Manual wird hier verlinkt, sobald es nicht nur via Shortlink verfügbar ist.
2 Kann mir jemand erklären, warum die ODS-Datei nur knapp ein Fünftel der Größe der CSV-Datei hat? Liegt es daran, dass mehrfach auftretende Werte in der CSV-Datei jedes einzelne Mal in voller Länge erwähnt werden müssen?

Republik Infobib größer als Vatikan

Der Sharenators bietet anschauliche Vergleiche und Visualisierungen zur Größe der Nutzerschaft einzelner Webseiten. Für Infobib.de heißt das:

If Infobib.de were a country, it would be larger than Vatican City.
1 in every 500,000 internet users visit Infobib.de daily.

Die Schätzungen basieren auf Alexa, kommen aber in der Größenordnung für die Webseiten, bei denen ich es einschätzen kann, einigermaßen hin.