Infobib

Interessantes aus Informations- und Bibliothekswesen

Du durchsuchst gerade das Archiv des Tags ‘open data’.

Archiv: open data

2013 18 Nov

Open Wald Data

Abgelegt unter: Open Content | RSS 2.0 | TB | Tags: , , | Kommentare geschlossen

Forscher vermessen die Wälder. Im SpOn-Artikel steht, die zugrunde liegenden Global-Forest-Change-Daten seien frei zugänglich. Eine Registrierung oder Anfrage über ein Google-Spreadsheet ist jedoch notwendig. Lizenz-Angaben konnte ich nicht finden.

2013 2 Okt

Bulk Data vom US Patent Office

Abgelegt unter: Bibliothek,Open Content | RSS 2.0 | TB | Tags: , , , , | Kommentare geschlossen

2013 29 Aug

Public Lab

Abgelegt unter: Open Content | RSS 2.0 | TB | Tags: , , , , , | Kommentare geschlossen

Das Public Lab will Wissenschaft demokratisieren. Dazu entwickelt es (offene) Software und (bezahlbare) Geräte.

The Public Laboratory for Open Technology and Science (Public Lab) is a community which develops and applies open-source tools to environmental exploration and investigation. By democratizing inexpensive and accessible Do-It-Yourself techniques, Public Lab creates a collaborative network of practitioners who actively re-imagine the human relationship with the environment.

Zu den Werkzeugen gehören MapKnitter, Infrarotkameras, Kartographie-Ballons und das Public Lab Archiveopen data from balloon and kite photography.

[via @recology_]

Interessantes neues interdisziplinäres Repository: Zenodo.

All research outputs from across all fields of science are welcome! ZENODO accept any file format as well as both positive and negative results. However, we do promote peer-reviewed openly accessible research, and we do curate your upload before putting it on the front-page.

Die Features klingen spannend. Unter anderem kann man direkt aus seiner Dropbox veröffentlichen. Metadatenextraktion aus Dateien ist auch geplant.

[via Peter Suber, siehe auch Archivalia]

“Open Data – Managing Information as an Asset” (PDF) ist das Dekret Obamas betitelt, das Open Data in den USA (nach meinem Verständnis) zumindest auf Bundesebene zum Standard machen wird.

This Memorandum requires agencies to collect or create information in a way that supports downstream information processing and dissemination activities. This includes using machine­ readable and open formats, data standards, and common core and extensible metadata for all new information creation and collection efforts. It also includes agencies ensuring information stewardship through the use of open licenses and review of information for privacy, confidentiality, security, or other restrictions to release.

[via CreativeCommons.org]

Den Versuch, psychologische Studien zu reproduzieren, hatten wir hier kürzlich schon einmal. Nun wurde in der Nature eine Studie veröffentlicht, in der 53 landmark studies aus der Onkologie und Hämatologie untersucht werden. Ergebnis:

It was acknowledged from the outset that some of the data might not hold up, because papers were deliberately selected that described something completely new, such as fresh approaches to targeting cancers or alternative clinical uses for existing therapeutics. Nevertheless, scientific findings were confirmed in only 6 (11%) cases. Even knowing the limitations of preclinical research, this was a shocking result.

“Shocking” trifft es ganz gut.

Begley, C. Glenn; Ellis, Lee M. (2012): Drug development: Raise standards for preclinical cancer research. In: Nature 483 (7391), S. 531–533.

Im American Economic Review wurde 2010 eine anscheinend vielbeachtete Studie über “Growth in a Time of Debt” publiziert.1 Die Washington Post machte nun darauf aufmerksam, dass diese Studie nicht nur in der Austeritätsdebatte eine große Rolle gespielt habe, sondern auch methodisch nicht einwandfrei sei. In der Berechnung (in Excel), die der Studie zugrunde liegt, seien Berechnungsfehler begangen worden.

This discrepancy wasn’t caught earlier because Reinhart and Rogoff hadn’t made their full underlying data public. They only shared their spreadsheet with the Herndon, Ash and Pollin after the latter three tried to replicate the initial results and failed.

Hier geht es zur erwähnten Studie von Reinhart und Rogoff. Die Daten werden dort gleich zum Download angeboten, ebenso der R-Code, mit dem die zweite Auswertung gemacht wurde. Wer nun dort nach Fehlern suchen möchte, kann dies ohne Umstände machen und muss nicht den Studienautoren hinterherbetteln.

PS: Bei diesem Beispiel geht es mir nicht darum, ob sich durch Datenverfügbarkeit nun gegenteilige ökonomische Schlüsse ziehen lassen, sondern einzig um die Reproduzierbarkeit von Wissenschaft.


  1. Reinhart, Carmen M., and Kenneth S. Rogoff. 2010. “Growth in a Time of Debt.” American Economic Review, 100(2): 573-78.
    http://dx.doi.org/10.1257/aer.100.2.573 []

In der aktuellen Nature-Ausgabe schreibt Richard Monastersky über den Wandel bibliothekarischer Tätigkeit durch Open Data:

At Johns Hopkins and many other top universities, libraries are aiming to become more active partners in the research enterprise — altering the way scientists conduct and publish their work. Libraries are looking to assist with all stages of research, by offering guidance and tools for collecting, exploring, visualizing, labelling and sharing data. “I see us moving up the food chain and being co-contributors to the creation of new knowledge,” says Sarah Thomas, the head of libraries at the University of Oxford, UK.

Ebenfalls interessant:

  1. Advocacy: How to hasten open access
  2. Licence restrictions: A fool’s errand

Und weitere Artikel und Kommentare dieser Ausgabe zu “Data Reuse”, Open Access und den Wandel des wissenschaftlichen Publizierens.

Frauen in Führungspositionen bei den DBV-Mitgliedern nach Sektionen. Vollansicht nach dem Klick:

Die Grafik ist “work in progress”. Die Basis der verwendeten Zahlen wurde mir freundlicherweise vom DBV nach sehr kurzer Antwortzeit (und mit der Genehmigung, sie als Open Data zu veröffentlichen!) überlassen. Die Daten sind bei Figshare zu finden:

Members of Deutscher Bibliotheksverband e. V. (dbv).
http://dx.doi.org/10.6084/m9.figshare.647329
Retrieved 19:35, Mar 17, 2013 (GMT)

Die dort zu findenden Daten habe ich für die Darstellung noch ein wenig angereichert und um ein paar Dutzend Angaben ergänzt. Sobald ich dazu komme, werde ich die vollständigeren Daten zu einem späteren Zeitpunkt veröffentlichen. An den Zahlenverhältnissen wird sich nach jetzigem Stand kaum etwas ändern.

Die schwarze Hilfslinie kennzeichnet den Gesamtanteil von Frauen im Bibliothekswesen nach “Berufe im Spiegel der Statistik” des Instituts für Arbeitsmarkt- und Berufsforschung im Mittel von 2007 bis 2011 (74,48%). Auch da ist keine statistisch signifikante Änderung durch aktuellere Daten zu erwarten.

Sektion 3B, in denen der Frauenanteil in Führungspositionen höher ist als im gesamten Bibliothekswesen, beinhaltet 1113 Mitglieder in Öffentlichen Bibliothekssystemen und Bibliotheken für Versorgungsbereiche bis zu 50.000 Einwohner und Landkreise mit bibliothekarischen Einrichtungen. Am niedrigsten ist der Frauenanteil an den Spitzen von “Wissenschaftlichen Universalbibliotheken” (Sektion 4) und Öffentlichen Bibliothekssystemen und Bibliotheken für Versorgungsbereiche von über 400.000 Einwohnern (Sektion 1).

In Danilo Vetters Film “Die geschätzte Kollegin vom festgezurrten Haupthaar : Geschlecht (k)eine Frage in Bibliotheken?” wurde das Thema Frauen in Führungspositionen übrigens auch angesprochen, ebenso das Thema Reputation und (ungleiche) Bezahlung. Ein Beispiel: Frauen waren für die Führungsaufgaben ja angeblich überhaupt nicht geeignet (ca. 06:55).

If you’re a psychologist, the news has to make you a little nervous, beginnt ein Artikel im Chronicle of Higher Education. Besonders PsychologInnen, die 2008 in einem der Journals “Psychological Science”, “Journal of Personality and Social Psychology” oder im “Journal of Experimental Psychology: Learning, Memory, and Cognition” veröffentlicht haben. Denn deren Werk wird vom Reproducibility Project unter die Lupe genommen, genauer gesagt: reproduziert.

Wer helfen möchte, kann sich beteiligen:

The Reproducibility Project is open to anyone who is interested in the reproducibility of psychological science or in participating in a large-scale, open science project. Contributors receive authorship on project reports (see Executive Summary for details). Ways to contribute include:

  • Conducting or helping with a replication study
  • Helping with statistical analyses or power / sample size calculations
  • Reviewing and contributing to replication protocols or reports
  • Coding published studies (extracting hypotheses, sample characteristics, and requirements for replication)
  • Programming tasks such as creating stimulus presentation scripts or automated data processing

If you’d like to get involved, fill out our new contributor survey and we’ll get in touch with you about opportunities that are a match for your skills and resources. We welcome contributions from students and citizen scientists as well as researchers and scientific professionals. If you have any questions, feel free to contact our volunteer coordinator at reproducibilityproject@gmail.com.

Voraussetzung für Reproduzierbarkeit sind neben sauber dokumentierten Versuchen auch die Verfügbarkeit der Mittel zur Reproduktion.

  • Open Access: Wer den Artikel nicht lesen kann, kann Versuche auch nicht reproduzieren
  • Open Data: Wer die Rohdaten nicht hat, auch nicht.
  • Open Source: Wo Software eingesetzt wird, sollte diese frei verfügbar sein. Zum Beispiel Octave statt MatLab (aktuell € 500 für die Basisversion, wenn ich die Preistabelle richtig verstehe) oder R statt SPSS (wirklich über € 2000?). Darunter fallen dann auch die konkreten Skripte und Modelle.

Ergo (natürlich verkürzt): Reproduzierbarkeit = Open Access + Open Data + Open Source


Reproduzierte Psychologie von CH steht unter einer Creative Commons Namensnennung-Weitergabe unter gleichen Bedingungen 3.0 Deutschland Lizenz. blogoscoop
Infobib läuft unter Wordpress.3.0.5 | Theme: angepasst nach : Gabis Wordpress-Templates | Creative Commons Lizenzvertrag 21 Verweise - 0.318 Sekunden.