Sind Upload-Filter eine Bedrohung für große Repositories?

Internet platforms hosting “large amounts” of user-uploaded content must monitor user behavior and filter their contributions to identify and prevent copyright infringement.

Der Kampf gegen diese heute vom Rechtsausschuss des EU-Parlaments abgesegnete Formulierung ist noch nicht vorbei, wie Netzpolitik richtig anmerkt. Zwar ist Upload-Filter und Leistungsschutzrecht nun zugestimmt worden, aber es existieren noch Wege, diesen Irrsinn zu verhindern.

Im Bibliothekswesen, nein, im ganzen Wissenschaftssektor sollte man darüber nachdenken, was diese Klausel für große Repositories zur Folge haben könnte. Können Betreiber großer Repositories (egal, ob Software, Forschungsdaten oder konventionelle OA-Repositories) die gewünschte Filterung gewährleisten? Müssen Arxiv.org, RePEc, Zenodo & Co nun Upload-Filter integrieren, die zwischen Zitaten, Paraphrasen und Plagiaten unterscheiden können? Wie sieht es mit Mega-Journals wie PLOS One oder PeerJ aus? Muss auch dort gefiltert und gesiebt werden? Muss auch dort das “user behaviour” überwacht werden?

Gruselige Zeiten, die von den hier namentlich erwähnten Damen und Herren herbei beschworen werden. Es ist noch nicht zu spät, um sich an die eigene Vertretung im EU-Parlament zu wenden. Wiederum Netzpolitik.org:

Noch ist es nicht zu spät. Viele EU-Abgeordnete reagieren auf Druck von Außen – umso wichtiger, dass sie auch Stimmen aus der Zivilgesellschaft vernehmen und nicht nur von finanzstarken Lobbyorganisationen. Gleich drei Plattformen bieten eine einfache Möglichkeit, wacklige Parlamentarier per E-Mail oder noch besser, kostenlos per Telefon, zu kontaktieren. Wie das erbitterte Ringen – und letztlich der Erfolg – um die europäischen Regeln zur Netzneutralität gezeigt haben, lohnt sich der Einsatz.

Wie immer gilt: Höflich bleiben und argumentieren! Eine selbst formulierte Mail und vor allem ein eigenständiger Betreff sind viel wirkungsvoller als eine vorformulierte Mail, die schnell im Spamordner landet.

TIB/UB eröffnet Open Science Lab

Lambert Heller im Blog der TIB/UB Hannover:

An der TIB Hannover nimmt 2013 ein neues Team seine Arbeit auf, das Open Science Lab. Hier sollen neuartige Webanwendungen für ForscherInnen in enger Abstimmung mit überregionalen Benutzer-Communities erprobt und (weiter-)entwickelt werden. Alle Ergebnisse sollen schnell öffentlich zugänglich gemacht werden, auch dann, wenn es sich um vorläufige oder experimentelle Anwendungen handelt. Das Lab strebt vielfältige Kooperationen mit anderen Interessierten (einzelnen Softwareentwicklern, Verlagen, Bibliotheken etc.) an und will Drittmittel für neue Entwicklungen einwerben.

Untersucht werden sollen u.a. der Umgang mit publizierten Rohdaten oder alternative Publikationsarten. Die Ergebnisse sollen konsequenterweise unter freien Lizenzen veröffentlicht werden.

Kein IRrweg, aber dennoch Handlungsbedarf

Klaus Graf wirft einen Blick auf Google Scholar und zieht daraus Schlüsse über den IRrweg Institutionelle Repositorien. Er sucht nach “Science” und zählt die Volltextlinks:

Über 40 der 100 Treffer zum Thema bzw. Suchwort Science – sicher wichtige, weil vielzitierte Artikel – haben Volltextlinks, aber ich finde nur ein IR (igitur, NL) darunter und 3 arxiv-Links.

Wenn man einfach so nach Science sucht, hat man recht viele Treffer aus früheren Jahrzehnten. Da ich die Bedeutung der IRs eher anhand aktuellerer Publikationen prüfen würde, habe ich mal (willkürlich gewählt) auf Publikationen ab 2005 eingeschränkt.

Dabei ergibt sich schon ein etwas anderes Bild. Ich habe jetzt nicht alle verfügbaren Versionen abgeprüft, und bis zu 89 Versionen pro Dokument habe ich auf den vorderen Ergebnisseiten gesehen. Aber nun sind deutlich mehr Links auf Volltexte in IRs dabei, und alleine 3 Arxiv-Dokumente unter den ersten 10 Treffern.

Richtig bleibt aber, dass meist wohl der erste Volltext-Link angeklickt wird, der auch direkt auf der Ergebnisseite zu sehen ist. Dies ist oft nicht der IR-Link. Was ist jetzt der Schluss daraus? Sollen Repositories per SEO auf Google Scholar getrimmt werden?

Ja, das kann man machen. Man sollte es sogar. Nick Sheppard hat schon vor drei zwei Jahren die Notwendigkeit von SEO für IRs festgestellt.

It is crucial that both the Open Access full text research content of the repository and metadata records of citation material are fully indexed by Google (and other search engines); in the future it is also likely to be required for other Open Educational Resources (learning objects). However, site:http://repository-intralibrary.leedsmet.ac.uk/ currently returns just 4 results (in addition to the Login page itself) and it is a bit of a mystery how these 4 are actually being picked up when the majority of records are not.

Klickt man auf den Link, sieht man sofort, dass Sheppards Bemühungen von Erfolg gekrönt waren.

So nervig die SEO-Gemeinde mit ihrem recht hohen Schwarzschafanteil oft auch ist: Archivare und Bibliothekswesen müssen sich auch ein wenig um das Thema SEO kümmern. Und somit auch um so etwas wie Googles Panda, um Schema.org oder einfach darum, die Daten erstmal überhaupt ins Web zu bekommen. Stichwort Permalinks.

Google & Bibliotheken spielen keine Hauptrolle für Elementarteilchenphysikern

SuMa-Blogger Mario Behling berichtet über eine Umfrage zu Rechercheinstrumenten von Elementarteilchenphysikern.

Auf die Frage, welches Informationssystem für High Energy Physics sie denn am häufigsten benutzen würden, antworteten die Wissenschaftler (Auszug):

ARXIV: 49,7%
BIBLIOTHEKEN: 0,2%
GOOGLE: 7,8%
SPIRES: 38,2%

Vollständige Ergebnisse im Artikel “Information Resources in High-Energy Physics – Surveying the Present Landscape and Charting the Future Course” (PDF). Eine ähnliche Studie hatten wir hier ja gerade erst.