OPUS4 bald auf Github

Der Entwicklung Githubs zur maßgeblichen Anlaufstelle für Open-Source-Projekte kann man durchaus kritisch gegenüberstehen. Fakt ist aber, dass ein Umzug zu Github erst einmal für Strukturen sorgt, in denen man sich leicht beteiligen kann. Projekte werden dadurch transparenter und auch das Melden (und Nachverfolgen) von Fehlern und Vorschlägen lässt sich deutlich besser nachvollziehen; der Aufbau einer Community wird dann oft erst möglich.

Eben jenen Schritt in die “echte” Öffentlichkeit wagt nun das OPUS4-Team mit diversen Github-Repositories und einer dazugehörigen Dokumentationswebseite.

Kostenlose DOIs für akademische Einrichtungen

Das nenne ich mal eine schöne Nachricht! Aus der Pressemitteilung der TIB:

Die Vergabe der Digital Object Identifier, kurz DOI, die die dauerhafte Zitierbarkeit von elektronischen Publikationen und Forschungsdaten gewährleistet, ist ab diesem Jahr für akademische Einrichtungen kostenfrei. Dies haben die deutschen Mitglieder der internationalen Non-Profit-Organisation DataCite e.V., das GESIS – Leibniz-Institut für Sozialwissenschaften, die Technische Informationsbibliothek (TIB), die Deutsche Zentralbibliothek für Medizin (ZB MED) und die Deutsche Zentralbibliothek für Wirtschaftswissenschaften – Leibniz-Informationszentrum Wirtschaft (ZBW), auf ihrer Mitgliederversammlung im Dezember 2012 beschlossen.

Ein Ziel von DataCite ist es, Forschungsdaten im Internet dauerhaft verfügbar und zitierbar zu machen. Möglich wird dies durch das Digital-Object-Identifier-System (DOI). Bei DOIs handelt es sich um eindeutige und dauerhafte digitale Identifikatoren für digitale Objekte. Sie sind mit den ISBN für Print-Publikationen vergleichbar. In Deutschland vergeben die vier deutschen DataCite-Mitglieder – GESIS, TIB, ZB und ZBW – DOIs.

„Die DOI-Vergabe ist ab sofort für akademische Einrichtungen in Deutschland kostenlos“, berichtet Jan Brase, Geschäftsführer von DataCite. „Wir möchten dadurch die Forschung und vor allem die einfache Bereitstellung und Zitierbarkeit von Forschungsdaten in Deutschland weiter fördern. Wir hoffen, dass immer mehr Forschungseinrichtungen ihre Daten im Internet veröffentlichen und dauerhaft zitierbar machen.“

URN als permanente Identifier sind international unbekannt und werden übersehen. DOIs werden m.E. deutlich eher genutzt. Dazu kommt, dass viele Altmetrics-Dienste die Nutzung von DOIs voraussetzen. Ich bin sehr angetan und hoffe, dass dies bald in OPUS integriert wird!

[via @nowakman]

Release: OPUS 4.2.0

OPUS 4.2.0 ist fertig:

Ausgewählte Features, die in diesem Release neu entwickelt wurden:

* XML-basierte Import-Schnittstelle für Metadaten (inclusive Dokumentation des IMPORT-XML)
* dedizierte Unterstützung von Schriftenreihen mit der Möglichkeit zum Einbinden von Logos und HTML-Markup
* Anzeige und Sortierung nach Bandnummern innerhalb der Schriftenreihen
* Verlinkung zur Schriftenreihe aus der Frontdoor
* OAI-Schnittstelle unterstützt nun auch Sets (Anforderung für die
DINI-Zertifizierung)
* globale Enrichment-Verwaltung in der Administration
* RSS-Feeds auf beliebige Suchanfragen
* Anzeige des Gesamtbestands auf der Startseite
* Erweiterung der Bearbeitungsstati von Dokumenten, neu:
“In Bearbeitung” und “Zugriff beschränken”
* Anpassung von Eingabefeldern im Adminbereich (z.B. Vergrößerung der Anzeige der Abstractfelder)
* Anpassung des Datenmodells (u.a. PageNumber, PageFirst und PageLast können jetzt nicht-numerischen Inhalt enthalten)
* Enrichtmentfelder mit HTML-Markup können auf der Frontdoor ausgegeben werden
* Validierung der XML-basierten Dokumenttypdefinitionen im Publikationsformular

Weiteres auf der OPUS4-Seite des KOBV.

OPUS 4 ist da!

Endlich ist es geschafft, die Repository-Software OPUS ist in der neuen Version als OPUS 4 erschienen. OPUS wird nun auch endlich auch installationsbereit zum Download angeboten. Wie man OPUS (auf Ubuntu 10.04) installiert, kann man sich in einem Screencast ansehen. Der liegt zum Download bereit und umfasst sagenhafte 128 Megabyte. In der Erwartung eines abendfüllenden Spielfilms in High Definition und 3D habe ich dieses AVI-Riesenpaket heruntergeladen und auch die erforderlichen DivX-Pakete installiert. Nun sind 15 Minuten herum, und ich habe den Film immer noch nicht starten können. Vielleicht wäre der Upload auf ein Videoportal eine Option?

Nun läuft der Film, und er ist nicht in 3D und hat auch keinen Ton. Abendfüllend ist er nur an knapp 9 Minuten langen Abenden. Wie so oft ist das Buch (OPUS-Dokumentation, PDF), nach dessen Vorlage der Film gedreht wurde, viel spannender und – in diesem Fall – wahrscheinlich auch nützlicher.

Getestet habe ich die Installation noch nicht, sieht aber erstmal recht unkompliziert aus. Wer OPUS 4 schon mal sehen möchte: das KOBV betreibt eine Test-Installation. Der Upload-Vorgang wurde in Details verändert. Der Upload des Dokumentes erfolgt nun schon im ersten Schritt, wie auch hier gefordert wurde. Insgesamt gibt es immer noch viel zu viele Felder, aber da es sich um eine Demo-Installation handelt, müssen diese sicherlich nicht alle in Produktivsysteme übernommen werden.

Wer hat OPUS 4 schon ausprobiert oder sogar im Einsatz?

Update:

Upload-Formulare in Repositorien III

Übersicht:

Nachdem ich den Ist-Zustand skizziert und mögliche Vorbilder vorgestellt habe, möchte ich nun einen Lösungsvorschlag für ein Open-Access-Upload-Formular machen. Es besteht aus drei Teilen.

1. Datei(en) hochladen

Wie bei Youtube & Co sollte der Upload der Datei zuerst erfolgen. Ich erhoffe mir davon eine erhöhte Motivation der AutorInnen, den Veröffentlichungsvorgang zu komplettieren. Ob dies tatsächlich der Fall ist, sollte auf jeden Fall einmal untersucht werden. Generell sollte in Zukunft ein Hauptaugenmerk bei der Weiterentwicklung von Repository-Software auf der Usability liegen. Welches Metadatenmodell unterstützt wird, interessiert AutorInnen nicht.

Hier geht’s zum Dummy [1] Vielen Dank für Begutachtung, Tipps und Diskussion an Andrea, Christian, Danny, Edlef, Frank, Horst, Lambert, Nina, Uli, Wiebke & alle anderen, die ich schändlicherweise vergessen habe . Achtung, diese Webseiten könnten verändert werden oder verschwinden. Die Screenshots dokumentieren den Zustand während des Verfassens dieses Postings. Das Formular funktioniert nicht. Um zum nächsten Schritt zu gelangen, bitte ganz unten auf “nächster Schritt” klicken.

2. Dokument beschreiben

Es sollten wirklich nur Daten erhoben werden, die nicht selbst durch Autopsie erhoben werden können. Ich bin dabei (exklusive Datei-Auswahl, inkl. Lizenzauswahl) auf drei Phasen mit insgesamt 12 auszufüllenden Feldern gekommen. Würde man den Upload zum Beispiel mit einem Nutzerkonto verknüpfen, entfiele zum Beispiel noch die Angabe einer Email-Adresse.

Hier geht’s zum Dummy.

3. Lizenz wählen

Dies müsste graphisch noch eleganter gelöst werden. Im letzten Schritt sollten die bibliographischen Details überprüft und geändert werden können. Wichtiger jedoch ist die rechtliche Seite der Veröffentlichung. Hier werden Nutzungsrechte vereinbart und eine Creative-Commons-Lizenz gewählt. Das Menü für letzteres ist eins zu eins von Creative-Commons.org übernommen. Schöner, also nutzerfreundlicher, kann man es kaum machen. Durch die Auswahl zweier Checkboxen kann man auch ohne umfangreiche Vorkenntnisse zwischen sechs verschiedenen Lizenzmodellen wählen.

Hier geht’s zum Dummy.

Dummy

Ich habe einen Dummy erstellt, in dem man sich den hier vorgestellten Upload-Vorgang ansehen kann. Die Links funktionieren größtenteils nicht, das CSS ist von Creative-Commons.org übernommen, optisch ist da sicherlich mehr drin.

Kritik

Es gab im Vorfeld schon eine Menge guter Kritik am Dummy. In ungeordneter Reihenfolge:

  • Lizenzmodell NC-ND ist kontraproduktiv. Warnhinweis über die Konsequenzen müsste hinzugefügt werden
  • Upload zuerst könnte AutorInnen zu der Annahme verleiten, dass ihr Part damit schon erledigt ist.
  • Hinweis auf Genehmigung studentischer Arbeiten durch Erstprüfer fehlt noch, wenn das erwünscht sein sollte.
  • Ausführlichere Maske verlinken für AutorInnen, die selbst erfassen wollen
  • Neben Datei-Upload von der Festplatte möglichst noch Verweis auf PDF im Netz (automatischer Download von dieser Stelle).
  • Feld “Quelle” ist nicht eindeutig. Die Erklärung sollte umformuliert werden.
  • Radikaler Ansatz: Bibliothek bekommt nur die Datei und die Nutzungsvereinbarung, bibliographische Angaben müssen nur ergänzt werden, wenn sie aus dem Dokument per Autopsie nicht ersichtlich sind.
  • Feld “Bemerkung” beim Datei-Upload ist überflüssig.

Und jetzt?

Insgesamt fehlt es noch an einigem. Ich hoffe allerdings, dass die zugrunde liegenden Ideen deutlich werden und erkläre hiermit die Diskussion für eröffnet. Was fehlt? Noch besser: Was kann noch gestrichen werden? Ist die Reihenfolge so in Ordnung? Ich bitte um begründete Verrisse und Gegenvorschläge!

References

References
1 Vielen Dank für Begutachtung, Tipps und Diskussion an Andrea, Christian, Danny, Edlef, Frank, Horst, Lambert, Nina, Uli, Wiebke & alle anderen, die ich schändlicherweise vergessen habe

Upload-Formulare in Repositorien I

Übersicht:

Die Green Road funktioniert langfristig nur, wenn sich Open-Access-Repositorien den Bedürfnissen ihrer Nutzer anpassen. Nutzer sind dabei nicht die Mitarbeiter der Bibliotheken, die den jeweiligen Server administrieren. Nutzer sind die Autoren, deren Publikationen archiviert und publiziert werden sollen.

Wer selbst einen Publikationsserver und somit auch Autoren betreut, wird diese Fragen und Hilferufe kennen:

  1. “Welche Lizenz wähle ich?”
  2. “Um Himmels Willen, muss ich das alles ausfüllen?”
  3. “Was ist SWD, warum sieht die aus wie eine Webseite von 2001 und vor allem: Was soll ich damit?”
  4. “Muss das wirklich so kompliziert sein?”

Diese und ähnliche Fragen kulminieren oft in: “Können Sie das vielleicht für mich übernehmen?”

Tobias Rütten: Labyrinth, CC-BY-SA

Die Antwort ist logisch: “Natürlich kann ich das für Sie übernehmen! Würden Sie der Bibliothek ein von Ihnen geschriebenes Buch schenken, müssten Sie es schließlich auch nicht selbst katalogisieren.”

Die Realität sieht oft anders aus. Wer sein Dokument auf dem Server und in die Bibliothekskataloge bekommen möchte, muss neuerdings selbst formal und inhaltlich erschließen.

Die in Deutschland am weitesten verbreitete Repository-Software ist meines Wissens OPUS. Das klassische Veröffentlichungsformular von OPUS enthält folgende Punkte:

Veröffentlichungsvorgang starten

Dokumentart

Über 20 verschiedene Dokumententypen stehen zur Auswahl, z.B. 22 in Hannover, 24 in Freiburg.

Lizenz

Die Auswahl der Lizenzen erfolgt per Drop-Down. Das führt dazu, dass man Creative-Commons-Lizenzen kaum ohne Vorkenntnisse auswählen kann. Wer weiß schon, was Angaben wie Creative Commons – Namensnennung, Nicht kommerziell, Weitergabe unter gleichen Bedingungen bedeuten?

BibTeX-Upload

Ein Feature, dass Experten sicher weiterhelfen kann, aber die meisten Autoren ebenso sicher verwirrt.

Beschreibungsdaten eingeben

Ich werde nun nicht jedes Feld kommentieren. Ein Blick auf die Menge der möglichen Angaben spricht für sich:

  1. Originaltitel der Arbeit
  2. Titel der Arbeit auf Englisch
  3. Verfassername (Nachname, Vorname)
  4. Sonstige beteiligte Personen (Nachname, Vorname)
  5. Urheber
  6. Sonstige beteiligte Körperschaft bzw. Institution (Sponsor, Organisator etc.)
  7. Quelle
  8. Kontrollierte Schlagwörter (Deutsch)
  9. Freie Schlagwörter (Deutsch)
  10. Freie Schlagwörter (Englisch)
  11. DDC-Sachgruppe
  12. Schriftenreihe / Sendereihe
  13. Bandnummer
  14. Kurze Inhaltszusammenfassung in der Originalsprache (max. 5000 Zeichen)
  15. Kurze Inhaltszusammenfassung in einer weiteren Sprache (max. 5000 Zeichen)
  16. Hochschule
  17. Institut
  18. Jahr der Fertigstellung
  19. Sprache
  20. ISBN
  21. Anzahl der zu übertragenden Dateien
  22. E-Mail Adresse
  23. Gültigkeitsdauer
  24. Zugriffsbeschränkung

Kontrollierte Schlagwörter, DDC, sonstige beteiligte Körperschaften? Wenn das wirklich jeder problemlos ausfüllen könnte, ohne sich eingehend damit beschäftigt zu haben, bräuchten wir keine professionelle inhaltliche Erschließung mehr. Auch eine interessante Debatte, aber weiter im Text…

Seite 3: Vorschau

Hier kann man die bibliographischen Daten kontrollieren und ggf. zurück zum Erfassungsformular springen.

Seite 4: Dateien hochladen

Nun kann man die Datei tatsächlich hochladen. Zumindest der Teil der publikationswilligen AutorInnen, die es bis hierhin geschafft haben. Nach – wenn ich mich nicht verzählt habe – 27 Feldern ist man also dort angekommen, wo man eigentlich hinwollte.

Wie kann man es besser machen?

Nicht nur bei OPUS ist die Lage derart unübersichtlich. Um nur ein anderes Beispiel zu nennen: E-Prints’ Upload-Vorgang umfasst ebenfalls vier Seiten mit etwa 20 Feldern, davon zahlreiche Pflichtfelder. Wie man es besser machen kann, zeigen verschiedene Publikationsdienste aus dem nicht-akademischen Bereich, die ich morgen vorstellen möchte.