Deutschlandfunk über Transparenz in der Drittmittelförderung

Im Beitrag Mehr Transparenz gefordert wird das Hochschulwatch.de vorgestellt:

Wie unabhängig ist die Wissenschaft an deutschen Hochschulen? Gesponsorte Hörsäle und Stiftungsprofessuren sind an vielen Universitäten und Fachhochschulen Alltag und kaum noch wegzudenken. Seit zwei Jahren sammelt das Portal Hochschulwatch fragwürdige Finanzierungen – jetzt ziehen die Macher Bilanz.

Das Thema ist brandaktuell und (beispielsweise) auch im Koalitionsvertrag der rot-grünen Landesregierung 1) Im Koalitionsvertrag auf S. 42: “Transparenz darüber herstellen, wer an öffentlich finanzierten Hochschulen in wessen Auftrag mit welcher Fragestellung forscht.” in Niedersachsen zu finden – mit Auswirkungen auf die Hochschulen und Bibliotheken. Die Forderung, die Finanzierung von Forschungsaktivitäten transparent zu gestalten ist eine Gelegenheit, Forschungsinformationssysteme und Hochschulbibliographie miteinander zu verheiraten.

[via @textundblog]

References   [ + ]

1. Im Koalitionsvertrag auf S. 42: “Transparenz darüber herstellen, wer an öffentlich finanzierten Hochschulen in wessen Auftrag mit welcher Fragestellung forscht.”

Von Citavi über Refine zu VIVO

Kurze Niederschrift eines möglichen Geschäftsgangs, der vermutlich nicht für jedermann verständlich ist. Wer das nachnutzen möchte, möge sich an mich wenden!

  1. Erfassung der Daten in Citavi oder einem anderen Programm, dass tabellarische Ausgabe erlaubt.
  2. Export als CSV-Datei
  3. Import in Google Refine (Open Refine ist noch in einer Alpha-Version, meines Erachtens ist es auch wirklich noch nicht sehr stabil.) Die RDF-Extension sollte installiert sein.
  4. Zusätzlich zu importierende Ontologien in Refine: VIVO und BIBO.
  5. Reconciliation gegen einen aktuellen RDF-Export aus der VIVO-Installation. Dadurch kann man auf recht flotte Art und Weise ein Autorenmatching durchführen. Wenn sowohl in VIVO als auch in den Publikationsdaten Autorenidentifier vorhanden sind, kann man die zum Abgleich verwenden. Achtung, je nach Datenmenge rechnet Refine daran sehr, sehr lange herum. Ein Testlauf von knapp 3000 Publikationen beim Abgleich mit etwa 1200 Personen wurde nach drei oder vier Stunden abgebrochen. Der Fortschrittsbalken stand da bei 45%.
  6. Add column based on this column. GREL Expression: cell.recon.match.id.
  7. Die von Citavi mitgelieferten Dokumententypen durch die VIVO-bekannten ersetzen. GREL Expression:

    value.replace(“Beitrag in …”, “bibo:chapter”).replace(“Beitrag im Gesetzeskommentar”, “fabio:Comment”).replace(“Buch (Monographie)”, “bibo:Book”).replace(“Buch (Sammelwerk”, “bibo:EditedBook”).replace(“Graue Literatur / Bericht / Report”, “vivo:WorkingPaper”).replace(“Hochschulschrift”, “bibo:Thesis”).replace(“Hörspiel”, “bibo:AudioDocument”).replace(“Internetdokument”, “bibo:Webpage”).replace(“Manuskript”, “bibo:Document”).replace(“Musikwerk / Musikalbum”, “bibo:AudioDocument”).replace(“Patentschrift”, “bibo:Patent”).replace(“Schriften eines Autors”, “bibo:Document”).replace(“Software”, “obo:ERO_0000071”).replace(“Sonderheft / Beiheft”, “bibo:Document”).replace(“Spielfilm”, “bibo:Film”).replace(“Tagungsband”, “bibo:Proceedings”).replace(“Unklarer Dokumententyp”, “bibo:Document”).replace(“Vortrag”, “vivo:Speech”).replace(“Zeitschriftenaufsatz”, “bibo:AcademicArticle”).replace(“Zeitungsartikel”, “bibo:Article”)

    1) Es hat sich inzwischen als sinnovoller erwiesen, direkt die URIs zu verwenden, also z.B. http://vivoweb.org/ontology/core#Speech

  8. RDF-Skelett je nach Daten erstellen. An einem optimalen und für möglichst viele denkbare Fälle verwendbaren Skelett wird noch gearbeitet. Besonders bei Beiträgen in Sammelwerken ist das nicht so einfach…
  9. Export als RDF.
  10. Import in VIVO.
  11. “Name Blank Nodes” in VIVO
  12. Die Daten sind drin.

Dieser Geschäftsgang ist weder optimal, noch final. Aber er funktioniert!

Problematisch sind u.a. Beiträge in Sammelwerken oder Zeitschriften-Reconciliation. Bei letzterem setze ich auf Lobid.

References   [ + ]

1. Es hat sich inzwischen als sinnovoller erwiesen, direkt die URIs zu verwenden, also z.B. http://vivoweb.org/ontology/core#Speech

Valeria Pesce: A Global Ontology-Driven RDF Store Based on a Distributed Architecture

Die Aufzeichnung des auf der SWIB 13 gehaltenen Vortrags ist (noch?) ab ca. der 13. Minute auf make.tv zu finden. Der Anfang fehlt leider, es beginnt auf Folie 9.

VIVO ist eine Software

VIVO ist – praktisch betrachtet – erst einmal eine Open-Source-Software, die es zu installieren gilt. Alle Features aufzuzählen, würde hier den Rahmen sprengen. Daher verweise ich für genauere Informationen noch einmal auf das Wiki. Ich möchte nur einen kleinen Eindruck geben und zum Selbstentdecken anregen.

Auf der Sourceforge-Projektseite heißt es:

VIVO is a semantic web project built on the Jena semantic web framework, and is an application to facilitate the discovery of researchers and collaborators across the country and internationally.

Der Benutzer-Oberfläche und das Backend sehen folgendermaßen aus:

Beispielseiten für Personenprofile:

VIVO bietet Visualisierungen der Forschungsaktivitäten. Im Profil von David Alan Easley kann man zum Beispiel drei Visualisierungstools entdecken. Das Co-Author-Network, die Map of Science und das Co-Investigator-Network. Anklicken und entdecken! Wer nur einen Schnappschuss haben möchte:

Die Anweisung “Interact” gilt natürlich nur für die entsprechende Applikation.

Morgen geht’s weiter mit dem VIVO-Netzwerk.

Was ist VIVO?

Immer häufiger wird VIVO in Bibliothekskreisen erwähnt. Zum Beispiel hier im Blog vor einigen Monaten, als ich nach der korrekten Übersetzung des deutschen Fakultätsbegriffes ins Englische suchte. 1) Ich verwende provisorisch “College” für Fakultäten und “Academic Department” für die Abteilungen und Fachbereiche in den Fakultäten. Einsprüche, Widerworte und Verbesserungsvorschläge bitte sehr gerne in die Kommentare oder per Mail an mich! Eine Bestätigung würde ich natürlich auch gerne hören. Oder in Lambert Hellers “Prognose zur Ausbildung von Social Networking-Diensten für Wissenschaftler als öffentliche (oder öffentlich cofinanzierte) Infrastruktur”.

Was ist VIVO? Diese Frage ist nicht so einfach zu beantworten. Denn VIVO umfasst verschiedene Komponenten. Auf der Projektwebseite heißt es:

VIVO enables the discovery of researchers across institutions. Participants in the network include institutions with local installations of VIVO or those with research discovery and profiling applications that can provide semantic web-compliant data. The information accessible through VIVO’s search and browse capability will reside and be controlled locally, within institutional VIVOs or other semantic web-compliant applications.

VIVO bezeichnet also:
a) Lokale Installationen (an Hochschulen und anderen Forschungseinrichtungen), und
b) ein Netzwerk, das aus diesen lokalen Installationen gebildet wird

Dazu kommt noch, als ganz wesentlicher Bestandteil,

c) die VIVO-Ontologie.

Und noch einiges mehr. Im VIVO-Wiki sind die Komponenten ausführlicher aufgelistet:

  • VITRO is the semantic web tool kit and ontology editor that provides a foundation for VIVO
  • VIVO Core are the central applications that make a particular instance of VIVO work
  • VIVO Harvester is a semantic web extract-translate-load (ETL) tool for getting data from source systems and providing it to VIVO.
  • VIVO Visualizations provide visual display of VIVO data
  • VIVO Connectors provide access to VIVO data to external software
  • VIVO Projects are additional efforts to provide additional functionality for VIVO. Some software will become part of the VIVO core, while other projects will result in stand-alone applications that use VIVO as a supporting data infrastructure.
  • Virtual Appliances provide easy-to-install instances of VIVO for development and testing purposes

Da VIVO in Zukunft häufiger thematisiert werden könnte, möchte ich in dieser Woche ausgewählte Komponenten kurz und ebenso lücken- wie bruchstückhaft vorstellen. Einen Überblick über das gesamte System gibt es aber schon hier:

Morgen gibt es einen kurzen Einblick in die Oberflächen der lokalen Installation.

References   [ + ]

1. Ich verwende provisorisch “College” für Fakultäten und “Academic Department” für die Abteilungen und Fachbereiche in den Fakultäten. Einsprüche, Widerworte und Verbesserungsvorschläge bitte sehr gerne in die Kommentare oder per Mail an mich! Eine Bestätigung würde ich natürlich auch gerne hören.

LODUM Productivity Map

Im LODUM-Projekt (Linked Open Data University of Münster) werden (Linked Open) Daten rund um die Uni Münster gesammelt und damit herumexperimentiert. In eigenen Worten:

One of the main goals of LODUM is to open up the university’s data silos, integrate the data, and make it easy to build applications on top of the data collection. This productivity map for Google Earth is an example of such an application. It renders the university buildings in 3D – the building height indicates the number of publications written by researchers working in the respective building.

Und so sieht das dann aus:

Wie übersetzt man "Fakultät"?

Ein Grundsatz im Linked-Data-Bereich ist: Nutze vorhandene Ontologien. Allerdings nur, wenn sie auch tatsächlich passen. Und genau diese Frage stelle ich mir gerade: Kann man die VIVO-Ontologie (Link geht zur OWL-Datei) auch für deutsche Hochschulen verwenden?

Ein gravierendes Problem sind die Bezeichnungen für Organisationseinheiten. VIVO stammt aus dem US-amerikanischen Hochschulbereich und versucht dementsprechend, dortige Verhältnisse abzubilden. Versucht man nun, Fakultäten in VIVO darzustellen, stellt man fest: es gibt sie nicht. Es gibt:

  • Association
  • Center
  • ClinicalOrganization
  • College
  • Company (PrivateCompany)
  • Consortium
  • Department (AcademicDepartment)
  • Division
  • ExtensionUnit
  • Foundation
  • FundingOrganization
  • GovernmentAgency
  • Hospital
  • Institute
  • Laboratory (CoreLaboratory, ResearchLaboratory)
  • Library
  • Museum
  • Program
  • Publisher
  • ResearchOrganization
  • School
  • StudentOrganization
  • University

Dazu kommt, dass die Terms nicht einheitlich und korrekt angewendet werden. Beispiel: Faculty of Medicine, University of Tirana (Albania) ist laut VIVO eine Universität, zumindest wird sie in Zeile 3 so bezeichnet:

1
2
3
4
5
6
<rdf:RDF>
 <rdf:Description rdf:about="http://vivo.med.cornell.edu/individual/org-200002226">
 <rdf:type rdf:resource="http://vivoweb.org/ontology/core#University"/>
 <rdfs:label>Faculty of Medicine, University of Tirana (Albania)</rdfs:label>
</rdf:Description>
</rdf:RDF>

Doch zurück zum Kernproblem: Kann man eine dt. Fakultät im englischen mit Department übersetzen? Auf die Frage bekam ich drei verschiedene Antworten. Ja, Jein, Nein. Und Dr01de stellte auf Twitter fest, dass Wikipedia in diesem Fall nicht sonderlich hilfreich ist.
Fangen wir beim academic department und gehen zur russischen Version des Artikels. Dann zur deutschen Wikipedia. Dort heißt das Academic Department auf einmal Lehrstuhl. Von hier aus wieder zurück in die englische Wikipedia. Dort sind wir nun bei den named professorships angelangt. Ist ein academic department also dasselbe wie ein named professorship? ;o)

Was will uns der Autor mir diesem Posting mitteilen? Ganz einfach: Ich suche den Königsweg, wie man eine Hochschule in RDF mit einer vorhandenen und in Hochschulkreisen möglichst weit verbreiteten Ontologie darstellen kann und hoffe auf diesem Wege sachdienliche Hinweise zu erhalten. Für die Verbreitung meines Hilferufs wäre ich sehr dankbar!

Linked Library of Congress

Adrian Pohl hat in seiner Stimme für Plan3t.info wieder vier Links parat, diesmal unter anderem auf die Ankündigung der Library of Congress, ein Bibliographic Framework for the Digital Age zu entwickeln. Dazu schreibt er:

Für viel Aufsehen hat die Ankündigung der Library of Congress gesorgt, ein ‘bibliographic framework’ für das digitale Zeitalter zu entwickeln, das auf RDF Linked-Data-Standards setzt. Nun wird es also für all jene Zeit, die Linked Data bisher als vorübergehenden Hype verstanden haben, sich mit den Ideen dahinter auseinanderzusetzen. Die Ankündigung wirft zunächst eine Menge Fragen auf, wie z.B.: Welche Vokabulare/Ontologien werden für die RDF-Repräsentation bibliographischer Information empfohlen? Wie wird RDA hierfür weiterentwickelt? Auf der Mailingliste Bibframe werden diese und andere Fragen eifrig diskutiert.

Da in der Bibliothek der FH Hannover gerade Überlegungen laufen, eine Hochschulbibliographie auf LOD-Basis aufzubauen, wird sich das Thema hier in Zukunft sicherlich regelmäßig finden. Die oben erwähnte “RDF-Repräsentation bibliographischer Information” ist dabei natürlich besonders interessant. Wer sich mal ansehen möchte, wie das aussehen könnte, dem sei BIBO empfohlen, die Bibliographic Ontology. Die Beschreibung eines Artikels sieht dort beispielsweise so aus.

Die im Beispiel verwendete RDF-Schreibweise nennt sich Turtle (Terse RDF Triple Language). Wer sich für RDF interessiert, dem möchte ich dringend nahelegen: Macht einen weiten Bogen um die XML-Schreibweisen und seht Euch direkt alles in Turtle an. Das ist menschenlesbar und schon mit sehr wenig Übung tatsächlich auch schreibbar. Ein ganz nettes Tutorial zu Turtle gibt es im Haystack Blog. Links zu anderen, vielleicht besseren Tutorials im LOD-Kontext nehme ich gerne entgegen!

Welche relevanten Autoren-IDs gibt es?

Annahme: Wenn man eine Hochschulbibliographie oder auch eine andere Bibliographie aufbaut, ist es sinnvoll, Autoren eindeutige Identifikatoren zuzuweisen, diese verfügbar zu machen und mit anderen Daten zu verknüpfen.

Fragen:

  1. Welche IDs sammelt man? Die Auswahl ist groß. Welche Identifikatoren sollten unbedingt genutzt werden? Falls ja, warum genau diese IDs?
  2. Gibt es bestimmte IDs, die für spezielle Fachcommunities unverzichtbar sind? Zum Beispiel für Ingenieure, Sozialwissenschaftler, oder Informatiker?
  3. Gibt es vielleicht eine ID to rule them all?
  4. Welche Kriterien sind wichtig für die ID-Wahl (Offenheit, freie Lizenzierung, …)?

Hier ist eine kleine Auswahl. Bitte rege kommentieren das Posting gerne weiterleiten und -verteilen!

Dieselbe Frage ist auch für Organisationen und Werke noch zu klären.