Von Citavi über Refine zu VIVO

Kurze Niederschrift eines möglichen Geschäftsgangs, der vermutlich nicht für jedermann verständlich ist. Wer das nachnutzen möchte, möge sich an mich wenden!

  1. Erfassung der Daten in Citavi oder einem anderen Programm, dass tabellarische Ausgabe erlaubt.
  2. Export als CSV-Datei
  3. Import in Google Refine (Open Refine ist noch in einer Alpha-Version, meines Erachtens ist es auch wirklich noch nicht sehr stabil.) Die RDF-Extension sollte installiert sein.
  4. Zusätzlich zu importierende Ontologien in Refine: VIVO und BIBO.
  5. Reconciliation gegen einen aktuellen RDF-Export aus der VIVO-Installation. Dadurch kann man auf recht flotte Art und Weise ein Autorenmatching durchführen. Wenn sowohl in VIVO als auch in den Publikationsdaten Autorenidentifier vorhanden sind, kann man die zum Abgleich verwenden. Achtung, je nach Datenmenge rechnet Refine daran sehr, sehr lange herum. Ein Testlauf von knapp 3000 Publikationen beim Abgleich mit etwa 1200 Personen wurde nach drei oder vier Stunden abgebrochen. Der Fortschrittsbalken stand da bei 45%.
  6. Add column based on this column. GREL Expression: cell.recon.match.id.
  7. Die von Citavi mitgelieferten Dokumententypen durch die VIVO-bekannten ersetzen. GREL Expression:

    value.replace(“Beitrag in …”, “bibo:chapter”).replace(“Beitrag im Gesetzeskommentar”, “fabio:Comment”).replace(“Buch (Monographie)”, “bibo:Book”).replace(“Buch (Sammelwerk”, “bibo:EditedBook”).replace(“Graue Literatur / Bericht / Report”, “vivo:WorkingPaper”).replace(“Hochschulschrift”, “bibo:Thesis”).replace(“Hörspiel”, “bibo:AudioDocument”).replace(“Internetdokument”, “bibo:Webpage”).replace(“Manuskript”, “bibo:Document”).replace(“Musikwerk / Musikalbum”, “bibo:AudioDocument”).replace(“Patentschrift”, “bibo:Patent”).replace(“Schriften eines Autors”, “bibo:Document”).replace(“Software”, “obo:ERO_0000071”).replace(“Sonderheft / Beiheft”, “bibo:Document”).replace(“Spielfilm”, “bibo:Film”).replace(“Tagungsband”, “bibo:Proceedings”).replace(“Unklarer Dokumententyp”, “bibo:Document”).replace(“Vortrag”, “vivo:Speech”).replace(“Zeitschriftenaufsatz”, “bibo:AcademicArticle”).replace(“Zeitungsartikel”, “bibo:Article”)

    1) Es hat sich inzwischen als sinnovoller erwiesen, direkt die URIs zu verwenden, also z.B. http://vivoweb.org/ontology/core#Speech

  8. RDF-Skelett je nach Daten erstellen. An einem optimalen und für möglichst viele denkbare Fälle verwendbaren Skelett wird noch gearbeitet. Besonders bei Beiträgen in Sammelwerken ist das nicht so einfach…
  9. Export als RDF.
  10. Import in VIVO.
  11. “Name Blank Nodes” in VIVO
  12. Die Daten sind drin.

Dieser Geschäftsgang ist weder optimal, noch final. Aber er funktioniert!

Problematisch sind u.a. Beiträge in Sammelwerken oder Zeitschriften-Reconciliation. Bei letzterem setze ich auf Lobid.

References   [ + ]

1. Es hat sich inzwischen als sinnovoller erwiesen, direkt die URIs zu verwenden, also z.B. http://vivoweb.org/ontology/core#Speech

VIVO ist ein Netzwerk

VIVO ist nicht nur eine Software, sondern (unter anderem) auch ein Netzwerk. Einerseits – technisch – ein Netzwerk aus verschiedenen Installationen der Software. Andererseits auch ein soziales Netzwerk aus den Personen, die in VIVO erfasst sind. Und aus all den anderen Daten in den – technisch – vernetzten VIVO-Installationen.

Enabling collaboration and discovery among scientists across all disciplines. Unter diesem Motto steht VIVO. Entwickelt wurde es ursprünglich an der Cornell University. [I]n 2009, The University of Florida received a $12.2M award from the NIH to expand the platform at Cornell and five other institutions to facilitate cross-institutional discovery. 1) Aus dem VIVO-Flyer (PDF)

Für das Netzwerk steht Vivosearch.org.

Über Vivosearch können Aktivitäten, Kurse, Organisationen, Personen und Publikationen der zur Zeit acht teilnehmenden Institutionen 2) Cornell University, Harvard University, Indiana University, Ponce School of Medicine, The Scripps Research Institute, University of Florida, Washington University in St. Louis School of Medicine und Weill Cornell Medical College gesucht werden. Auf der Seite sind die Tools aufgeführt, mit denen Vivosearch gebaut wurde.

Jon Corson-Rikert, John Fereira, Valeria Pesce und Johannes Keizer haben die Netzwerkeigenschaften von VIVO in einem Vortrag über AgriVIVO zusammengefasst:

Und morgen geht es dann weiter mit der Ontologie.

References   [ + ]

1. Aus dem VIVO-Flyer (PDF)
2. Cornell University, Harvard University, Indiana University, Ponce School of Medicine, The Scripps Research Institute, University of Florida, Washington University in St. Louis School of Medicine und Weill Cornell Medical College

VIVO ist eine Software

VIVO ist – praktisch betrachtet – erst einmal eine Open-Source-Software, die es zu installieren gilt. Alle Features aufzuzählen, würde hier den Rahmen sprengen. Daher verweise ich für genauere Informationen noch einmal auf das Wiki. Ich möchte nur einen kleinen Eindruck geben und zum Selbstentdecken anregen.

Auf der Sourceforge-Projektseite heißt es:

VIVO is a semantic web project built on the Jena semantic web framework, and is an application to facilitate the discovery of researchers and collaborators across the country and internationally.

Der Benutzer-Oberfläche und das Backend sehen folgendermaßen aus:

Beispielseiten für Personenprofile:

VIVO bietet Visualisierungen der Forschungsaktivitäten. Im Profil von David Alan Easley kann man zum Beispiel drei Visualisierungstools entdecken. Das Co-Author-Network, die Map of Science und das Co-Investigator-Network. Anklicken und entdecken! Wer nur einen Schnappschuss haben möchte:

Die Anweisung “Interact” gilt natürlich nur für die entsprechende Applikation.

Morgen geht’s weiter mit dem VIVO-Netzwerk.

Was ist VIVO?

Immer häufiger wird VIVO in Bibliothekskreisen erwähnt. Zum Beispiel hier im Blog vor einigen Monaten, als ich nach der korrekten Übersetzung des deutschen Fakultätsbegriffes ins Englische suchte. 1) Ich verwende provisorisch “College” für Fakultäten und “Academic Department” für die Abteilungen und Fachbereiche in den Fakultäten. Einsprüche, Widerworte und Verbesserungsvorschläge bitte sehr gerne in die Kommentare oder per Mail an mich! Eine Bestätigung würde ich natürlich auch gerne hören. Oder in Lambert Hellers “Prognose zur Ausbildung von Social Networking-Diensten für Wissenschaftler als öffentliche (oder öffentlich cofinanzierte) Infrastruktur”.

Was ist VIVO? Diese Frage ist nicht so einfach zu beantworten. Denn VIVO umfasst verschiedene Komponenten. Auf der Projektwebseite heißt es:

VIVO enables the discovery of researchers across institutions. Participants in the network include institutions with local installations of VIVO or those with research discovery and profiling applications that can provide semantic web-compliant data. The information accessible through VIVO’s search and browse capability will reside and be controlled locally, within institutional VIVOs or other semantic web-compliant applications.

VIVO bezeichnet also:
a) Lokale Installationen (an Hochschulen und anderen Forschungseinrichtungen), und
b) ein Netzwerk, das aus diesen lokalen Installationen gebildet wird

Dazu kommt noch, als ganz wesentlicher Bestandteil,

c) die VIVO-Ontologie.

Und noch einiges mehr. Im VIVO-Wiki sind die Komponenten ausführlicher aufgelistet:

  • VITRO is the semantic web tool kit and ontology editor that provides a foundation for VIVO
  • VIVO Core are the central applications that make a particular instance of VIVO work
  • VIVO Harvester is a semantic web extract-translate-load (ETL) tool for getting data from source systems and providing it to VIVO.
  • VIVO Visualizations provide visual display of VIVO data
  • VIVO Connectors provide access to VIVO data to external software
  • VIVO Projects are additional efforts to provide additional functionality for VIVO. Some software will become part of the VIVO core, while other projects will result in stand-alone applications that use VIVO as a supporting data infrastructure.
  • Virtual Appliances provide easy-to-install instances of VIVO for development and testing purposes

Da VIVO in Zukunft häufiger thematisiert werden könnte, möchte ich in dieser Woche ausgewählte Komponenten kurz und ebenso lücken- wie bruchstückhaft vorstellen. Einen Überblick über das gesamte System gibt es aber schon hier:

Morgen gibt es einen kurzen Einblick in die Oberflächen der lokalen Installation.

References   [ + ]

1. Ich verwende provisorisch “College” für Fakultäten und “Academic Department” für die Abteilungen und Fachbereiche in den Fakultäten. Einsprüche, Widerworte und Verbesserungsvorschläge bitte sehr gerne in die Kommentare oder per Mail an mich! Eine Bestätigung würde ich natürlich auch gerne hören.