Von Citavi über Refine zu VIVO

Kurze Niederschrift eines möglichen Geschäftsgangs, der vermutlich nicht für jedermann verständlich ist. Wer das nachnutzen möchte, möge sich an mich wenden!

  1. Erfassung der Daten in Citavi oder einem anderen Programm, dass tabellarische Ausgabe erlaubt.
  2. Export als CSV-Datei
  3. Import in Google Refine (Open Refine ist noch in einer Alpha-Version, meines Erachtens ist es auch wirklich noch nicht sehr stabil.) Die RDF-Extension sollte installiert sein.
  4. Zusätzlich zu importierende Ontologien in Refine: VIVO und BIBO.
  5. Reconciliation gegen einen aktuellen RDF-Export aus der VIVO-Installation. Dadurch kann man auf recht flotte Art und Weise ein Autorenmatching durchführen. Wenn sowohl in VIVO als auch in den Publikationsdaten Autorenidentifier vorhanden sind, kann man die zum Abgleich verwenden. Achtung, je nach Datenmenge rechnet Refine daran sehr, sehr lange herum. Ein Testlauf von knapp 3000 Publikationen beim Abgleich mit etwa 1200 Personen wurde nach drei oder vier Stunden abgebrochen. Der Fortschrittsbalken stand da bei 45%.
  6. Add column based on this column. GREL Expression: cell.recon.match.id.
  7. Die von Citavi mitgelieferten Dokumententypen durch die VIVO-bekannten ersetzen. GREL Expression:

    value.replace(“Beitrag in …”, “bibo:chapter”).replace(“Beitrag im Gesetzeskommentar”, “fabio:Comment”).replace(“Buch (Monographie)”, “bibo:Book”).replace(“Buch (Sammelwerk”, “bibo:EditedBook”).replace(“Graue Literatur / Bericht / Report”, “vivo:WorkingPaper”).replace(“Hochschulschrift”, “bibo:Thesis”).replace(“Hörspiel”, “bibo:AudioDocument”).replace(“Internetdokument”, “bibo:Webpage”).replace(“Manuskript”, “bibo:Document”).replace(“Musikwerk / Musikalbum”, “bibo:AudioDocument”).replace(“Patentschrift”, “bibo:Patent”).replace(“Schriften eines Autors”, “bibo:Document”).replace(“Software”, “obo:ERO_0000071”).replace(“Sonderheft / Beiheft”, “bibo:Document”).replace(“Spielfilm”, “bibo:Film”).replace(“Tagungsband”, “bibo:Proceedings”).replace(“Unklarer Dokumententyp”, “bibo:Document”).replace(“Vortrag”, “vivo:Speech”).replace(“Zeitschriftenaufsatz”, “bibo:AcademicArticle”).replace(“Zeitungsartikel”, “bibo:Article”)

    1) Es hat sich inzwischen als sinnovoller erwiesen, direkt die URIs zu verwenden, also z.B. http://vivoweb.org/ontology/core#Speech

  8. RDF-Skelett je nach Daten erstellen. An einem optimalen und für möglichst viele denkbare Fälle verwendbaren Skelett wird noch gearbeitet. Besonders bei Beiträgen in Sammelwerken ist das nicht so einfach…
  9. Export als RDF.
  10. Import in VIVO.
  11. “Name Blank Nodes” in VIVO
  12. Die Daten sind drin.

Dieser Geschäftsgang ist weder optimal, noch final. Aber er funktioniert!

Problematisch sind u.a. Beiträge in Sammelwerken oder Zeitschriften-Reconciliation. Bei letzterem setze ich auf Lobid.

References   [ + ]

1. Es hat sich inzwischen als sinnovoller erwiesen, direkt die URIs zu verwenden, also z.B. http://vivoweb.org/ontology/core#Speech