Beispiel für DESCRIBE in SPARQL

Mit dem SPARQL-Befehl DESCRIBE kann man aus einem SPARQL-Endpoint Informationen über Ressourcen anfordern. Aus der W3C-Recommendation zu SPARQL:

The DESCRIBE form returns a single result RDF graph containing RDF data about resources. This data is not prescribed by a SPARQL query, where the query client would need to know the structure of the RDF in the data source, but, instead, is determined by the SPARQL query processor. The query pattern is used to create a result set. The DESCRIBE form takes each of the resources identified in a solution, together with any resources directly named by IRI, and assembles a single RDF graph by taking a “description” which can come from any information available including the target RDF Dataset. The description is determined by the query service. The syntax DESCRIBE * is an abbreviation that describes all of the variables in a query.

Aktueller Fall, einfaches Beispiel: Ich möchte wissen, welche Informationen zu der Ressource http://dewey.info/class/020/ bereitstehen.

1
2
3
4
5
6
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
 
DESCRIBE ?p ?o WHERE {
<http://dewey.info/class/020/> ?p ?o
}
LIMIT 10

Und so sieht dann das Ergebnis aus. Als Ausgabeformat habe ich hier Turtle gewählt.

LOD: data.nature.com

Nature Publishing Group releases linked data platform

Nature Publishing Group (NPG) today is pleased to join the linked data community by opening up access to its publication data via a linked data platform. NPG’s Linked Data Platform is available at http://data.nature.com.

The platform includes more than 20 million Resource Description Framework (RDF) statements, including primary metadata for more than 450,000 articles published by NPG since 1869. In this first release, the datasets include basic citation information (title, author, publication date, etc) as well as NPG specific ontologies. These datasets are being released under an open metadata license, Creative Commons Zero (CC0), which permits maximal use/re-use of this data.

NPG’s platform allows for easy querying, exploration and extraction of data and relationships about articles, contributors, publications, and subjects. Users can run web-standard SPARQL Protocol and RDF Query Language (SPARQL) queries to obtain and manipulate data stored as RDF. The platform uses standard vocabularies such as Dublin Core, FOAF, PRISM, BIBO and OWL, and the data is integrated with existing public datasets including CrossRef and PubMed.

“NPG is delighted to be able to surface data on published articles from Nature and many other journals, going back to 1869,” said Jason Wilde, Business Development Director, NPG. “Linked data is an important next step in the evolution of scientific publishing and, over the coming months, we hope to be able to expose more meta-data on our content to enrich the semantic web.”

Linked data refers to the publishing of structured data that is linked to other related data. It allows users to query, explore and link data from datasets across the web. NPG joins governments from around the world and other organizations including the British Library, the New York Times and the Open University, in providing a linked data platform.

The platform complements other services NPG provides for developers, but incorporates a wider audience. It has been built in collaboration with information and publishing solutions specialist The Stationery Office (TSO) to support scaling.

More information about NPG’s Linked Data Platform is available at http://developers.nature.com/docs. Sample queries can be found at http://data.nature.com/query.

Die Plattform ist zur Zeit nicht erreichbar.

Ontology for Innovation

Fundstück: Ontology for Innovation

One key use case for this ontology is to faciliate the matching of needs and innovations. This document does not provide specific guidelines or formal rules for achieving this. However the following concepts might be factors in deciding when an innovation qualifies as fulfilling a need. This can also incrementally be applied to qualify innovations as solutions to problems (and hence qualify as fulfilling a need).

"The Five Stars of Online Journal Articles — a Framework for Article Evaluation"

David Shotton: “The Five Stars of Online Journal Articles — a Framework for Article Evaluation”
D-Lib Magazine Volume 18, Number 1/2

I propose five factors — peer review, open access, enriched content, available datasets and machine-readable metadata — as the Five Stars of Online Journal Articles, a constellation of five independent criteria within a multi-dimensional publishing universe against which online journal articles can be evaluated, to see how well they match up with current visions for enhanced research communications. Achievement along each of these publishing axes can vary, analogous to the different stars within the constellation shining with varying luminosities. I suggest a five-point scale for each, by which a journal article can be evaluated, and provide diagrammatic representations for such evaluations. While the criteria adopted for these scales are somewhat arbitrary, and while the rating of a particular article on each axis may involve elements of subjective judgment, these Five Stars of Online Journal Articles provide a conceptual framework by which to judge the degree to which any article achieves or falls short of the ideal, which should be useful to authors, editors and publishers. I exemplify such evaluations using my own recent publications of relevance to semantic publishing.

Zum Artikel: http://dx.doi.org/10.1045/january2012-shotton

Shelflife

Anne Christensen macht auf Plan3t.info auf Shelflife (hatten wir hier schon einmal) aufmerksam. Dabei handelt es sich um einen pfiffigen Versuch, den Mehrwert des Stöberns am Regal in die digitale Welt zu übertragen.

Am meisten beeindruckt bin ich davon, dass die Farbe der Buchrücken die Relevanz der jeweiligen Titel abbildet, und zwar auf Grundlage von lokalen Ausleihdaten sowie der Verwendung der Titel in Kursen und Seminaren der Universität. “Community Relevance” heißt dieser Faktor, den das clevere Entwicklungsteam einführt und damit bestehende interessante Vorschläge zur Integration von Popularitätsdaten in Ranking-Algorithmen aufgreift.

Mehr dazu im Video:

Tutorial from Harvard Library Innovation Lab on Vimeo.

Und natürlich (auch weiterführende Links) in Annes Posting auf Plan3t.info.

Linked Library Data Tools

Die Linked Library Data Group des W3C hat heute ihren Werkzeugkoffer geöffnet und führt nun im W3C-Wiki eine öffentlich zugängliche Liste mit Werkzeugen im Bereich Linked Library Data: LLDtools.

Aufgeführt sind zum Beispiel verschiedene Werkzeuge für die Publikation von LLD (z.B. Pubby) oder Dienste zur Ansicht und zum Browsen (z.B. der Sindice Web Data Inspector).

DINI-AG KIM veröffentlicht Open-Data-Empfehlungen

Die DINI-AG KIM gibt die Veröffentlichung der “Empfehlungen zur Öffnung bibliothekarischer Daten” bekannt. Die Empfehlungen sollen bibliothekarischen Organisationen als Richtlinien und Referenz bei der Freigabe ihrer Daten dienen.

Gegenstand der Empfehlungen sind nicht nur beschreibende Metadaten, sondern sämtliche nicht-sensiblen Daten, die von bibliothekarischen Organisationen produziert werden, wie z.B. auch statistische Daten oder Zirkulationsdaten.

Die Empfehlungen benennen neun Prinzipien für offene bibliothekarische Daten. Um als ‘offen’ im Sinne der Empfehlungen zu gelten, sind zwingend die drei Kernforderungen nach offenem Zugang, offenen Standards und offenen Lizenzen einzuhalten.

Desweiteren sollten die Daten regelmäßig aktualisiert werden und auch im Ursprungsformat vorliegen, sie sollten strukturiert beschrieben werden und möglichst ohne Registrierung zugänglich sein. Vorkehrungen für die Nachhaltigkeit der Bereitstellung sollten getroffen werden.

Die Empfehlungen orientieren sich an existierenden Open-Data-Prinzipien und -Richtlinien für Gedächtnisinstitutionen oder dem öffentlichen Sektor im allgemeinen. Einzusehen sind die Empfehlungen im Wiki der Deutschen Nationalbibliothek.

Der Text selbst ist unter einer CC0-Lizenz veröffentlicht. Seine Verbreitung und Wiederveröffentlichung ist ausdrücklich erwünscht.

Hier sind die Empfehlungen in der aktuellen Version 1.0:

 


 

Empfehlungen zur Öffnung bibliothekarischer Daten

1. Präambel

Bibliotheken und andere Informationseinrichtungen arbeiten täglich in vielfältiger Weise mit Daten unterschiedlicher Verwendungszwecke und Bestimmung. Sie agieren als Datenproduzenten, Datenlieferanten, Datennutzer und Aggregatoren. Um den größtmöglichen Nutzen der durch öffentliche Einrichtungen produzierten Daten zu gewährleisten, ist es geboten, sie offen im Internet zu publizieren.

2. Gegenstand

In Informationseinrichtungen werden verschiedene Formen von Daten produziert, die Gegenstand einer Datenfreigabe sein können. Es ist zu betonen, dass eine Datenfreigabe nur durchgeführt werden kann unter der Voraussetzung, dass

  1. es sich bei den jeweiligen Daten nicht um personenbezogene oder anderweitig sensible Daten handelt,
  2. die jeweilige Einrichtung im Besitz der Datenbankrechte bzw. ggf. der Urheberrechte ist, um die Daten freizugeben.

Unter bibliothekarischen Daten zu verstehen sind sowohl bibliographische Daten gemäß den “Prinzipien zu offenen bibliographischen Daten” als auch darüber hinausgehende Daten, die in Ausübung bibliothekarischer Tätigkeit erstellt werden.

Zur Verwaltung der Dienstleistungen einer Bibliothek fallen zudem weitere Daten an, die – insofern es sich um nicht personenbezogene oder anderweitig sensible Daten handelt – ebenfalls freigegeben werden können. Zu diesen Daten zählen beispielsweise Exemplardaten, Erwerbungsdaten, anonymisierte Ausleihdaten, statistische Daten.

3. Prinzipien

Die DINI-AG KIM empfiehlt bibliothekarischen Einrichtungen im deutschsprachigen Raum und der gesamten Welt die Freigabe bibliothekarischer Daten. Folgende Prinzipien sind dabei zwingend einzuhalten:

  • Offener Zugang zu den Daten, d.h. die Daten müssen offen und kostenlos als Gesamtheit im Web zugänglich sein.
  • Offene Standards, d.h. die Daten müssen in einem offen dokumentierten und nicht-proprietären Format vorliegen. Es sind Webstandards zu bevorzugen, die von einer möglichst breiten Anwenderbasis verstanden werden.
  • Offene Lizenzen, d.h. die Daten müssen (als Einzeldatum und als Sammlung) unter einer offenen Lizenz im Sinne der Open Definition publiziert werden. Dabei empfielt die DINI-AG KIM die Verwendung eines Public-Domain-Waivers wie der CC0 Public Domain Dedication oder der Public Domain Dedication and License (PDDL) um die bestmögliche rechtliche Interoperablität der Daten zu garantieren.

Darüber hinaus empfehlen wir die Berücksichtigung folgender Prinzipien:

  • Dokumentation: Eine strukturierte Beschreibung der Daten soll veröffentlicht werden. Bestenfalls sollen die Daten in einem zentralen Verzeichnis (wie z.B. thedatahub.org)nachgewiesen werden.
  • Rohdaten: Die Daten sollen möglichst so zugänglich gemacht werden, wie sie im Informationskreislauf der Bibliotheken anfallen. Jede weitere Filterung oder Aufbereitung wird auf diejenigen verlagert, die von den Informationen später Gebrauch machen.
  • Aktualität: Daten sollen innerhalb eines angemessenen Zeitraums nach ihrer Erstellung oder Änderung veröffentlicht werden. Was angemessen ist, kann je nach Art der Daten variieren.
  • Strukturiert: Die Daten sollen in einem strukturierten Format publiziert werden, das einfache maschinelle Verarbeitung ermöglicht.
  • Nicht-diskriminierend: Der Zugriff auf die Daten soll für alle möglich sein, einzige akzeptable Hürde ist der Zugang zum Internet. Das heißt, dass keine Registrierung erforderlich sein soll.
  • Nachhaltigkeit: Die Bereitstellung der Daten soll mit der Entwicklung eines Nachhaltigkeitskonzepts verbunden sein, dass eine dauerhafte Archivierung und den Zugriff auf ältere Versionen der Daten sicherstellt.

Selten wird die Einhaltung sämtlicher Prinzipien von Anfang an gewährleistet sein. Allerdings sind die ersten drei Prinzipien notwendige Bedingungen, um überhaupt von offenen bibliothekarischen Daten zu sprechen. Es wird ausdrücklich empfohlen, zunächst auch Rohdaten zu veröffentlichen, die womöglich nicht in einem öffentlich dokumentierten Format vorliegen und/oder nicht strukturiert oder regelmäßig aktualisiert werden. Mittelfristig soll aber an der Einhaltung sämtlicher Prinzipien gearbeitet werden.

4. Verwandte Materialien

Entstanden im Rahmen der Gruppe Lizenzen der DINI-AG KIM.
Beitragende: Patrick Danowski, Kai Eckert, Christian Hauschke, Adrian Pohl und andere

Der Text dieser Empfehlungen ist unter der Creative Commons Lizenz CC0 veröffentlicht. Er ist somit gemeinfrei, d.h. er gehört allen und darf zu beliebigen Zwecken und ohne Auflagen genutzt werden. Bei Nachnutzung wird die Nennung der Quelle erbeten.