Klaus Graf schlägt “7 Grundregeln für digitale Projekte” vor:
Für digitale Sammlungen von Archiven, Bibliotheken, Museen usw. und virtuelle Ausstellungen sind die folgenden Grundregeln gedacht, die ich zur Diskussion stelle.
1. NICHT AN DER AUFLÖSUNG SPAREN! Jede Bildseite muss in hoher Auflösung vorliegen, denn nur diese garantiert die wissenschaftliche Nutzbarkeit.
2. PERMANENT-LINKS! Jede einzelne Bildseite muss mit einem deutlich angebrachten KURZEN dauerhaften Link versehen werden.
3. META-DATEN ZU JEDEM DIGITALEN OBJEKT! Zu jedem digitalen Objekt (auch zu separat nutzbaren Einzelseiten wie Druckgrafik, Zeichnungen) muss es entsprechende Metadaten geben, die professionellen Ansprüchen genügen müssen.
4. OAI-PMH NUTZEN! Alle Meta-Daten müssen für OAI-Harvester zur Verfügung stehen.
5. KEIN COPYFRAUD! Die Rechtslage ist in den Metadaten möglichst objektiv und auf jeden Fall ohne Copyfraud zu beschreiben. Was gemeinfrei ist, muss auch als Digitalisat gemeinfrei bleiben! Wenn das Projekt über Urheberrechte verfügt, ist eine Nachnutzbarkeit über eine möglichst liberale CC-Lizenz vorzusehen.
6. WEB 2.0! Nutzer sollten die Möglichkeit haben, Ergänzungen und Korrekturen anzubringen (Tags, Transkriptionen usw.)
7. LANGZEITARCHIVIERUNG! Die dauerhafte öffentliche Verfügbarkeit ist ggf. durch Kooperation mit Bibliotheken sicherzustellen.
Während einer Bastelstunde an einem mobilen Katalog für Hannover (Achtung: funktioniert absolut noch nicht so, wie es mal sein soll. Mehr darüber bei Jakob Voss, von dem ich das Skript auch übernahm.) stöberte ich mal wieder ein wenig in den Katalogisaten im GVK.
Langer Rede, kurzer Sinn: Es gibt nicht nur ein paar Beispiel-EKIs (Erstkatalogisierungs-IDs) wie z.B. diese hier. Eine schnelle Recherche ergab:
The actual data export is from 6.12.2009. We are working on providing regular updates. The Data is provided in zipped MARCXML. We are working on providing other formats, specialy RDF.
For a Z39.50 access to the data it will be soon integrated into biblios.org. The Open Library Project will also integrate the data soon.
Mehr dazu auch in der dazugehörigen Ankündigung oder im schmissigen “Videoclip zum Download”:
Alle verfügbaren Daumen hoch, Patrick! Endlich setzt jemand die Forderung nach Open Access zu bibliographischen Daten (Open Bibliographic Data) in die Tat um. Die Pionierleistung ist geschafft, die gewählte Lizenz (CC0 und Public Domain Dedication) kann besser nicht sein. Gerüchteweise wollen einige Bibliotheken in Kürze folgen.
Und nun bin ich gespannt, was mit den Daten gemacht wird.
Gerade bei Yovisto gefunden: zwei Vorträge zu Open Access. Der Erste ist OPEN ACCESS – der freie Zugang zum Wissen von Igor Drieghe.
Der Zweite, Second-Generation Open Access: Building an Open Content von John Wilbanks ist leider nicht einbindbar. Daher sei an dieser Stelle auf die entsprechende Yovisto-Seite hingewiesen.
Bei der Suche in Yovisto wurden mir auch mehrere Mängel des Angebots bewusst. Ich habe zuerst die Angabe der Spieldauer zum Beispiel beim letzten Video vermisst. Bis mir klar wurde, dass sie in den Suchergebnissen ganz klein (und anscheinend nur dort) tatsächlich verzeichnet ist. Auch andere Metadaten werden dem geneigten Seitenbesucher verheimlicht. Zwar findet man deutsche Videso zu Open Access, wenn man den Sprachfilter in der Suchfunktion nutzt, aber eine Sprachangabe in den Metadaten suche ich vergeblich.
Am 26. Februar wurde Dr. Felix Sasaki vom W3C die Berufungsurkunde zum Professor der Fachhochschule Potsdam von Staatssekretär Dr. Komusiewicz im Minsiterium für Wissenschaft, Forschung und Kultur überreicht.
Er wird im Fachbereich Informationswissenschaften den Bereich inhaltliche Erschließung verstärken und mit seinen langjährigen Erfahrungen am W3C fruchtbaren Input auf die eine oder andere Weise bringen. Tim Berners-Lee (der Erfinder des WWW und Chef im W3C) lässt ihn sicher ungern gehen.
Webtechnologie und vor allem Metadaten zur Steuerung und Strukturierung des Web werden immer wichtiger in allen drei Berufsfeldern des Fachbereichs. Prof. Sasaki rundet damit das Bild ab, das die drei “Überlastprofessuren” mit den weiteren Themengebieten: Elektronisches Publizieren/Dokumentenmanagement und Webtechnologie/Semantic Web Anwendungen als neue Facette unserem Lehr- und Forschungsprofil hizufügen.
Sebastian Wolf machte in Inetbib auf Risiken und Nebenwirkungen der automatischen Metadatengeneration durch Google aufmerksam.
Google Scholar kümmert sich auch nicht um die Original-Metadaten aus den Dokumentenservern, sondern indexiert Autorennamen etc. per automatischer Texterkennung. Die Metadaten von Dokumentenservern sind in der Tat manchmal erstaunlich schlecht, aber die automatische Autorenerkennung macht z.B. “F Password”, “D Surgery” und “I View” zu erfolgreichen und vielzitierten Autoren in Google Scholar.
Es gibt sogar einen Aufsatz, der von allen Dreien gemeinsam geschrieben wurde. Dort bestätigt sich auch, was sich schon bei einem Überfliegen der Ergebnislisten der anderen “Top-Autoren” aufdrängt: zwei von drei Versionen des Werkes werden mit korrekten Autorenangaben versehen, nur bei Blackwell Synergy schlägt die Interpretation stets fehl.
Allerdings sind Blackwell-Autoren nicht das einzige Opfer der fehlerhaften Autorenerkennung. Wenn man nach Reputationseffekt erhält man auch gleich als erstes ein Werk von “F Wirtschaftswissenschaften” angeboten.
Bleibt nur zu hoffen, dass F. Wirtschaftswissenschaften (bestimmt ein guter Freund von F. Informationswissenschaft, der wiederum sehr viel mit F. Potsdam veröffentlicht) in nicht-deutschsprachigen Ländern nicht tatsächlich ab und an als Autor angegeben wird.
Die Biblioblogosphäre wächst und gedeiht. Nach den Chaoslineaten hat sich jetzt Jakob Voss zum Bloggen im Jakoblog entschieden. Und wurde flugs in die Biblioblogsuche integriert.