Artikel über Langzeitverfügbarkeit nicht verfügbar

Langfristige Verfügbarkeit elektronischer Medien [Computerdatei] : Referat am Kolloquium “Speicherbibliotheken – Digitale Bibliotheken” ; (Graz, 3. April 1997) / Heinz Hauffe. – 1997. – 22.725 Bytes

Über DOBInet gefunden, und trotz des Titels unter der angegebenen URL natürlich nicht mehr erreichbar. Aus dem Abstract:

WBb sollten im Bereich ihres Sammelauftrags Verfügbarkeit von Online-Publikationen beobachten und erforderlichenfalls Verantwortung für die Archivierung selbst übernehmen.

Das war in diesem Fall anscheinend nicht erforderlich.

Allianz zur Digitalen Informationen sucht Nähe zu Bibliotheken

Peter Welchering im Deutschlandfunk-Interview über die neue “Allianz der deutschen Wissenschaftsorganisationen”, die sehr offensiv für Open Access wirbt.

Problem Nr. 2: Bibliotheken und Fachinformationszentren sind vor vielen Jahren aus der Wissenschaftslandschaft ein Stück weit ausgeklinkt worden und wurden nur noch als Serviceeinrichtungen geführt. Sie müssen wieder stärker in die Wissenschaftsorganisationen integriert werden. Und da stoßen die Wissenschaftler im Alltag auf ganz banale Probleme etwa mit unterschiedlichen Datenformaten.

Siehe auch diese Presseerklärung des MPG zur Gründung der Allianz:

Open Access hat zum Ziel, das weltweite Wissen in digitaler Form ohne finanzielle, technische oder rechtliche Barrieren zugänglich zu machen. Die Allianz will den sogenannten “Grünen Weg” des Open Access durch den Ausbau institutioneller und disziplinärer digitaler Archive und Publikationsserver (sogenannte Repositorien) stärken. Ein weiteres wichtiges Ziel ist es, den “Goldenen Weg” des Open Access fördern. Dazu gehört die Weiterentwicklung von Geschäfts- und Fördermodellen und deren gemeinschaftlicher Finanzierung. In Modellprojekten soll auf eine Umschichtung der Subskriptionskosten auf Publikationskosten hingewirkt werden.

Die Initiative hat sich auch ein Leitbild (PDF) gegeben, in denen die Schlüsselpunkte noch einmal genauer erläutert werden. Den Wissenschaftlern geht es um die Bildung von Infrastrukturen zur Schaffung und Erhaltung von Wissen. Langzeitarchivierung, Open Access, Nationallizenzen. Es ist sofort ersichtlich, dass es es hierbei überwiegend um primär bibliothekarische Handlungsfelder geht. Dieses Papier ist für das wissenschaftliche Bibliothekswesen eine eindeutige Aufforderung zur Diskussion und Einmischung.

Peter Suber hat die Initiative schon bemerkt, in Deutschland wird sie zumindest öffentlich noch nicht diskutiert.

Universal-Archiv in Hollywood verbrannt?

Laut Spiegel Online ist das Video-Archiv der Universal-Studios mit rund 50.000 Videos und Filmrollen in Hollywood verbrannt. Wenn alle Pflichtexemplare ordnungsgemäß abgeliefert wurden, müsste der Schaden sich in Grenzen halten.

Zur Pflichtabgabe von Filmen in den USA gibt es im Januar einen interessanten Artikel in der Welt: Wie Amerika sein Filmerbe sichert.

Online zu PDF/A konvertieren und überprüfen

Neevia bietet einen kostenfreien, web-basierten Dokumentenkonvertierer an. Unterstützt werden zahlreiche Formate der Kategorien Generic Formats (z.B. Adobe PDF oder Adobe PostScript), Word Processing Formats (ASCII Text, ANSI Text, Microsoft RTF, Microsoft Word for PC v2 bis u.a. Microsoft Word for Windows 2000, Microsoft Works, Microsoft Windows Write, WordPerfect), Spreadsheet Formats (Corel QuattroPro, Lotus 1-2-3, Microsoft Excel, Microsoft Works Spreadsheet), Presentation Formats (Lotus Freelance, Microsoft PowerPoint) und Graphic Formats (BMP, GIF, JP2, JPEG, JPG, PGM, PICT, PNG, TIFF und wirklich viele mehr) als Ursprungsdatei. Umgewandelt werden kann in verschiedene graphische Formate und – hier wird es interessant für Gelegenheits-Selbstarchivierer – in PDF/A.

Neevia Document Converter eXpress makes it possible for anyone to instantly convert files to PDF or Image without the need of installing special software.

Das ist richtig, allerdings gibt es eine Begrenzung auf 1 MB pro Datei. Für Aufsätze mit nur wenigen Darstellungen ist das ausreichend, für die Dissertation muss man dann schon zu einer Programminstallation greifen.

Man sollte stets prüfen, ob das erhaltene Dokument auch wirklich dem PDF/A-Standard entspricht. Intarsys bietet einen entsprechenden Online-Check an. Ein von mir testweise mit dem Neevia Document Converter erzeugtes PDF/A bestand den Test ohne Beanstandungen, eine andere Datei (PDF 1.7), die ich zu Vergleichszwecken validieren ließ, erhielt folgende Fehlermeldung:

Document information dictionary ohne korrespondierende XMP-Struktur
Stream Objekt mit ungültigem Endstream
Unkalibrierter Farbraum ohne passenden OutputIntent
Font Times-Bold muss eingebunden sein
Font Helvetica muss eingebunden sein
Font Times-Roman muss eingebunden sein
Font Helvetica-Bold muss eingebunden sein
Font Helvetica-BoldOblique muss eingebunden sein
Font Helvetica-Oblique muss eingebunden sein
Keine gültige PDF/A Versionsinformation vorhanden

Links

Adobe Flash Media Rights Management Server

DRM error

Heise berichtet über einen neues, von Adobe angebotenen DRMS:

Inhalteanbieter können demnach mit der Software FLV- und F4V-Audio- und Videodateien verschlüsseln und Zugangsrichtlinien setzen, auch nachträglich nach einem Download.

Großartig. Es reicht also nicht, dass mir vorgeschrieben wird, mit welchem Betriebssystem, wie lange und wie oft ich Medien sehen darf. Nun kann es sogar sein, dass sich die Richtlinien ändern, nachdem ich die Medien schon längst in meinem Besitz wähnte. Ein Alptraum für die Langzeitarchivierung und Zitierbarkeit von audiovisuellen Daten. Wie in Adobes Presseerklärung zu lesen ist:

Precise usage control allows service providers to specify a range of parameters for user access and media expiration, while dynamic rights management lets them change usage rights even after a file has been distributed.

De facto kann ich also ein Flash-Video verteilen, und wenn ich dann irgendwann nicht mehr der dort vertretenen Meinung bin, ziehe ich es einfach zurück. Das eröffnet ganz neue Möglichkeiten für Politik und PR. Ab heute heißt es nicht mehr Was kümmert mich mein Geschwätz von gestern. Wenn es nicht mehr opportun erscheint, lässt man es einfach verschwinden.

Umgang mit korrigierten Artikeln in Verlagsarchiven

Christiane Schulzki-Haddouti macht sich Gedanken über die Nachhaltigkeit von Informationen, die in privatwirtschaftlichen Pressearchiven aufbewahrt werden. Aktueller Anlaß ist die Öffnung des Spiegelarchivs, in dem jedoch nicht alle Artikel enthalten sind. Umstritten ist wohl der über den Reichstagsbrand (dazu der Nachrichtendienst für Historiker), und schon entfernt ist der über die Barschelaffäre (dazu Robert Leicht bei Zeit Online).

Es stellt sich die Frage, wie sich der Umgang mit Online-Medienarchiven entwickeln wird. Ist eine Entfernung überhaupt zu rechtfertigen? Wird damit nicht auch ein Stück Mediengeschichte manipuliert? Online sind schnell ein paar Bits gelöscht – eine Entfernung aus einem Print-Archiv würde aber ernstlich niemand anstreben wollen.

Das wäre wohl auch alles andere als einfach, mal eben einen Spiegelartikel aus allen Bibliotheken verschwinden zu lassen.

PDF/A Quick Master

In der aktuellen c’t, die wie immer ihren Preis mehr als wert ist, findet sich ein Hinweis auf den PDF/A Quick Master, dass über den Druckbefehl aus jeder beliebigen Anwendung heraus PDF/A-Dateien [erzeugt], die nach ISO 19005 vor allem der Langzeitarchivierung von Daten dienen; verwendet vordefinierte PDF-Einstellungen, die jedoch auch in den wichtigsten Variablen konfigurierbar sind.

Da es nur für Windows verfügbar ist, konnte ich es leider noch nicht testen.

“Wissenschaftskommunikation der Zukunft”

Das IBI-Weblog berichtet heute, dass die Beiträge der Jülicher Tagung “Wissenschaftskommunikation der Zukunft” online abrufbar sind.
Auf der Tagung, die Anfang November stattfand, gab es u.a. Vorträge zum Thema Web 2.0, Langzeitarchivierung und Open Access.

Hier gibt es den Volltext des Tagungsbandes und hier das Inhaltsverzeichnis.

OCRopus

Google hat ein auf Tesseract basierendes Open-Source-OCR-Programm namens OCRopus in einer Alphaversion veröffentlicht. Ars Technica widmet sich diesem Release in einem kleinen Testbericht. Dort zeigt sich, dass sich das Programm zu Recht noch im Alpha-Status befindet:

We observed several common errors. For instance, the letter “e” is often interpreted as a “c” and the letter “o” is often interpreted as a “0” in scanned documents. OCRopus provides better results when scanning text that is printed with a sans serif font, and the size of the font also has a significant effect on accuracy.

Mehr Infos zu OCRopus gibt es in den FAQ. Andere freie Software aus dem OCR-Segment findet sich z.B. bei Sourceforge, u.a. Kognition, Image Text Editor oder Open OCR. Google selbst weist auch auf verschiedene verwandte Anwendungen hin.

[via Digital Koans]

Archivieren von Blogs

Jakob Voss macht sich Gedanken über die Sammlung und Archivierung von Blogs, ich selbst habe ja mal einen Versuch gestartet, Infobib im Rahmen der Pflichtabgabe von Netzpublikationen archivieren zu lassen, und nun geht die LoC das Problem “Archivierung von Blogs” an. Ergebnis ist das Programm “Web Capture”. Technische Basis ist u.a. Wayback, die auch vom Internet Archive eingesetzt wird. Gesammt wird u.a.:

Categories of sites captured include, but are not limited to: United States government (federal, state, district, local), foreign government, candidates for political office, political commentary, political party, media, religious organizations, support groups, tributes and memorials, advocacy groups, educational and research institutions, creative expressions (cartoons, poetry, etc.), and blogs.

Seiteninhaber werden offensichtlich auch benachrichtigt, wenn ihre Seiten in das Programm aufgenommen werden. Das sieht dann so aus.

[via Library Stuff]