#0zapftis: Wer archiviert die CCC-Schriften?

Der CCC hat einen Staatstrojaner analysiert (ob Bundestrojaner oder Landestrojaner) und der Aufschrei ist groß. Die Folgen werden es hoffentlich ebenso sein. Wer auch immer dies veranlasst hat, hier reicht ein einfacher Rücktritt nicht aus.

Irgendein Innenminister wird vermutlich in Kürze sein Amt abgeben müssen. Dies wird für Politikwissenschaftler heute und Historiker in späteren Zeiten interessant sein. Jetzt sind die Quellen zahlreich. FAZ, Zeit Online, Fefe, Netzpolitik und viele andere dokumentieren den Fall. Vieles, vielleicht auch dieser Artikel bei Heute.de wird in Kürze “depubliziert” oder aus anderen Gründen nicht mehr verfügbar sein. Vielleicht auch die Analyse des CCC (PDF) nicht.

Wer archiviert solche Reports? Im Katalog der DNB habe ich nur neun Publikationen des Chaos Computer Club. Da der Output dort doch etwas größer ist, vermute ich, dass dortige Netzpublikationen nicht eingesammelt werden. Müssen sich kommende Generationen auch Archive.org und ähnliche Initiativen verlassen?

Neues zur Ablieferung von Netzpublikationen

Die Ablieferungsmodalitäten für monographische Netzpublikationen wurden geändert. Es stehen nun zwei Varianten zur Auswahl. Aus einer Mail von der Deutschen Nationalbibliothek:

Variante 1:

Falls Sie das neue Ablieferungsverfahren für monografische Netzpublikationen bereits angewandt haben, können Sie für die Übermittlung periodischer Netzpublikationen sofort über das neue Webformular verfügen.

Für die Ablieferung loggen Sie sich bitte mit Ihrer E-Mail-Adresse, an die dieses Schreiben gerichtet ist, und dem zugehörigen Passwort unter https://portal.d-nb.de ein.

Variante 2:

Falls Sie noch nicht mit dem neuen Ablieferungsverfahren für monografische Netzpublikationen gearbeitet haben, fordern Sie bitte über „Passwort anfordern“ unter Angabe der E-Mail-Adresse, an die dieses Schreiben gerichtet ist, ein Passwort an. An diese E-Mail-Adresse wird dann eine automatisch generierte E-Mail mit dem Passwort versendet. Durch die Anforderung des Passwortes erklären Sie, dass Sie unsere Datenschutzerklärung akzeptieren.

Loggen Sie sich mit Ihrer E-Mail-Adresse und dem Passwort unter https://portal.d-nb.de ein. Es ist möglich, Ihr Passwort unter dem Menüpunkt „Mein Konto“ zu ändern. […]

Mehr Infos gibt es hier.

Anmerkung: Das Thema scheint weitgehend aus dem Fokus der Öffentlichkeit verschwunden zu sein. Nach der ersten Aufregung bei Verabschiedung des Gesetzes zur Pflichtablieferung von Netzpublikationen sah es so aus, als ob die DNB in Arbeit ersticken müsste. Nun kann ich bei einer kurzen Recherche nur ein Blog-Posting zu dieser Änderung finden und leider keinen einzigen Erfahrungsbericht.

Pflichtabgabe von Netzpublikationen via OAI-Schnittstelle

Als Betreuer eines institutionellen Dokumentenservers hat mich im Zusammenhang mit der Pflichtabgabe von Netzpublikationen natürlich sehr interessiert, ob ich die dort publizierten Dokumente einzeln anmelden muss, oder ob ich die OAI-Schnittstelle dafür nutzen kann, die Dokumente abholen zu lassen. Stephan Jockel, Pressesprecher, Referent der Generaldirektorin der DNB, hat mir freundlicherweise auf meine Fragen geantwortet.

Der [Dokumenten-]Server verfügt über eine OAI-Schnittstelle. Können Sie die Publikationen darüber oder über ein anderes automatisiertes Verfahren selbst einsammeln? Gibt es eine Möglichkeit, ein derartiges Verfahren anzumelden?

Das Einsammeln über eine OAI-Schnittstelle ist ein von der Deutschen Nationalbibliothek favorisierter Weg. Derzeit wird dies mit Online-Hochschulschriften praktiziert; getestet werden außerdem Ablieferer, die über eine OAI-Schnittstelle und Metadaten im ONIX-Format verfügen. Wir werden dazu im Laufe des Tages ein Papier auf unsere Seiten stellen , das auf diese Art der Schnittstelle hinweist. Im Falle einer geplanten Ablieferung über eine OAI-Schnittstelle bitten wir den Ablieferer, sich zu melden, da jeweils pro Ablieferer ein Test durchgeführt wird und erst danach das Einsammeln durch die Deutsche Nationalbibliothek starten kann (s. http://www.d-nb.de/netzpub/ablief/pdf/np_reg_ausf.pdf S. 5 und 6)

Werden die von Ihnen gesammelten Veröffentlichungen in irgendeiner Art zugänglich gemacht? Zum Beispiel in einer Datenbank oder einer Art nationaler Wayback-Machine?

Die eingesammelten Publikationen werden im Katalog der Deutschen Nationalbibliothek angezeigt. Online-Publikationen sind durch ein Symbol gekennzeichnet und können aus der Gesamtmenge der Treffer herausgefiltert werden (Beispiel: https://portal.d-nb.de/opac.htm?query=knowledge+engineering&method=simpleSearch; rechts sind die Materialarten aufgeführt, darunter auch Online-Ressourcen)

Werden URN, DOI und andere persistente Identifier bei der Archivierung berücksichtigt und in die Metadaten aufgenommen?

Ja, siehe: http://www.d-nb.de/netzpub/ablief/pdf/np_mono_ausf.pdf Seite 7;
im Katalog sind sie im Feld “Persistent Identifier” zu sehen:
https://portal.d-nb.de/opac.htm?method=showFullRecord&currentResultId=-941295362&currentPosition=1

Keine Panik: Pflichtabgabe von Netzpublikationen eilt nicht

In den Kommentaren zur Meldung über die Verordnung zur Pflichtabgabe von Netzpublikationen sind zum Teil gruselige Visionen beschworen worden. Der Telagonsichelputzer hat bei der DNB nachgefragt und früher als ich eine Antwort erhalten. Alle Angaben ohne Gewähr, wie man in seinem Blog nachlesen kann:

* Publikationen wie Weblogs sind momentan für die Erfassung nicht relevant.
* Private Inhalte auch außerhalb Weblogs, die mit Werbeanzeigen einen gewerblichen Charakter haben, sind für die Archivierung derzeit nicht relevant.
* Technisch gesehen ist die Archivierung von sehr vielen Datenmengen, insbesondere individuelle Publikationen wie Weblogs, noch nicht ausgereift.
* XML und RSS seien andenkbare Lösungen zur Aggregation der Inhalte, die jedoch noch in Planung sind.
* Die Pflege der Daten bei Aktualisierungen der publizierten Texte ist derzeit noch nicht gelöst.
* Digitale Bilder und Videos diverser Social Media Networks stellen die Nationalbibliothek vor eine Herausforderung, insbesondere die zu bereitstellende Speicherkapazität seitens der Nationalbibliothek für einen digitalen Film sind derzeit nicht abgedeckt.

Für Nichtblogger und Firmen: Kann man nicht einfach per wget oder einem ähnlichen Tool die Seiten runterschaufeln, das dann durch sowas wie HTML2PDF drehen und anschließend der DNB rüberschicken? Das kann man automatisieren, und wenn die Notwendigkeit bestünde, lässt eine bedienungsfreundliche Open-Source-Applikation bei Bedarf bestimmt nicht allzu lange auf sich warten.

Pflichtabgabe von Netzpublikationen

Laut Heise tritt die Verordnung zur Pflichtabgabe von Netzpublikationen heute in Kraft.

Generell soll die Anlieferung möglichst per FTP und bevorzugt als PDF erfolgen. Bilder, andere Darstellungselemente sowie “Software und Werkzeuge, die in physischer oder in elektronischer Form erkennbar zu den ablieferungspflichtigen Netzpublikationen gehören”, sind aber ebenfalls betroffen. Dies gilt vor allem für “nicht marktübliche Hilfsmittel”, ohne die ein Lesen der digitalen Werke im Offline-Modus nicht möglich ist.

Ohne mir jetzt die Zeit genommen zu haben, das auszuprobieren: es sieht nicht so aus, als ob die Deutsche Nationalbibliothek seit der Testphase etwas gelernt hätte.

Siehe auch hier, hier oder hier.

Na, wer traut sich ran und schreibt einen Erfahrungsbericht?

Warum PDF-Dateien verschlüsseln?

Collection by 96dpi Peter Suber schreibt über die Open Access Policy der Fraunhofer-Gesellschaft, die auf Deutsch und Englisch als PDF-Datei veröffentlicht wurde. Dabei moniert er:

Unfortunately, both the German and English versions of the policy are locked PDFs which block cutting/pasting (why?) and I don’t have time to rekey the important passages.

Why? Gute Frage! Wenn man mit wissenschaftlichen Autoren über elektronische Publikationen spricht, stößt man schnell auf einen Wust des Mißtrauens gegen das einfach so ins Netz stellen. Viele Autoren denken offensichtlich, sie müssten ihr Werk in jeder Art und Weise gegen eventuellen Mißbrauch schützen. Worin dieser Mißbrauch genau bestehen könnte, ist meist unklar. Auf Nachfrage wurde mir schon diverse Mal “das Copyright” genannt, das es zu schützen gelte. Abgesehen davon, dass es in Deutschland kein Copyright gibt, sondern ein Urheberrecht, hat dessen Durchsetzung auch wenig bis gar nichts 1) Wenn ich §95a des Urheberrechtsgesetz richtig verstehe, ist die Umgehung technischer Kopierbremsen zwar verboten, aber ebenso einfach wie unnötig. mit technischen Sperren zu tun.

Das es im betrieblichen Umfeld Sinn ergeben mag, PDF-Dateien gegen Veränderung zu schützen oder den Empfängerkreis zu begrenzen, ist klar. Aber vor was fürchtet sich ein wissenschaftlicher Autor? Davor, zu oft zitiert zu werden? Wohl kaum. Wovor dann?

References   [ + ]

1. Wenn ich §95a des Urheberrechtsgesetz richtig verstehe, ist die Umgehung technischer Kopierbremsen zwar verboten, aber ebenso einfach wie unnötig.

Pflichtabgabe von Netzstrumpfhosen. Ein Selbstversuch

Die Deutsche Nationalbibliothek ruft, und als gesetzestreuer Bürger wollte ich natürlich sofort ausprobieren, wie denn das Anmeldeverfahren für die Pflichtabgabe von Netzwerkpublikationen genau funktioniert. Und selbst wenn man dem hiesigen Bibliothekswesen nicht viel zutraut, ist man wirklich sehr überrascht, wie das Procedere aussieht.

  1. Das Anmeldeformular wird ausschließlich als doc-Datei angeboten. Ist es zwingend notwendig, Microsofts Word zu benutzen, damit man teilnehmen kann? Nimmt die DNB auch nur Bücher an, die von bestimmten Druckereien ausgedruckt wurden? Im Jurawiki ist sehr schön dargestellt, warum man so etwas nicht machen sollte. Es fällt dort Worte wie “Nötigung” und “Gefährdung”. Todesmutig und mit Antivir in Habachtstellunge hab ich nun OpenOffice auf diese Datei losgelassen. Und…
  2. … ich bekomme ein einseitiges Formular ohne geschützte Bereiche. Müssen die armen DN-Bibliothekare nun jedes Formular auf unveränderte Texte prüfen? Nicht jeder wird so auffällig fälschen wie ich:

    Pflichtabgabe von Netzstrumpfhosen

    Gesetzt den Fall, man lieferte dieses Formular nun korrekt ausgefüllt und ungefälscht per E-Mail, Fax oder Post an die DNB, so bekommt man eine Anmelder-Identifikation und ein Passwort per Email(!) zugesandt. Von wegen rückständig!

    Wie fortschrittlich die DNB ist, beweist sie schon im nächsten Schritt: Sie melden die Netzpublikation an. Diese Anmeldung ist für jede Lieferung erforderlich. Vor jeder Lieferung? Nun ja, sehen wir weiter…

  3. Wollte ich der DNB gerade noch auf die Möglichkeiten der modernen Technik hinweisen, so zeigt sich nun, dass dies gar nicht notwendig ist! Um die Netzpublikation anzumelden, darf ich ein interaktives Anmeldeformular aufrufen. Doch meine Befürchtung, jetzt blinkende Flash-Animationen zu sehen, werden glücklicherweise enttäuscht. Nein, man wird in ein konventionelles, mit Perl gestaltetes Formular gelenkt. Und das Ausfüllen gestaltete sich mitunter etwas schwierig. Hinweis: die Steuerklärungsformulare sind ähnlich formuliert. Beispiel gefällig?

    Abgabe von Steuererklärungen

    Vorher wurden schon Begriffe wie Grundlieferung verwendet. Wahrscheinlich, um beteiligten Bibliothekswesen ein bißchen Vertrautheit im fremden Online-Dschungel zu lassen. Aber vielleicht treibt die DNB ja auch das Verlangen, dieses Wort im Sprachschatz der Netzbürger zu verankern.

  4. Davon lassen wir uns nicht aufhalten, die richtigen Punkte sind schnell ausfindig gemacht (“Typ: Elektronische Zeitschrift”), und der nächste Punkt in Augenschein genommen. Ich habe zur Datenübermittlung verschiedene Möglichkeiten, und hier beantwortet sich auch meine Frage aus Punkt XX zu den Lieferungen. “Prinzip Schnappschuß” und “Prinzip Differenzmenge”. Ersteres bedeutet, ich liefere der DNB die komplette Webseite auf einmal, beim “Prinzip Differenzmenge” werden nur neue oder geänderte Daten übermittelt. Ja, genau. Ich übermittele die Daten.

    Vorgesehen ist eine Lieferung per FTP. Genaueres dazu schreibt Jürgen Lübeck, man muss sich ja schließlich nicht über alles selbst aufregen.

    Wie auch immer: Gewünscht ist eine gepackte Datei mit allen Seiten, die publiziert wurden. Ganz ehrlich, ich wüsste wirklich nicht, wie ich das bewerkstelligen soll. Sämtliche Infobib-Seiten sind dynamisch generiert. Das heißt, sie existieren eigentlich nicht wirklich. Will die DNB einen SQL-Dump von mir? Sicherlich nicht. Aber was sonst? Wget fällt mir ein, aber warum macht die DNB das nicht selbst?

    An dieser Stelle ist anzumerken, dass Patrick Danowski schon die Hochschulschriftenserver für viel zu kompliziert im Vergleich mit Webdiensten wie Scribd hält. Entscheidet man sich für die Lieferung von “Schnappschüssen”, gelangt man zum letzten Punkt:

  5. Bibliographische Metadaten : fortlaufende Publikation. Das einzig hier auszusetzende sind die vorgegebenen Möglichkeiten zur Erscheinungsweise. Davon wird auf fast alle die Option “unregelmäßig, aber mehrmals im Jahr” zutreffen. Aber zu dieser Frage gibt es noch ein freies Feld, in dem man dann etwas genauer eintragen kann, dass mehrmals im Jahr in der Regel auch mehrmals pro Woche bedeutet.
  6. Auf der selben Seite werden noch ein paar Daten abgefragt. Alles kein Problem, Infobib gehört in die Kategorie 0020, Bibliotheks- und Informationswissenschaft. Auch für eher tagebuchartige Blogs findet sich schnell die passende Kategorie: 920, Biografie, Genealogie, Heraldik. Eine Rubrik weiter darf man die Seite weiter klassifizieren. Man hat die beeindruckende Auswahl zwischen:

    Wenn man davon noch nicht genug hat, und die Webseitenklassifizierung der Informatik-AG der örtlichen Realschule übernehmen möchte, kann auch dieses machen. Bei den Thesauri/Normdateien sind nur drei angegeben, Medical Subject Headings, SWD (nicht ausgeschrieben, kennt ja schließlich jeder!) und Unified Medical Language System. Insgesamt ist die DNB hier wieder sehr modern. Es gibt jede Menge user generated content.

  7. Es folgt die Frage, ob die Seite lizenzfrei ist. Ist sie nicht, im Footer wird schließlich stets auf die Creative Commons Attribution-Share Alike 2.0 Germany License verwiesen. Doch wenn man liest, …

    Die bibliographische Erschließung erfordert, dass die angemeldeten Netzpublikationen den berechtigten Nutzern der Deutschen Nationalbibliothek zugänglich sind. Bitte stellen Sie dies vor der Abgabe sicher.

    … dann hakt man schnell lizenzfrei an und wandert weiter.

  8. Die letzte Seite! Land in Sicht! Und es lässt sich gut an: Angaben zur Archiv-Version der Netzpublikation : fortlaufende Publikation. Am Punkt “Systemvoraussetzungen” kann man herummäkeln, wenn man will. Muss man aber eigentlich nicht mehr.

In der FAQ zeigt sich die DNB scheinbar einsichtig: Warum erscheint das Anmeldeverfahren so aufwändig? Es erscheint aber nicht nur, es ist! Hoffnung bietet jedoch ein anderer Punkt: Wie liefert man eine Netzpublikation ab? Wo bekomme ich einen Überblick über das Verfahren?

Derzeit wird an anderen Transfermöglichkeiten und auch an Verfahren zur Sammlung ganzer Gruppen von Objekten, wie etwa vollständiger Websites, gearbeitet. Automatisierte Verfahren, die unter dem Begriff “Harvesting” bekannt sind, können zur Sammlung ganzer Bereiche des Internets eingesetzt werden. Diese Verfahren befinden sich momentan in einem Entwicklungsstadium und müssen noch für den Einsatz im Rahmen des erweiterten Sammelauftrages zur Anwendungsreife gebracht werden.

Kurz und gut: Die DNB will Infobib offensichtlich nicht haben. Vielleicht ja in Kürze, wenn der erweiterte Sammelauftrag anwendungsgereift ist.

Sammlung von Netzpublikationen durch die DNB konkretisiert

Heise: Bundesregierung präzisiert Pflichten zur Archivierung von Netzinhalten:

Wie bereits die Medienwerke in körperlicher Form müssen zukünftig auch Netzpublikationen im Wege der Pflichtablieferung der Bibliothek zur Verfügung gestellt werden. Wer diesen Verpflichtungen nicht oder nicht vollständig nachkommt, handelt ordnungswidrig und muss im Extremfall mit einer Geldbuße mit bis zu 10.000 Euro rechnen. […] Unscharf ist der Verordnungsentwurf bei der Abgrenzung der Inhalte, die der Archivierungspflicht unterfallen sollen. […] Definitiv verfügbar gemacht müssen nach dem Verordnungsentwurf E-Mail-Newsletter mit Webarchiv sowie “netzbasierte Kommunikations-, Diskussions- oder Informationsinstrumente”, die “sachliche oder personenbezogene Zusammenhänge” aufweisen. Als Beispiel hierfür dienen in der Entwurfsbegründung öffentliche Weblogs. Ute Schwens, die Direktorin der Deutschen Nationalbibliothek spricht darüber hinaus auch von “Formen, die originär dem Web entsprungen sind”, wie etwa Wikis und gegebenenfalls Foren. Der Archivierungsauftrag beschränkt sich nicht auf Texte, sondern umfasst teilweise auch Bilder und Töne.

Ausdrucken und hinschicken? Die DNB hat zu Beantwortung nicht nur dieser Frage FAQ gesammelt. Und hier steht ganz konkret, wie es geht.