Abbyy Finereader 12 Professional mit gutem OCR und validem PDF/A

Die Älteren werden sich erinnern, dass ich mich dereinst regelmäßig über die mangelhafte Qualität diverser PDF/A-Exporte mokierte. Fast sieben Jahre später muss man feststellen, dass sich dahingehend einiges zum Besseren gewandelt hat. Ein mir aktuell vorliegendes Beispiel: In der Version 9 lieferte der Abbyy Finereader kein korrektes PDF/A. Der Export der Version 12 (jeweils “Professional”) ist (soweit meine Validierungstools ordentlich arbeiten) tadellos. Abgesehen davon ist die OCR-Erkennungsquote deutlich verbessert.

Windows-App Office Lens

J.C. machte in einem Kommentar zu meinem Posting über Scan-Stiften und -Apps auf eine neue und kostenlose App für Windows Phones aufmerksam: Office Lens.

Office Lens doesn’t just take a picture and import an image into a Word or PowerPoint file. The final Word and PowerPoint documents are real Office documents.

Zumindest im Werbevideo sieht die App, die anscheinend den Einsatz von Microsofts Cloud-Dienst OneDrive zwingend voraussetzt, recht praktisch aus:

Vermutlich möchte Microsoft das Windows Phone durch Apps wie diese stärker im Markt für Geschäftskunden und im akademischen Bereich positionieren. Zumindest im Business-Bereich könnte die Zwangsnutzung von OneDrive jedoch auf Widerstand stoßen. Wer möchte seine Geschäftsgeheimnisse schon in Microsofts Cloud wissen?

Interessant ist die App auf jeden Fall, und hoffentlich ein Ansporn für zahlreiche Konkurrenzprodukte. Weitere Infos zu Office Lens gibt es in Microsofts Office-Blog.

Urteil des EuGH: Causa Darmstadt

Der Europäische Gerichtshof (EuGH) hat in der “Causa Darmstadt” – hier im Blog erstmals im Mai 2009 erwähnt, siehe auch hier – entschieden. Eine erste Einordnung versucht Leonhard Dobusch für Netzpolitik.org, das Urteil liegt online im Volltext vor.

Kurzbewertung von Harald Müller in Inetbib: EuGH erteilt Ulmer-Verlag eine Abfuhr.

Wie illustriert man "Online"?

Scan-Workflows und Langzeitarchivierung? Widmen wir uns den wahren Herausforderungen der Digitalisierung! Die Bibliothek hat zigtausend neue elektronische Dissertationen im Katalog. Diese grandiose Erweiterung des Bestandes soll in einem Blogbeitrag gefeiert werden. Welche Abbildung wähle ich, um die neuen Dokumente zu symbolisieren?

Dies ist ein regelmäßig wiederkehrendes Problem. Und jedes Mal, wenn ich mich der Herausforderung stelle, “Online” zu visualisieren, schiele ich neidisch zu den Altbeständlern herüber. Denn so etwas macht sich doch in jedem Blogposting sehr gut:

Doch was bleibt den Onlinern? Logos von Verlagen, das Open-Access-Logo, zur Abwechslung ab und an Geräte mit oder ohne bedienende Personen? Oder ein Blick in die Matrix?

Damit wären wir bei meinem stets wiederkehrenden Problem und daran anschließend meiner Herausforderung an die Allgemeinheit: Wie kann man Postings oder Pressemitteilungen über “Online” interessant und anschaulich bebildern, ohne immer wieder in dieselbe Klischee-Kiste greifen zu müssen?

Bibliothek und Wissenschaft im Entwurf der Digitalen Agenda

Netzpolitik hat dankenswerterweise einen Entwurf der Digitalen Agenda veröffentlicht. Natürlich sind ein paar Punkte aus hiesiger Blogperspektive von Interesse.

Nach viel Blabla (“digitaler Wandel”, “Zukunftsvision” etc.) soll es im Programmteil dann konkreter werden. Los geht es mit I. DIGITALE INFRASTRUKTUREN, was hier vorwiegend “Zugang zum Netz” bedeutet.

Dann geht es zu II. DIGITALE WIRTSCHAFT. Sichere Big-Data- und Cloud-Anwendungen sollen unterstützt werden. Hoffentlich diesmal etwas sicherer als die Fehlkonstruktion DE-Mail.

Darüber hinaus soll die Digitalisierung wichtiger Zukunftsmärkte unterstützt werden. Da die Kreativ- und Medienwirtschaft genannt ist, gehe ich davon aus, dass uns noch mehr brillante Ideen à la Leistungsschutzrecht bevorstehen. Immerhin:

Die Einführung einer EU-weiten Datenschutz-Grundverordnung, in der die Geltung des EU-Datenschutzrechts auch für nicht in der EU niedergelassene Internetunternehmen festgeschrieben werden soll (Marktortprinzip), wird mit Nachdruck unterstützt.

Gleich darauf folgt eine Ankündigung zur Anpassung des Urheberrechts an die rasante technische Digitalisierung in Wirtschaft und Gesellschaft:

Wir passen die rechtlichen Rahmenbedingungen für das Urheberrecht an die rasante technische Digitalisierung in Wirtschaft und Gesellschaft unter gerechtem Ausgleich der betroffenen Interessengruppen an. Dieses Ziel verfolgen wir auch auf europäischer Ebene. Wir werden dazu die urheberrechtlich zulässige Nutzung von geschützten Inhalten zu Zwecken von Wissenschaft, Forschung und Bildung verbessern, die kollektive Rechtewahrmehmung entsprechend dem europäischen Rechtsrahmen stärken sowie an der Revision des europäischen Urheberrechts aktiv mitwirken.

Weiter unten wird noch einmal erwähnt, dass eine “allgemeine Bildungs- und Wissenschaftsschranke eingeführt werden” soll.

Nun zum Abschnitt III. INNOVATIVER STAAT. Erst:

Unsere Rolle als großer IT-Beschaffer werden wir dazu nutzen, Innovationen und die Umsetzung von Sicherheit in der IT zu fördern.

Open Source und Verschlüsselung? Super! Aber dann:

Wir führen De-Mail flächendeckend ein.

Ja, was denn nun?

IV. DIGITALE GESELLSCHAFT

“Dialog mit gesellschaftlichen Gruppen ausweiten” klingt gut, “Digitale Medienkompetenz stärken” auch. Ein interessanter Begriff ist in diesem Zusammenhang “safety by default”. Wie soll das realisiert werden? Mit Websperren? Mit bestimmten Tools, die über White- oder Blacklists den Zugang von Kindern und Jugendlichen einschränken sollen? Oder Zugang zu bestimmten Ressourcen nur nach Login und ordentlicher Registrierung, was sehr ernsthafte Konsequenzen für die Anonymität im Netz hätte? Wer sich anmelden muss, ist schließlich noch leichter überwachbar als ohnehin schon.

Na, stöbern wir ein bißchen weiter:

Wir wollen das Internet dazu nutzen, Familien durch innovative Vermittlungsplattformen von familienunterstützenden Dienstleistungen zu unterstützen.

Kann mir das mal jemand übersetzen und/oder mit Inhalt füllen?

Spannend wiederum klingt das Modellprojekt „Freiwilliges Soziales Jahr Digital”. Nun aber zum Kernpunkt:

V. BILDUNG, FORSCHUNG UND KULTUR

  • Eine neue Strategie für den digitalen Wandel in der Wissenschaft wird wesentlich zur Weiterentwicklung der Informationsinfrastrukturen (wie z.B. Archive, Bibliotheken, Forschungs- und Publikationsdatenbanken) beitragen.
  • Der von Bund und Ländern beschlossene Rat für Informationsinfrastrukturen wird als übergeordnetes Koordinierungs- und Beratungsgremium die Weiterentwicklung der wissenschaftlichen Intormationsinfrastruktur, z.B. durch Empfehlungen, unterstützen.
  • Die Vernetzung von Forschungsdatenbanken und Repositorien sowie virtuelle Forschungsumgebungen fördern wir im Rahmen eines eigenen Programms.

Es wird also Geld geben. Vermutlich lohnt es sich, schon mal Projekte zu entwerfen. Wenn man nur wüsste, welches Ziel die Strategie für den digitalen Wandel in der Wissenschaft haben soll…

Den nächsten Punkt möchte ich komplett zitieren:

2. Zugang zu Wissen als Grundlage für Innovation sichern
Wir werden die Rahmenbedingungen für einen ungehinderten Informationsfluss insbesondere der Wissenschaft verbessern durch

  • eine umfassende Open Access-Strategie, die den Zugang zu Forschungspublikationen und -daten verbessern und Anreize ausbauen soll;
  • Verbesserungen im Urheberrecht, um die Potenziale der Digitalisierung für Wissenschaft, Forschung und Bildung voll zu nutzen. Insbesondere soll eine allgemeine Bildungs- und Wissenschaftsschranke eingeführt werden.

In der Ausgestaltung und der praktischen Umsetzung kann natürlich noch viel schief gehen. Aber sofern hier echtes Open Access – und nicht nur “gratis im Web ansehbar” – gemeint ist, sehe ich das als sehr gute Nachricht an.

Im Abschnitt Kultur und Medien geht es dann um Kulturgüter und Langzeitarchivierung:

  • Wir entwickeln eine übergreifende Strategie mit geeigneten technischen Lösungen und Standards zur langfristigen digitalen Bewahrung von Wissen, Informationen und Kulturgütern und schaffen die dafür notwendigen (urheber-)rechtlichen Rahmenbedingungen.
  • Wir stellen digitalisierte Kulturgüter und deren Metadaten offen und – soweit urheberrechtlich zulässig – möglichst unentgeltlich zur Verfügung.
  • Zur Digitalisierung von Kulturgut und zu seiner langfristigen digitalen Bewahrung entwickeln wir Strategien und Aktionspläne (u.a. zur Kino- und Filmdigitalisierung) und schaffen die notwendigen (urheber-)rechtlichen Rahmenbedingungen für die langfristige digitale Bewahrung.
  • Wir bauen die „Deutsche Digitale Bibliothek” weiter auf und aus.

Der abschließende Bereich IKT in der Entwicklungshilfezusammenarbeit klingt dann wieder nach Wirtschaftsförderung.

Fazit: Einiges wird angedeutet, aber sehr viel bleibt völlig unklar. Dass es eine “Strategie für den digitalen Wandel in der Wissenschaft” geben soll, ist ja prima, aber von dieser Agenda hätte ich eigentlich erwartet, dass sie zumindest grob skizziert, in welche Richtung es gehen soll. Laut Netzpolitik soll die finale Version am 20. August veröffentlicht werden. Hoffentlich trägt die via Netzpolitik.org hergestellte Öffentlichkeit dazu bei, dass die Verantwortlichen die Schwachstellen beseitigen.

Vom Nutzen guter Dokumentation

Teil der Operation Frühjahrsputz 2014, in deren Verlauf angefangene und nie beendete Postings einfach so veröffentlicht werden.

Artikel dazu, siehe auch hier.

Diese E-Books sind ein Niedergang

Friedrich Forssman ist Buchgestalter, mag keine E-Books und beschrieb seine Abneigung im Suhrkamp-Blog:

Muß man eigentlich noch etwas gegen E-Books sagen? Müssen sie einem nicht womöglich leid tun, die albernen Dateien, die gern Bücher wären, es aber niemals sein dürfen? Ja, das muß man, und nein, das müssen sie nicht, sie sind ein Unfug, ein Beschiß und ein Niedergang.

Es folgt eine Suada, in der er einige richtige Punkte anspricht, aber verschweigt, dass es sich dabei zum Teil um Probleme handelt, die E-Books nicht eigen sein müssen. Zum Beispiel das Problem, dass man E-Books nicht weitergeben könne. Ach, was schreibe ich, Johannes Haupt hat doch schon eine lesenswerte Replik veröffentlicht.

PS: Ein interessanter Nebenaspekt ist die recht hohe Zahl der Blogs, die auf den Suhrkampblog verweist. Über 20 Blogs haben auf Forssmans Beitrag verwiesen. Rivva erfasst davon immerhin fast die Hälfte.

Jetzt für Archive.org spenden! JETZT!

Weil es eilt und weil es sinnvoll ist, hier gleich noch eine Meldung zum Internet Archive:

You’ve heard about the fire that destroyed one of our thirty-two scanning centers last month. But here’s what you may not have heard: the good news.

An incredibly generous anonymous donor is helping us rebuild—and grow—by matching every donation made before 2014 three-to-one. That means your $50 donation results in a $200 contribution.

We are raising $1,000,000 before the end of the year to fund more machines and five petabytes—that’s five thousand terabytes!—of storage.

Noch einmal auf Deutsch: Im Internet Archive hat’s gebrannt, es ist großer Schaden entstanden. Nun hat sich ein anonymer Gönner bereit erklärt, zu jeder Spende, die noch 2013 erfolgt, das Dreifache draufzugeben. So wird aus einer 50-Dollar-Spende eine 200-Dollar-Spende.

Auf geht’s zum Spenden! Keine Ausreden! Immerhin kann man da auch Mario Bros spielen. Und sagt das alle ganz schnell weiter!