Dokumente konvertieren mit Pandoc

Teil der Operation Frühjahrsputz 2013, in deren Verlauf angefangene und nie beendete Postings einfach so veröffentlicht werden.

Pandoc ist ein erstaunlicher Dokumentenkonverter.

Pandoc can convert documents in markdown, reStructuredText, textile, HTML, DocBook, LaTeX, or MediaWiki markup to

Pandoc wird zu Recht als Schweizer Taschenmesser bezeichnet und läuft auf ziemlich vielen Betriebssystemen.

Hangul-Konverter nach McCune-Reischauer

Wenn es in Gesprächen um den Themenkreis “Bibliotheken und Blogs” geht, komme ich oft darauf, dass es so wahsninnig viele Spezialisten in Bibliotheken gibt, die keinen oder kaum fachlichen Austausch haben. Das führt unter anderem dazu, dass Eigenentwicklungen oder neue Ideen den Weg aus der eigenen Institution nur selten finden. Ein sehr gutes Beispiel dafür ist schon nach der ersten Lektion des Web-2.0-Selbstlernkurses Bibliothek 2.009 gefunden. Ein/e TeilnehmerIn widmet sich der CJK-Katalogisierung. Ich musste auch erst nachschlagen, was CJK bedeuten mag. Wikipedia weiß es natürlich.

In diesem Blog findet sich ein Hinweis auf einen selbsterstellten Hangul-Konverter nach McCune-Reischauer. Ich zitiere:

Um kritische Anmerkungen und Kommentare wird ausdrücklich gebeten!

Katalogisierung koreanischer Literatur ist absolut nicht mein Spezialgebiet. Falls sich jedoch jemand aus der Leserschaft angesprochen fühlt: Hier geht’s zur Diskussion.

Online zu PDF/A konvertieren und überprüfen

Neevia bietet einen kostenfreien, web-basierten Dokumentenkonvertierer an. Unterstützt werden zahlreiche Formate der Kategorien Generic Formats (z.B. Adobe PDF oder Adobe PostScript), Word Processing Formats (ASCII Text, ANSI Text, Microsoft RTF, Microsoft Word for PC v2 bis u.a. Microsoft Word for Windows 2000, Microsoft Works, Microsoft Windows Write, WordPerfect), Spreadsheet Formats (Corel QuattroPro, Lotus 1-2-3, Microsoft Excel, Microsoft Works Spreadsheet), Presentation Formats (Lotus Freelance, Microsoft PowerPoint) und Graphic Formats (BMP, GIF, JP2, JPEG, JPG, PGM, PICT, PNG, TIFF und wirklich viele mehr) als Ursprungsdatei. Umgewandelt werden kann in verschiedene graphische Formate und – hier wird es interessant für Gelegenheits-Selbstarchivierer – in PDF/A.

Neevia Document Converter eXpress makes it possible for anyone to instantly convert files to PDF or Image without the need of installing special software.

Das ist richtig, allerdings gibt es eine Begrenzung auf 1 MB pro Datei. Für Aufsätze mit nur wenigen Darstellungen ist das ausreichend, für die Dissertation muss man dann schon zu einer Programminstallation greifen.

Man sollte stets prüfen, ob das erhaltene Dokument auch wirklich dem PDF/A-Standard entspricht. Intarsys bietet einen entsprechenden Online-Check an. Ein von mir testweise mit dem Neevia Document Converter erzeugtes PDF/A bestand den Test ohne Beanstandungen, eine andere Datei (PDF 1.7), die ich zu Vergleichszwecken validieren ließ, erhielt folgende Fehlermeldung:

Document information dictionary ohne korrespondierende XMP-Struktur
Stream Objekt mit ungültigem Endstream
Unkalibrierter Farbraum ohne passenden OutputIntent
Font Times-Bold muss eingebunden sein
Font Helvetica muss eingebunden sein
Font Times-Roman muss eingebunden sein
Font Helvetica-Bold muss eingebunden sein
Font Helvetica-BoldOblique muss eingebunden sein
Font Helvetica-Oblique muss eingebunden sein
Keine gültige PDF/A Versionsinformation vorhanden

Links