Nachbearbeitung von E-Books im ePub-Format Teil 1

Die Freeware Stanza Desktop kann aus vielen verschiedenen Quellformaten E-Books im ePub-Format erzeugen. Leider sieht das Ergebnis dann nicht immer besonders gut aus, so dass es unter Umständen sinnvoll sein kann, gewisse Nachbearbeitungen vorzunehmen.

E-Book mit Stanza umwandeln

Die Software Stanza kann hier heruntergeladen werden:

Kostenlose E-Books als Eingabe für Stanza erhält man z.B auf folgenden Webseiten:

  • Buecher-Sucher.de, ein Verzeichnis verschiedener Webseiten, auf denen kostenlose E-Books erhältlich sind,
  • beam, hier habe ich direkt die Kategorie “kostenlos” verlinkt, der Download erfordert eine Anmeldung und
  • Freeware.de, auch hier gibt es einige kostenlose E-Books.

Wenn man sich für ein E-Book entschieden hat und Stanza Desktop installiert hat, dann gelingt das Umwandeln recht einfach, indem man Stanza startet und über den Menüpunkt Datei –> Öffnen ein unterstütztes Dateiformat öffnet.

Im Anschluss klickt man auf Datei –> Export Book as –> ePub und wählt Verzeichnis und Dateiname.

Stanza kann ich derzeit leider nicht empfehlen, weil die Software momentan Probleme beim Öffnen einer Datei macht; der Dialog zum Öffnen erscheint einfach nicht.

E-Book mit Calibre umwandeln

Eine weitere kostenlose Software, mit der man E-Books z.B. aus dem pdf-Format in eine ePub-Datei umwandeln kann, ist calibre. Ich möchte hier hervorheben, dass das nur eine von vielen Funktionen ist, die calibre mitbringt, denn eigentlich ist calibre kein E-Book-Converter sondern vielmehr eine Software, um die eigene E-Book-Bibiliothek zu verwalten.

Wenn ich nun also ein kostenloses E-Book herunterlade – ich habe mich hier für das Buch “Perfekte Verbrächen” [sic] von Richard Stan Brown entschieden – dann kann ich das heruntergeladene pdf-Dokument recht schnell in eine ePub-Datei konvertieren, nämlich durch einen Klick auf Bücher hinzufügen und nach dem Import des Buchs auf konvertiere Bücher:

image_thumb2

Im Dialogfeld, das sich nun öffnet, lässt man einfach die Default-Werte stehen und startet die Konvertierung durch einen Klick auf OK:

image_thumb1

Das Ergebnis findet man am einfachsten, wenn man auf der rechten Seite, unter dem Cover-Bild des Buchs, auf Pfad: Zum Öffnen klicken klickt:

image_thumb

Das Ergebnis ist sicherlich alles andere als hübsch anzusehen, aber wir sind ja hier, um ein ePub in einigen wenigen Schritten nachzubearbeiten.

Um diese Schritte durchführen zu können, muss man zunächst einen Eindruck vom Aufbau einer ePub-Datei gewinnen.

Das ePub-Format

Bei Dateien mit der Endung ePub handelt es sich letzten Endes um ZIP-Archive, denen man einen andere Dateiendung verpasst hat und die eine kleine Besonderheit aufweisen, dazu später mehr, wenn es um das Wiedereinpacken geht.

Wer sich gerne mit der genauen Spezifikation von ePub auseinandersetzen möchte, der kann das auf der Webseite des Internationale Digital Publishing Forum tun.

Nehmen wir also die eben erzeugte ePub-Datei und entpacken sie mit einem Programm wie IZArc, 7Zip, WinZip oder WinRAR in einen Ordner, z.B. den Ordner “ePub”[1]:

image32

Dieses Ergebnis weicht ein “klein” wenig von dem ab, was man in einer ePub-Datei so vorfinden sollte, das sähe nämlich beispielsweise so aus:

image56

In der obersten Verzeichnisebene sollte nicht mehr zu sehen sein als die zwei Verzeichnisse “OEBPS”[2] und “META-INF” sowie die Datei “mimetype”:

image7

Der Inhalt des Verzeichnisses”META-INF” ist ebenfalls wenig spektakulär:

image11

Erst im Verzeichnis OEBPS sollte der eigentliche Inhalt des Buches zu finden sein, dabei sind einige der vorgefundenen Objekte optional:

image16

Der eigentliche Inhalt des Buches, also der Text, befindet sich in den xhtml-Dateien. Ich habe mir angewöhnt, die einzelnen Kapitel jeweils in eine eigene Datei zu speichern und diese mit dem Kurznamen des Buches und einer zweistelligen Kapitelbezeichnung zu versehen. Die Buchteile, die auf _k00a, _k00b usw. enden, beinhalten den Einband, Vorworte, Inhaltsverzeichnisse und alles, was sonst noch vor dem ersten Kapitel in einem Buch vorkommen.

In “toc.ncx” befindet sich Angaben zur Erzeugung eines navigierbaren Inhaltsverzeichnisses. Die Dateiendung “ncx” steht für Navigation Controlfile for XML.

Die Datei “content.opf” schließlich enthält alle wichtigen Metadaten des Buches, listet dessen Inhalt auf und legt die Reihenfolge der Inhalte fest.

In der Datei “style.css” befinden sich wie zu erwarten die Style-Informationen für die xhtml-Dateien.

Die Verzeichnisse “fonts” und “images” sind optional und enthalten eingebettete Schriftarten und Bilder, z.B. das für den Einband.

Sehr wichtig ist, dass alle diese Dateien in UTF-8 kodiert sein müssen, damit sie von allen E-Book-Readern korrekt angezeigt werden.

Ich werde zur Bearbeitung der Dateien das Programm Notepad++ verwenden, was zwei wesentliche Gründe hat:

  1. Notepad++ kann für Textoperationen wie Suchen und Ersetzen sogenannte reguläre Ausdrücke anwenden[3] und
  2. Notepad++ kann nicht nur unterschiedliche Textkodierungen anzeigen sondern auch umwandeln.
Ordner aufräumen

Da das Beispiel sehr unaufgeräumt ist, wird nun zuerst dieser Umstand bereinigt:

  • Erstellen eines Ordners “OEBPS” im gleichen Verzeichnis, in dem auch der Ordner “META-INF” liegt und
  • Verschieben aller Dateien bis auf die Datei “mimetype” in den neuen Ordner

So sollte nun das Ergebnis aussehen:

image58

Hier finde ich auch noch einige Unschönheiten, z.B. gehören Bilder in ein eigenes Unterverzeichnis “images” und das Bild “index-1_1.png” wird in diesem Buch überhaupt nicht gebraucht:

  • Erstellen eines Ordners “images”,
  • Verschieben der Datei “cover.jpeg” in den Ordner “images” und
  • Löschen der Datei “index-1_1.png”

Nun ist schon eine gewisse Ordnung hergestellt und ich kann mit den eigentlichen Arbeiten anfangen:

image57

Die Datei mimetype

Diese Datei ist die einfachste aller Dateien innerhalb des ePub-Archivs, sie besteht nur aus einer einzigen Zeile, die auch bei jedem E-Book gleich ist:

application/epub+zip

Diese Zeile darf nach der Eingabe im Texteditor nicht mit einem Betätigen der Entertaste abgeschlossen werden.

Wenn ich die Datei “mimetype” des Beispiels in Notepad++ öffne, stelle ich schnell fest, dass sie falsch kodiert ist:

image59

Anhand des oben dargestellten Menüs in Notepad++ ist auch schnell ersichtlich, wie man die Kodierung feststellt und wie man sie ändert. Ich klicke auf “Konvertiere zu UTF-8” und speichere die Datei.

Diese Überprüfung sollte man bei jeder Datei des ePub-Archivs durchführen.

Die Datei container.xml

Innerhalb des Ordners “META-INF” befindet sich nur eine einzige Datei “container.xml”. Diese Datei sollte bei jedem E-Book im ePub-Format nahezu gleich aussehen, der einzige Unterschied liegt in der 5. Zeile, die den vollständigen Pfad zum Herzstück des ePub-Archivs, der Datei content.opf angibt:

<?xml version="1.0"?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="content.opf"
media-type="application/oebps-package+xml"/>
</rootfiles>
</container>

Durch die Aufräumarbeiten in einem der vorhergehenden Schritte stimmt die Pfadangabe in der 5. Zeile nicht mehr, daher passe ich diese an:

<rootfile full-path="OEBPS/content.opf"
media-type="application/oebps-package+xml"/>

Wie bei allen Dateien muss hier die Kodierung geprüft und eventuell angepasst werden.

Hier beende ich den ersten Teil des Beitrags über E-Book-Nachbearbeitung, im kommenden Teil werde ich mich mit den XHTML-Dateien beschäftigen.

An Fragen, Anregungen und Kritik bin ich sehr interessiert, insbesondere interessiert mich, ob meine Anleitung eher zu ausführlich oder zu kurz gefasst und damit schwer verständlich ist.

  1. In der Grafik fällt auf, dass ich einen Unterordner “1” verwende. Ich verwende nummerierte Unterordner für jeden größeren Schritt, damit ich so etwas wie eine manuelle lokale Versionierung habe, d.h. ich kann nach größeren Änderungen jedes Mal zurückgehen. []
  2. Open eBook Publication Structure []
  3. Eine nützliche Einführung findet man auf der Webseite von Daniel Fett []
Veröffentlicht unter Informationstechnik | Verschlagwortet mit , , , | Hinterlasse einen Kommentar

E-Books auf dem iPhone genießen

Ich lese relativ viel auf dem iPhone, das habe ich schon auf dem N97 getan und daran soll sich nichts ändern. Lesen bildet bekanntlich und das iPhone hat man ja immer dabei, wenn man gerade mal wieder irgendwo warten muss oder im Bus bzw. Zug sitzt.

E-Books können auf dem iPhone mit der kostenlosen App iBooks gelesen werden, allerdings nur, wenn sie im vorgeschriebenen Format ePub vorliegen. Natürlich könnte man auch pdf-Dateien lesen, aber dabei geht einiges an Komfort verloren, den iBooks bietet (wie z.B. das Englisch-Englisch Lexikon).

ePub-Converter

Ein wenig Recherche nach Programmen, um ePub-Dateien herzustellen, brachte mich auf die kostenlose Software ePub Converter. Die hiermit erzielten Ergebnisse waren allerdings eher enttäuschend, da aus reinem Fließtext irgendetwas Undefinierbares mit zweifachem Zeilenabstand wurde.

Stanza

Der nächste Versuch galt der Kombination von Stanza for iPhone und dem zugehörigen Stanza Desktop.

Der Downloadlink für Stanza Desktop verbirgt sich gut getarnt an der rechten Seite, hinter dem jeweiligen Betriebssystemsymbol:

image

Stanza for iPhone gibt es selbstverständlich im AppStore.

Während der Installation der Desktop-Komponente wurde ich darauf hingewiesen, dass ich Apples Netzwerkprotokoll Bonjour mitinstallieren müsse, um E-Books drahtlos vom Desktop auf das iPhone übertragen zu können.

Mein erster Versuch der Konvertierung galt der offiziellen Anleitung des iPhones im pdf-Format, die auch gleich gründlich schief ging. Bilder und Grafiken bereiten anscheinend Schwierigkeiten.

Wesentlicher sind ohnehin Bücher, die rein textueller Natur sind, also habe ich mal zwei Bücher, die es mal irgendwo kostenlos zum Download gab, der Konvertierung zugeführt und war mit dem Ergebnis zufrieden.

Die Verarbeitungszeit fällt kaum ins Gewicht, nur ab einer gewissen Seitenzahl streikt die Software:

15.000 Seiten “Lorem-Ipsum” führten zu einem genervten “Out-of-Memory-Error”.

Die drahtlose Synchronisation ließ sich nicht so richtig dazu überreden, ihre Dienste zu leisten, woraufhin ich mir dachte, dass ich ja nun Dateien im Format für iBooks habe, also warum nicht dort lesen?

Die Synchronisation von ePub-Dateien geschieht über iTunes[1] und klappt problemlos. Der einzige Haken ist, dass teilweise die Informationen wie Titel, Autor und Deckblatt auf der Strecke bleiben, diese kann man jedoch mit einem Rechtsklick und dem Kontextmenüeintrag Informationen korrigieren. Dort lässt sich sowohl der Titel und der Autorenname anpassen, als auch ein Titelbild hinzufügen.

Fazit

Stanza for iPhone braucht man eigentlich nicht, weil die ePub-Bücher in iBooks lesbar sind. Eventuell gibt es Komfortfunktionen in Stanza, die ich im Moment nicht brauche. Die Konvertierung funktioniert ausreichend gut, um Bücher, die im pdf-, doc-, oder anderen Formaten vorliegen zu konvertieren.

Das Ergebnis, das Stanza abliefert ist allerdings alles andere als schön, z.B. gibt es unnötig breite Seitenränder, so dass ich als Folge zu diesem Artikel einen mehrteilige Anleitung zur Überarbeitung bzw. zum Erstellen von ePub-Dateien veröffentlichen werde.

  1. Worüber auch sonst? []
Veröffentlicht unter Handy | Verschlagwortet mit , , , , | 2 Kommentare

Mit dem Rad zur Arbeit

Nachdem ich nun von Juni 2010 an mit dem Bus zur Arbeit nach Lahnstein gefahren bin und davor schon viereinhalb Jahre zur Uni, habe ich mir vor drei Wochen überlegt, dass ich nicht mehr die geringste Lust habe, den örtlichen Verkehrsbetrieben für jede Fahrt bis zu 3,15 Euro in den Rachen zu werfen.

Die Hauptgründe für meinen Ärger sind:

  • Busfahrer, die glauben, dass sie einen Krankenwagen fahren (zumindest lassen Tempo und Kurvenverhalten auf so etwas schließen),
  • Busfahrer, die ein Gesicht ziehen, als ob man sie zur Arbeit zwänge und die dementsprechend unfreundlich sind,
  • Busfahrer, die kurz vor einer Bushaltestelle entscheiden, doch anzuhalten und entsprechende Vollbremsungen hinlegen,
  • Busfahrer, die glauben, sie hätten einen Erziehungsauftrag im Straßenverkehr,
  • Busfahrer, die immer wieder gegen den gleichen Bordstein in der Goldgrube fahren, so dass ich mir mehrfach den Kopf gestoßen habe,
  • Busfahrer, die der Meinung sind, dass das Verbot von Handys am Steuer nur für die anderen gilt, die nicht so gut fahren können,
  • Busfahrer, die zu früh an die Haltestelle kommen und mir dann vor der Nase wegfahren und
  • Busse, die gar nicht kommen – da wartet man dann schon einmal zwei Stunden[1].

Es ist offensichtlich, hier rechne ich mit 5 Jahren ÖPNV Koblenz ab, doch muss ich ergänzen: Es gibt Ausnahmen, die allerdings so selten sind, dass ich den entsprechenden Fahrer(inne)n immer persönlich gesagt habe, dass sie wirklich sehr gut gefahren sind.

Aber nun habe ich ja auch nicht mehr vor, für eine in der Gesamtansicht mangelhafte und überteuerte Dienstleistung zu bezahlen, denn:

Am 13. Mai 2011 habe ich meinen inneren Schweinehund überwunden, mich aufs Fahrrad gesetzt und bin die Strecke nach Lahnstein zur Arbeit geradelt.

imageDer Anfang war hart und im Sitzbereich auch schmerzhaft, zumal die Strecke am Ende einen für Anfänger bitterböse Berg bereit hält (s.rechts) dennoch habe ich mich nach kurzem daran gewöhnt und freue mich nun morgens regelrecht auf die Fahrt.

Außerdem tue ich so noch etwas für meine Gesundheit und ich merke schon, dass ich wesentlich seltener so eine Tiefphase kriege, in der ich mich am Liebsten schlafen legen möchte.

Und es gibt noch einen Vorteil: Wenn es im Sommer so richtig schön warm ist, dann macht es einen Riesenspaß, den blöden Berg runter zu düsen und sich den Fahrtwind um die Nase wehen zu lassen.

Heute bin ich dann auf eine Aktion der AOK aufmerksam geworden, bei der ich mit meiner Radelei auch noch etwas gewinnen kann:

Mit dem Rad zur Arbeit

Nun denn, aufs Pferd Kamerad!

  1. das habe ich schriftlich []
Veröffentlicht unter Allgemein | Hinterlasse einen Kommentar

Nobody’s perfect

Unter diesem Motto habe ich neulich mal schnell nachschlagen wollen, wo denn genau der Unterschied zwischen den beiden oft strapazierten Worten dezidiert und dediziert liegt, denn ich war mir bald selber nicht mehr sicher. Unwissenheit ist ja keine Schande, so lange man etwas dagegen tut.

Bei dieser Gelegenheit habe ich eine sehr schöne Webseite gefunden, die ich hiermit weiterempfehlen möchte:

image

Veröffentlicht unter Allgemein, Internet | Verschlagwortet mit , | Hinterlasse einen Kommentar

Das ist viel zu sicher

image

Wenn eine Anwendung bei Facebook so etwas fragt, dann weiß ich, dass ich diese Anwendung mit Sicherheit nicht verwenden möchte…

Veröffentlicht unter Informationssicherheit | Verschlagwortet mit | Hinterlasse einen Kommentar