Highslide for Wordpress Plugin

Archiv für das Tag 'E-Book'

Die Freeware Stanza Desktop kann aus vielen verschiedenen Quellformaten E-Books im ePub-Format erzeugen. Leider sieht das Ergebnis dann nicht immer besonders gut aus, so dass es unter Umständen sinnvoll sein kann, gewisse Nachbearbeitungen vorzunehmen.

E-Book mit Stanza umwandeln

Die Software Stanza kann hier heruntergeladen werden:

Kostenlose E-Books als Eingabe für Stanza erhält man z.B auf folgenden Webseiten:

  • Buecher-Sucher.de, ein Verzeichnis verschiedener Webseiten, auf denen kostenlose E-Books erhältlich sind,
  • beam, hier habe ich direkt die Kategorie “kostenlos” verlinkt, der Download erfordert eine Anmeldung und
  • Freeware.de, auch hier gibt es einige kostenlose E-Books.

Wenn man sich für ein E-Book entschieden hat und Stanza Desktop installiert hat, dann gelingt das Umwandeln recht einfach, indem man Stanza startet und über den Menüpunkt Datei –> Öffnen ein unterstütztes Dateiformat öffnet.

Im Anschluss klickt man auf Datei –> Export Book as –> ePub und wählt Verzeichnis und Dateiname.

Stanza kann ich derzeit leider nicht empfehlen, weil die Software momentan Probleme beim Öffnen einer Datei macht; der Dialog zum Öffnen erscheint einfach nicht.

E-Book mit Calibre umwandeln

Eine weitere kostenlose Software, mit der man E-Books z.B. aus dem pdf-Format in eine ePub-Datei umwandeln kann, ist calibre. Ich möchte hier hervorheben, dass das nur eine von vielen Funktionen ist, die calibre mitbringt, denn eigentlich ist calibre kein E-Book-Converter sondern vielmehr eine Software, um die eigene E-Book-Bibiliothek zu verwalten.

Wenn ich nun also ein kostenloses E-Book herunterlade – ich habe mich hier für das Buch “Perfekte Verbrächen” [sic] von Richard Stan Brown entschieden – dann kann ich das heruntergeladene pdf-Dokument recht schnell in eine ePub-Datei konvertieren, nämlich durch einen Klick auf Bücher hinzufügen und nach dem Import des Buchs auf konvertiere Bücher:

image_thumb2

Im Dialogfeld, das sich nun öffnet, lässt man einfach die Default-Werte stehen und startet die Konvertierung durch einen Klick auf OK:

image_thumb1

Das Ergebnis findet man am einfachsten, wenn man auf der rechten Seite, unter dem Cover-Bild des Buchs, auf Pfad: Zum Öffnen klicken klickt:

image_thumb

Das Ergebnis ist sicherlich alles andere als hübsch anzusehen, aber wir sind ja hier, um ein ePub in einigen wenigen Schritten nachzubearbeiten.

Um diese Schritte durchführen zu können, muss man zunächst einen Eindruck vom Aufbau einer ePub-Datei gewinnen.

Das ePub-Format

Bei Dateien mit der Endung ePub handelt es sich letzten Endes um ZIP-Archive, denen man einen andere Dateiendung verpasst hat und die eine kleine Besonderheit aufweisen, dazu später mehr, wenn es um das Wiedereinpacken geht.

Wer sich gerne mit der genauen Spezifikation von ePub auseinandersetzen möchte, der kann das auf der Webseite des Internationale Digital Publishing Forum tun.

Nehmen wir also die eben erzeugte ePub-Datei und entpacken sie mit einem Programm wie IZArc, 7Zip, WinZip oder WinRAR in einen Ordner, z.B. den Ordner “ePub”[1]:

image32

Dieses Ergebnis weicht ein “klein” wenig von dem ab, was man in einer ePub-Datei so vorfinden sollte, das sähe nämlich beispielsweise so aus:

image56

In der obersten Verzeichnisebene sollte nicht mehr zu sehen sein als die zwei Verzeichnisse “OEBPS”[2] und “META-INF” sowie die Datei “mimetype”:

image7

Der Inhalt des Verzeichnisses”META-INF” ist ebenfalls wenig spektakulär:

image11

Erst im Verzeichnis OEBPS sollte der eigentliche Inhalt des Buches zu finden sein, dabei sind einige der vorgefundenen Objekte optional:

image16

Der eigentliche Inhalt des Buches, also der Text, befindet sich in den xhtml-Dateien. Ich habe mir angewöhnt, die einzelnen Kapitel jeweils in eine eigene Datei zu speichern und diese mit dem Kurznamen des Buches und einer zweistelligen Kapitelbezeichnung zu versehen. Die Buchteile, die auf _k00a, _k00b usw. enden, beinhalten den Einband, Vorworte, Inhaltsverzeichnisse und alles, was sonst noch vor dem ersten Kapitel in einem Buch vorkommen.

In “toc.ncx” befindet sich Angaben zur Erzeugung eines navigierbaren Inhaltsverzeichnisses. Die Dateiendung “ncx” steht für Navigation Controlfile for XML.

Die Datei “content.opf” schließlich enthält alle wichtigen Metadaten des Buches, listet dessen Inhalt auf und legt die Reihenfolge der Inhalte fest.

In der Datei “style.css” befinden sich wie zu erwarten die Style-Informationen für die xhtml-Dateien.

Die Verzeichnisse “fonts” und “images” sind optional und enthalten eingebettete Schriftarten und Bilder, z.B. das für den Einband.

Sehr wichtig ist, dass alle diese Dateien in UTF-8 kodiert sein müssen, damit sie von allen E-Book-Readern korrekt angezeigt werden.

Ich werde zur Bearbeitung der Dateien das Programm Notepad++ verwenden, was zwei wesentliche Gründe hat:

  1. Notepad++ kann für Textoperationen wie Suchen und Ersetzen sogenannte reguläre Ausdrücke anwenden[3] und
  2. Notepad++ kann nicht nur unterschiedliche Textkodierungen anzeigen sondern auch umwandeln.
Ordner aufräumen

Da das Beispiel sehr unaufgeräumt ist, wird nun zuerst dieser Umstand bereinigt:

  • Erstellen eines Ordners “OEBPS” im gleichen Verzeichnis, in dem auch der Ordner “META-INF” liegt und
  • Verschieben aller Dateien bis auf die Datei “mimetype” in den neuen Ordner

So sollte nun das Ergebnis aussehen:

image58

Hier finde ich auch noch einige Unschönheiten, z.B. gehören Bilder in ein eigenes Unterverzeichnis “images” und das Bild “index-1_1.png” wird in diesem Buch überhaupt nicht gebraucht:

  • Erstellen eines Ordners “images”,
  • Verschieben der Datei “cover.jpeg” in den Ordner “images” und
  • Löschen der Datei “index-1_1.png”

Nun ist schon eine gewisse Ordnung hergestellt und ich kann mit den eigentlichen Arbeiten anfangen:

image57

Die Datei mimetype

Diese Datei ist die einfachste aller Dateien innerhalb des ePub-Archivs, sie besteht nur aus einer einzigen Zeile, die auch bei jedem E-Book gleich ist:

application/epub+zip

Diese Zeile darf nach der Eingabe im Texteditor nicht mit einem Betätigen der Entertaste abgeschlossen werden.

Wenn ich die Datei “mimetype” des Beispiels in Notepad++ öffne, stelle ich schnell fest, dass sie falsch kodiert ist:

image59

Anhand des oben dargestellten Menüs in Notepad++ ist auch schnell ersichtlich, wie man die Kodierung feststellt und wie man sie ändert. Ich klicke auf “Konvertiere zu UTF-8” und speichere die Datei.

Diese Überprüfung sollte man bei jeder Datei des ePub-Archivs durchführen.

Die Datei container.xml

Innerhalb des Ordners “META-INF” befindet sich nur eine einzige Datei “container.xml”. Diese Datei sollte bei jedem E-Book im ePub-Format nahezu gleich aussehen, der einzige Unterschied liegt in der 5. Zeile, die den vollständigen Pfad zum Herzstück des ePub-Archivs, der Datei content.opf angibt:

<?xml version="1.0"?>
<container version="1.0" xmlns="urn:oasis:names:tc:opendocument:xmlns:container">
<rootfiles>
<rootfile full-path="content.opf"
media-type="application/oebps-package+xml"/>
</rootfiles>
</container>

Durch die Aufräumarbeiten in einem der vorhergehenden Schritte stimmt die Pfadangabe in der 5. Zeile nicht mehr, daher passe ich diese an:

<rootfile full-path="OEBPS/content.opf"
media-type="application/oebps-package+xml"/>

Wie bei allen Dateien muss hier die Kodierung geprüft und eventuell angepasst werden.

Hier beende ich den ersten Teil des Beitrags über E-Book-Nachbearbeitung, im kommenden Teil werde ich mich mit den XHTML-Dateien beschäftigen.

An Fragen, Anregungen und Kritik bin ich sehr interessiert, insbesondere interessiert mich, ob meine Anleitung eher zu ausführlich oder zu kurz gefasst und damit schwer verständlich ist.

  1. In der Grafik fällt auf, dass ich einen Unterordner “1” verwende. Ich verwende nummerierte Unterordner für jeden größeren Schritt, damit ich so etwas wie eine manuelle lokale Versionierung habe, d.h. ich kann nach größeren Änderungen jedes Mal zurückgehen. []
  2. Open eBook Publication Structure []
  3. Eine nützliche Einführung findet man auf der Webseite von Daniel Fett []

Ich lese relativ viel auf dem iPhone, das habe ich schon auf dem N97 getan und daran soll sich nichts ändern. Lesen bildet bekanntlich und das iPhone hat man ja immer dabei, wenn man gerade mal wieder irgendwo warten muss oder im Bus bzw. Zug sitzt.

E-Books können auf dem iPhone mit der kostenlosen App iBooks gelesen werden, allerdings nur, wenn sie im vorgeschriebenen Format ePub vorliegen. Natürlich könnte man auch pdf-Dateien lesen, aber dabei geht einiges an Komfort verloren, den iBooks bietet (wie z.B. das Englisch-Englisch Lexikon).

ePub-Converter

Ein wenig Recherche nach Programmen, um ePub-Dateien herzustellen, brachte mich auf die kostenlose Software ePub Converter. Die hiermit erzielten Ergebnisse waren allerdings eher enttäuschend, da aus reinem Fließtext irgendetwas Undefinierbares mit zweifachem Zeilenabstand wurde.

Stanza

Der nächste Versuch galt der Kombination von Stanza for iPhone und dem zugehörigen Stanza Desktop.

Der Downloadlink für Stanza Desktop verbirgt sich gut getarnt an der rechten Seite, hinter dem jeweiligen Betriebssystemsymbol:

image

Stanza for iPhone gibt es selbstverständlich im AppStore.

Während der Installation der Desktop-Komponente wurde ich darauf hingewiesen, dass ich Apples Netzwerkprotokoll Bonjour mitinstallieren müsse, um E-Books drahtlos vom Desktop auf das iPhone übertragen zu können.

Mein erster Versuch der Konvertierung galt der offiziellen Anleitung des iPhones im pdf-Format, die auch gleich gründlich schief ging. Bilder und Grafiken bereiten anscheinend Schwierigkeiten.

Wesentlicher sind ohnehin Bücher, die rein textueller Natur sind, also habe ich mal zwei Bücher, die es mal irgendwo kostenlos zum Download gab, der Konvertierung zugeführt und war mit dem Ergebnis zufrieden.

Die Verarbeitungszeit fällt kaum ins Gewicht, nur ab einer gewissen Seitenzahl streikt die Software:

15.000 Seiten “Lorem-Ipsum” führten zu einem genervten “Out-of-Memory-Error”.

Die drahtlose Synchronisation ließ sich nicht so richtig dazu überreden, ihre Dienste zu leisten, woraufhin ich mir dachte, dass ich ja nun Dateien im Format für iBooks habe, also warum nicht dort lesen?

Die Synchronisation von ePub-Dateien geschieht über iTunes[1] und klappt problemlos. Der einzige Haken ist, dass teilweise die Informationen wie Titel, Autor und Deckblatt auf der Strecke bleiben, diese kann man jedoch mit einem Rechtsklick und dem Kontextmenüeintrag Informationen korrigieren. Dort lässt sich sowohl der Titel und der Autorenname anpassen, als auch ein Titelbild hinzufügen.

Fazit

Stanza for iPhone braucht man eigentlich nicht, weil die ePub-Bücher in iBooks lesbar sind. Eventuell gibt es Komfortfunktionen in Stanza, die ich im Moment nicht brauche. Die Konvertierung funktioniert ausreichend gut, um Bücher, die im pdf-, doc-, oder anderen Formaten vorliegen zu konvertieren.

Das Ergebnis, das Stanza abliefert ist allerdings alles andere als schön, z.B. gibt es unnötig breite Seitenränder, so dass ich als Folge zu diesem Artikel einen mehrteilige Anleitung zur Überarbeitung bzw. zum Erstellen von ePub-Dateien veröffentlichen werde.

  1. Worüber auch sonst? []

Bereits vor einiger Zeit hatte ich ein Erlebnis zum Thema E-Books, das mir erst heute wieder einfiel, als ich den heise-Ticker las.

Im Artikel geht es um höhere Preise für E-Books bei Amazon, alles in allem ein eher uninteressanter Artikel, der im dritten Absatz auch erklärt, dass diese Nachricht für Deutschland uninteressant ist, weil wir ja die Buchpreisbindung haben.

Die Buchpreisbindung richtet sich nach dem Buchpreisbindungsgesetz, in dem unter anderem festgehalten ist, dass in Deutschland auch alle Reproduktionen oder Substitutionen von Büchern [...] der Buchpreisbindung unterliegen ($2, Abs1).

imageDamit hätte ich ja noch leben können, als ich mir vor zwei oder drei Jahren mein erstes E-Book von O’Reilly kaufte.

Es handelte sich um diesen (s. rechts) Titel, bei dem ich mir vorher überlegte, ob es eher sinnvoll wäre, das Buch im Regal stehen zu haben, oder es immer dabei zu haben, um entsprechend nachschlagen zu können.

Die Entscheidung fiel klar für das “immer-dabei-haben” und damit für ein E-Book im pdf-Format aus, zumal ich, dank des Besitzes einer Vollversion von Adobe Acrobat Professional, pdf-Dateien durch Lesezeichen, Notizen und Hervorhebungen verbessern kann.

Der Kauf war schnell getätigt, das Buch fast genauso schnell heruntergeladen und ich begann, Perl zu lernen.

Wie groß war doch meine Enttäuschung, als ich feststellen musste, dass ich ein E-Book zum Preis eines gedruckten Exemplars gekauft hatte, in dem es mir jedoch durch digitale Schutzmaßnahmen unmöglich gemacht worden war, irgendeine Art von Bearbeitung vorzunehmen.

Mit der gedruckten Ausgabe wäre ich hier wesentlich weiter gekommen, denn da verbietet mir niemand das Arbeiten mit dem Textmarker oder Selbstklebetabs.

Hierbei handelt es sich in meinen Augen um echte Kundengängelei, die in meinem Fall dazu führte, dass ich bislang kein einziges E-Book der Kategorie Fachbücher mehr gekauft habe.

Denn der zweite Pferdefuß ist, dass man das Buch, z.B. nach abgeschlossener Prüfung, nicht weiterverkaufen darf.

Gleicher Preis, weniger Leistung, weniger Rechte[1] – ein tolles Modell. Danke, lieber Gesetzgeber, dass die Verbraucher in ihren Interessen wieder einmal hinter denen der Großverdiener kommen.

Es ist ja auch kein Wunder, schließlich stellt die Gruppe der Verlage und der Drumherumverdiener ja eine wesentlich größere das, als die der E-Book-Leser…


[1] - Auf der Webseite von O’Reilly kostet das E-Book heutzutage “nur” 28,- Euro gegenüber den 38,- Euro, die man für die gedruckte Ausgabe aufwenden muss

Vor gut einer Woche flatterte der monatliche Microsoft Newsletter in die Inbox, betitelt mit “Microsoft News November 2009 – Windows 7 hautnah erleben”.
Da ich das Erlebnis ja schon einige Wochen vorher gehabt hatte, schob ich das Lesen immer wieder auf, an diesem Wochenende aber schaute ich endlich mal rein.
Unter der Überschrift Windows 7 war Ihre Idee gelangt man zu einer Webseite von Microsoft, die weitere Ressourcen anpreist, unter anderem E-Books für einen schnellern Einstieg in Windows 7 bei e-load24.
Da ich sowieso mit dem Gedanken spielte, mir etwas Gedrucktes zu dem Thema zuzulegen, dachte ich mir, dass eine Empfehlung von Microsoft mir die Sucherei ersparen könnte.
Die Ergebnisseite bei eload24 zeigt mehrere kurze Dokumente zwischen 16 und 59 Seiten, zu Preisen zwischen 2,95 und 5,95 Euro – ziemlich teuer, wenn man bedenkt, dass auf diese Weise jede Seite etwa -,20 Euro kostet.

Zum Vergleich: Mein teuerstes Informatikfachbuch, Pooles Computational Intelligence, kostet im Moment rund 66,- Euro bei 576 Seiten, das sind 11 Cent. Immer noch teuer, aber renommiert.
Ich habe in den teuren Apfel gebissen und mir einige der Bücher zugelegt, alle vom Autor Mirko Müller:

  • Windows 7 – Das bringt es, das ist neu für 5,95
  • Windows 7 installieren, einrichten, konfigurieren für 3,95
  • Windows 7 im Netzwerk für 3,95
  • Windows 7: Programme und Daten absichern für 4,95

Das erste Buch war ein Kulturschock, hier fand ich im Prinzip Werbung und andere Inhalte, die ich eher auf der Microsoft-Webseite zu Windows 7 vermutet hätte. Außerdem ist dieses Buch, so wie alle anderen, durch die Werbung auf den letzten beiden Seiten, kürzer als angegeben. Ist so etwas legal?

Vier Bücher, je eine Seite weniger, als bezahlt, ergibt unter dem Strich etwa 80 Cent Verlust, Schwund oder was auch immer.

Was gibt es über den Inhalt sonst zu berichten? Nicht viel, hier steht nichts, was man nicht in HowTo’s und Whitepapers im Netz findet – dort übrigens kostenlos. Das groß und breit erklärte Einrichten der Heimnetzgruppe wird von Microsoft sogar sehr anschaulich und ebenfalls kostenlos in einem Video erklärt.

Interessant ist aber immerhin der Vergleich der Leistungsfähigkeit bei bestimmter Bestückung mit Arbeitsspeicher zwischen Windows 7 und Windows 7 [sic] auf Seite 8 des ersten Dokuments (den Begriff Buch möchte ich hier einfach nicht mehr verwenden – das täte mir weh).
[Update:] Der Fehler ist anscheinend in aktuelleren Versionen des Dokuments behoben.
Der Begriff Firewall wurde hier auch mal sehr wörtlich mit Feuerschutzwand übersetzt. Ich gebe mal einen kleinen Steilpass: Firewall bedeutet Brandschutzmauer – diesen Begriff kennt das Zielpublikum vielleicht ;-)
Ach ja, Zielpublikum… Nachdem ich die großartige Qualität der Werke bestaunt hatte, wollte ich doch einmal wissen, wer denn da mit welcher Qualifikation geschrieben hat und stieß auf die Webseite von Mirko Müller – freier Journalist und Fachbuchautor.
Ist das der gleiche? Müller ist ja schließlich kein Nachname sondern mehr so ein Sammelbegriff…

Zu finden sind viele Bücher, deren Hauptzielgruppe anscheinend Rentner und Computerbild-Leser sind. Jetzt ist mir auch klar, warum ich mit den Dokumenten nichts anfangen kann…

Ein Punkt am Rande:
Dort steht unter einem Buch, dass Herr Mirko Müller Geschäftsführer der Valudo AG ist, die anscheinend keinen guten Ruf in der Netzgemeinde hat – der geneigte Leser möge sich sein eigenes Bild machen, wenn er das Ergebnis dieser Google-Suche mal durchblättert…

Mein Fazit ist und das möchte ich mit den Worten von Stefan Raab ausdrücken:

Gehen Sie in das Geschäft und kaufen Sie … ein anderes Buch.