HTML-Konvertierung

Die Webservices "URLConverter" und "Converter" ermöglichen die Konvertierung von HTML-Inhalten in das PDF-Format. Die beiden Webservices setzen dafür die Toolbox "wkhtmltopdf" in der Version 0.12.4 ein.

 

Die externe Toolbox befindet sich in dem Unterverzeichnis "wkhtmltopdf/" im Installationsverzeichnis von webPDF.

 

Der Webservice "URLConverter" ermöglicht den Abruf von HTML-Dokumenten über eine URL. Über den Webservice wird der HTML-Inhalt der URL abgerufen, intern aufbereitet und über verschiedene Optionen angepasst. Der so aufbereitete HTML-Inhalt wird mittels der Toolbox in ein PDF-Dokument konvertiert und anschließend über verschiedene Operationen (z.B. PDF/A-Vorbereitung) optimiert.

 

Der "URLConverter" ist in erster Linie für URLs gedacht, über die man die inhaltliche und strukturelle Kontrolle hat, also z.B. die eigene Websites oder eigene Anwendung. Zwar kann mit dem Webservice eine beliebige URL konvertiert werden, allerdings liefert dies nicht immer eine optimale Qualität in der Ausgabe.

 

Der Webservice "Converter" nutzt die Toolbox zur Konvertierung von HTML-Dokumenten die als Datei vorliegen und zur Konvertierung von E-Mails, deren Inhalt auf Basis von HTML definiert ist. Dies ist z.B. bei "MSG" oder "EML" Mail-Nachrichten der Fall.

 

Für beide Webservices gelten die folgenden Anmerkungen in der HTML-Konvertierung:

 

HTML5 und CSS2 wird unterstützt (CSS3 teilweise – z.B. keine "CSS3 Media Queries")

HTML-Inhalt muss <base href=""> haben, um Links aufzulösen

Bei Datei-basierten HTML-Inhalten muss über die Option "baseURL" eine Basis-URL angegeben werden

Bei Datei-basierten HTML-Inhalten werden Bilder als relative URL zur Datei gesucht (es sei denn, es wurde eine "baseURL" gesetzt)

Bei der E-Mail-Konvertierung ist der "Download" aller Bilder als "Default" deaktiviert

Bei HTML-Dokumenten werden alle Bilder herunter geladen

Der Download von Bilder oder die Anpassung von Schriftarten, bezieht sich nur auf den HTML-Inhalt oder eingebetteten CSS-Code. Extern geladene CSS-Dateien (z.B. über "@import") werden nicht angepasst.

Zur Authentifizierung wird aktuell nur "Basic access authentication" unterstützt (siehe URLConverter Parameter)

Es werden keine URLs mit Parametern am Ende unterstützt