Automatisiert Webseiten als PDF speichern…

29. Januar 2010

…brau­che ich jetzt zwar gerade nicht, denke mir aber, dass es viel­leicht irgend­wann mal nütz­lich sein könnte.

Des­halb beschreibe ich an die­ser Stelle kurz die Web­seite http://pdfmyurl.com über die man ein PDF einer Web­seite erstel­len kann. Das finde ich zwar zunächst mal eher lang­wei­lig, schließ­lich haben wir wohl so ziem­lich alle einen PDF-Druckertreiber auf unse­ren Com­pu­tern instal­liert. Span­nend hin­ge­gen finde ich, dass man pdfmyurl.com auch mit Para­me­tern auf­ru­fen kann, und dass die­ser Auf­ruf freund­li­cher­weise auch von wget gedul­det wird. Dies ent­nehme ich der Beschrei­bung der Advan­ced Opti­ons, in denen es heißt:

How to use on your server
Synopsis (the first -O <filename> is wget's own output file option):
  wget -O opentracker.pdf "pdfmyurl.com?url=www.opentracker.net&-O=Landscape&--header-left=hello"

Es wird also aus­drück­lich die Mög­lich­keit zum Auf­ruf mit­tels wget und damit die Basis zu einer ele­gan­ten Auto­ma­ti­sie­rung per CRON beschrie­ben.
Zahl­rei­che Para­me­ter wie z.B.

-t, --toc                           Insert a table of content in the beginning
                                     of the document
  --print-media-type              Use print media-type instead of screen

ermög­li­chen das Aus­se­hen der PDF anzu­pas­sen.
Lei­der gibt es mit Umlau­ten in URLs Probleme.

Nun fehlt mir nur noch eine gute Idee, was man damit sinn­vol­les anstel­len könnte ;-)

Eine Antwort hinterlassen