PDF-Splitting
Gerhard R., ein international agierender Experte in der Druckvorstufe, schickte mir eine Dokumentation eines Kongresses im PDF-Format. Darin war sein Beitrag enthalten, der die Entwicklung des Scantechnologie für die Zeitungsbranche enthielt. Ich hatte diesen Beitrag von 50 anderen für mich getrennt, weil ich jahrelang für das Unternehmen, in dem Gerhard R. Technischer Leiter war, gearbeitet habe. Mein Split vor 20 Jahren wurde bestaunt.
Aktuell habe ich 50 PDFs mit jeweils 72 Seiten und rund 50 Artikeln gesplittet. Dafür standen drei Programme zur Verfügung: PDF24 (Windows), PDFsam (Linux) und PDFUtils (Android). Mit PDFUtils habe ich den Job schließlich am Tablet in relativ kurzer Zeit geschafft. Die Vorarbeit dazu nahm die meiste Zeit in Anspruch. Per Hand mussten die Beiträge mit Anfang und Ende notiert und dann in eine Textzeile übertragen werden.
3-6,7,8-10,11-13,14-16,17-22,23-28,29-33,34-39,40-47,48-49,50-51,52-53,54-55,56-57,58-59,60-63,64-66,67-68
Die Artikel werden mit fortlaufender Nummerierung erstellt. Nun mus die Nummerierung allerdings durch die Startseite der Artikel ersetzt werden: zB 2023-W_9.pdf durch 2023-W-44.pdf. 2023-W-44 ist ein Datensatz in der Datenbank, die ich für das Projekt eingerichtet habe. Für >1000 Datensätze mit Headline, Subheadline, Autor, Rubrik, Stichworte und Body.
Diese Vorarbeiten dienten einer Internetseite mit Links zu den 40 Heft-PDFs. Für jedes PDF werden die Beiträge gelistet. Falls das gesplittete Artikel-PDF hochgeladen ist, wird es als Link zum Öffnen und Downloaden angeboten. Dafür wird die Funktion "if file_exists" eingesetzt.
Die Suche ist der Vorteil einer Datenbank-Lösung. Das Finden auf dem Server folgt ohne Verzögerung auf Klick und Touch.
Mit 50 Heften ist allerdings nicht mal die Hälfte des Jobs erledigt. Von 100 Heften müssten erst mal PDFs erstellt werden.
© dliste | Impressum | Datenschutz