Gerhard R., ein international agierender Experte in der Druckvorstufe, schickte mir eine Dokumentation eines Kongresses im PDF-Format. Darin war sein Beitrag enthalten, der die Entwicklung des Scantechnologie für die Zeitungsbranche enthielt. Ich hatte diesen Beitrag von 50 anderen für mich getrennt, weil ich jahrelang für das Unternehmen, in dem Gerhard R. Technischer Leiter war, gearbeitet habe. Mein Split vor 20 Jahren wurde bestaunt.
Aktuell habe ich 40 PDFs mit jeweils 72 Seiten und rund 50 Beiträgen gesplittet. Dafür standen drei Programme zur Verfügung: PDF24 (Windows), PDFsam (Linux) und PDFUtils (Android). Mit PDFUtils habe ich den Job schließlich am Tablet in relativ kurzer Zeit geschafft. Die Vorarbeit dazu nahm die meiste Zeit in Anspruch. Per Hand mussten die Beiträge mit Anfang und Ende notiert und dann in eine Textzeile übertragen werden.
3-6,7,8-10,11-13,14-16,17-22,23-28,29-33,34-39,40-47,48-49,50-51,52-53,54-55,56-57,58-59,60-63,64-66,67-68 (Beitrag ...,anfang-ende,... in einer Zeile)
Zeile für Zeile von PDF für PDF wurden in PDFUtils kopiert, das die Beiträge dann mit fortlaufender Nummerierung ausgab. Nun musste die Nummerierung allerdings durch die Startseite der Beiträge ersetzt werden: zB 2023-Winter_9.pdf durch 2023-Winter-44.pdf.
2023-Winter-44 ist ein Datensatz in einer Datenbank, die ich für das Projekt eingerichtet habe für >1000 Datensätze mit Headline, Subheadline, Autor, Rubrik, Stichworte und Body.
Diese Vorarbeiten dienten einer Internetseite mit Links zu den 40 PDFs. Für jedes PDF werden die Beiträge gelistet. Falls das gesplittete Beitrags-PDF hochgeladen ist, wird es als Link zum Öffnen und Downloaden angeboten. Dafür wird die Funktion "if file_exists" eingesetzt. Wenn also 2023-Winter-34.pdf für den Beitrag 2023-Winter-34 existiert, wird geliefert.
Die Suche ist der Vorteil einer Datenbank-Lösung. Das Finden auf dem Server folgt ohne Verzögerung auf Klick und Touch.
Mit 40 PDFs ist allerdings nicht mal die Hälfte des Jobs erledigt. Von >100 Heften müssten erst mal (maschinell) Scans für PDFs geliefert werden.
© dliste | Impressum | Datenschutz