Einbinden und Konfigurieren des Foxit PDF Compressors (PDFC)

Geändert am Di, 25 Apr, 2023 um 12:01 NACHMITTAGS

Der Foxit PDF Compressor übernimmt in Verbindung mit einem CROSSCAP System die folgenden Funktionen:

  • stärkere Kompression der von CROSSCAP erzeugten PDF-Dateien (Bilddaten)
  • Volltext-Erkennung via eigener Nuance OCR-Engine (ist im PDFC enthalten)


Der PDFC kann sowohl mit einer CROSSCAP Einzel-Arbeitsplatz Lösung, als auch in einem Enterprise-System verwendet werden.



Installation und Einbindung in ein CROSSCAP Scan-System


Als erste Komponente benötigen Sie den Installer für den Foxit PDF Compressor. Foxit bietet auf seiner Webseite den Download einer kostenfreien Testversion an (Dateiname z.B. PDFC_8.2_x64.exe).


Der PDFC Installer muss mit Administrationsrechten ausgeführt werden (Bitte beachten Sie: Der PDFC-Installer versucht hierbei, Komponenten aus dem Netz nachzuladen. Ist das nicht möglich, kommt leider keine Fehlermeldung, sondern die Installation wird nur scheinbar erfolgreich abgeschlossen).


Nach der Installation findet sich im Windows Dienste-Manager ein zusätzlicher, bereits laufender Dienst mit dem Namen Foxit PDF Compressor. Der PDFC ist zu diesem Zeitpunkt bereits lauffähig, aber noch nicht an das CROSSCAP System angebunden und somit noch nicht von CROSSCAP aus ansprechbar.


Hierzu wird eine zweite Komponente benötigt, das sog. SRZ PDF Compressor Interface. Ein passender Installer ist im CROSSCAP Enterprise Installer-Paket enthalten und muss ebenfalls mit Administrator-Rechten auf dem Zielsystem ausgeführt werden (Dateiname z.B. PDFCompInterfaceV3.4.0.0.exe - die Versionsangabe im Dateinamen sollte zur Version des installierten CROSSCAP Systems passen). 

Der Foxit PDF Compressor und das SRZ PDF Compressor Interface müssen immer auf der gleichen Maschine (auf dem gleichen PC) installiert werden. Nach der Installation findet sich im Windows Dienste-Manager ein zusätzlicher, bereits laufender Dienst mit dem Namen PDFCompInterface


Das SRZ PDF Compressor Interface kommuniziert mit dem Foxit PDF-Compressor über die vom PDFC angebotene API (Programmschnittstelle). Damit das SRZ PDF Compressor Interface Kontakt zum Foxit PDFC aufnehmen kann, muss dieser vorher erst vom sog. Joblisten-Modus in den API-Modus umgeschaltet werden.


Dies geschieht im Steuerprogramm des Foxit PDFC, entweder im Menü Datei unter automatische Verarbeitung starten > Verarbeitung im API Modus starten oder per Schaltfläche, wie hier gezeigt:



Der PDFC befindet sich nun im API-Modus:



Nach der Aktivierung des API-Modus sind der Foxit PDF Compressor und das SRZ PDF Compressor Interface einsatzbereit.


Die Aktivitäten des SRZ PDF Compressor Interfaces können im Fehlerfall über eine Konsole mitverfolgt werden. Der manuelle Start des Interfaces und das gleichzeitige Öffnen der Konsole erfolgen in diesem Fall über einen Eintrag im Windows Startmenü (PDFCompInterface im Ordner SRZ Crosscap oder SRZ Crosscap Enterprise):

Bitte beachten Sie, dass vor einem manuellen Start des SRZ PDF Compressor Interfaces der (ansonsten bereits laufende) Dienst PDFCompInterface händisch gestoppt werden muss.


Konfiguration der CROSSCAP Projektvorlage


Die Konfiguration des PDFC erfolgt hauptsächlich über die CROSSCAP Projektvorlage. Die Nutzung des PDFC wird in den PDF-Exportoptionen einer Projektvorlage ein- oder ausgeschaltet, dort erfolgt auch die weitere Konfiguration der Verarbeitung.


(Hinweis: Der PDF Kompressor bietet unter Menü Job > Standard-Einstellungen bearbeiten viele weitere, interessant klingende Optionen an. Aber: Die dort gemachten Einstellungen wirken sich nur auf die Konfiguration der Joblisten-Verarbeitung aus, nicht auf den Betrieb des PDFC im API-Modus! Wie man diese Optionen trotzdem aktivieren kann, wird ganz unten in dieser Anleitung beschrieben, im Abschnitt Übergabe von sonstigen PDFC Einstellungen.)


Zuschalten des PDF Compressors:


Öffnen Sie in der gewünschten Projektvorlage im Abschnitt 08-Export die Export-Optionen für PDF/A Dokument. Im Abschnitt PDF Compressor wird anfangs nur die Zeile PDF Compressor mit der Einstellung Aus angezeigt. Sobald Sie den PDF Compressor einschalten, öffnet sich ein erweiterter Abschnitt mit mehreren Einstellungs-Optionen:



Server mit Portnummer:


Tragen Sie hier den Maschinennamen oder die IP-Adresse des Servers bzw. der VM ein, auf welcher der PDFC und das CROSSCAP PDF Compressor Interface installiert wurde. Verwenden Sie dabei das Format: server:port, z.B. localhost:4545 (in diesem Beispiel wurde der PDF Compressor auf der gleichen Maschine installiert wie das CROSSCAP System. Für das CROSSCAP PDF Compressor Interface wird der standard/default Port 4545 verwendet).



PDF-Qualität [1-11]:


Dieser Eintrag steuert die Stärke der Bild-Kompression, durch den PDFC. Da die Stärke der Bild-Kompression eine direkte Auswirkung auf die Größe der komprimierten PDF-Dateien hat, kann man den hier eingegebenen Wert (etwas intuitiver) mit der resultierenden Dateigröße gleichsetzen: Ein geringer Wert für PDF-Qualität ergibt kleinere Ausgabedateien, ein hoher Wert für PDF-Qualität ergibt größere Ausgabedateien.

Grober Richtwert für eine typische A4 Farb-Textseite in 300 dpi Auflösung (bei Dokumentklasse MRC Standard, siehe unten): Die erzielte Dateigröße reicht von unter 100 kb / 0,1 MB (PDF-Qualität: "1" ) bis über 1000 kb / 1 MB (PDF-Qualität: "11" ).


Da eine sehr starke Kompression von Bildern zu unerwünschten Qualitätseinbußen führen kann, muss immer ein Kompromiss zwischen Bild-Kompression und Bild-Qualität gefunden werden. Dies ist der Grund für den (mittleren) Vorgabewert "6".

(Achtung: wurden die Bilddaten in den Quell-PDFs bereits vorab komprimiert, kann die Dateigröße bei sehr hohen Werten für PDF-Qualität sogar über die Größe der Quell-PDFs hinaus ansteigen!).


Dokumentklasse:


Zur Auswahl stehen hier vier Werte:


  • MRC Standard: für typische Textdokumente mit nur wenigen Grafiken und Tabellen
  • MRC Check: für kontrastärmere Textdokumente oder Dokumente mit feinen Strukturen
  • Foto: für Dokumente mit großformatigen Bildern (ergibt relativ große Ausgabedateien)
  • S/W: für Dokumente ganz ohne farbige Inhalte (ergibt kleine, bitonale Ausgabedateien)



Volltext generieren:


Wird die PDFC eigene Volltexterkennung zugeschaltet, erfolgt sie über die im PDFC integrierte Nuance OCR-Engine. Wird die PDFC eigene Volltexterkennung ausgeschaltet, kann sie stattdessen von CROSSCAP bzw. mit der für CROSSCAP konfigurierten OCR-Engine durchgeführt werden.

Achtung: Die CROSSCAP eigene Volltexterkennung (weiter unten) muss VOR dem Einschalten der PDFC Texterkennung abgeschaltet werden - ansonsten springt in diesem Menü Volltext generieren immer wieder auf "Aus" zurück.

PDF mit Tags:

Falls aktiviert, bettet der PDFC Informationen zur Dokumentstruktur in die erzeugten PDFs ein. Diese zusätzlichen Metadaten werden von der PDFC-eigenen OCR-Engine ermittelt. In herkömmlichen PDF-Viewern sind diese Tags nicht sichtbar, sie können aber z.B. für die Weiterverarbeitung der Ausgabedateien zu PDF/UA Dokumenten ausgelesen und verwendet werden.


Sprachauswahl Volltexterkennung:


Diese Option findet sich nicht im Abschnitt PDF Compressor, sondern im Abschnitt darunter, Texterkennung. Durch die gemeinsame OCR-Sprachauswahl muss diese nur an einer Stelle modifiziert werden und gilt sowohl für die OCR Engine von CROSSCAP, als auch für den PDFC.

























Übergabe von sonstigen PDFC Einstellungen


Ein Blick in das Konfigurationsmenü des PDF Kompressors liefert unter Menü Job > Standard-Einstellungen bearbeiten sehr viele weitere Optionen. Die meisten dieser Detaileinstellungen werden in der CROSSCAP Projektvorlage aber nicht explizit abgefragt, sondern mit Standardwerten vorbelegt.

Möchte man diese Vorgabewerte verändern, kann dafür die folgende Prozedur verwendet werden:

  • Schritt 1: Den PDFC in den Joblisten-Modus versetzen (durch Beenden des API-Modus)


  • Schritt 2: Einen neuen Job erzeugen (durch Rechtsklick irgendwo in das Joblisten-Fenster)


  • Schritt 3: Die Einstellungen dieses Jobs verändern (Rechtsklick auf Job > Eigenschaften)
    In diesem Beispiel wurde der OCR-Modus (Default: Schnell) auf den Modus Ausgewogen abgeändert.

  • Schritt 4: Den Job durch Klick auf die OK Schaltfläche abspeichern

  • Schritt 5: Den Job als default.dat exportieren (Rechtsklick auf Job > Job exportieren ...)
    Speicherziel üblicherweise: C:\Program Files (x86)\SRZ Berlin\PDFCompInterface\default.dat
    (Speicherziel bei abweichenden CROSSCAP-Installationsordnern bitte entsprechend anpassen ...)

  • Schritt 6: Den PDFC erneut in den API-Modus versetzen (Menü Datei > automatische Verarbeitung starten > Verarbeitung im API Modus starten). Alle bestehenden Jobs, also auch der soeben erzeugte, werden hierbei automatisch gelöscht.

  • Schritt 7: Der Dienst PDFCompInterface muss jetzt über den Windows Dienste-Manager neu gestartet werden.

  • Fertig, der nächste Aufruf des PDFC sollte mit den von Ihnen geänderten Vorgaben erfolgen!


Bitte beachten Sie: Alle direkt über die CROSSCAP Projektvorlage vorgenommenen PDFC Einstellungen haben Vorrang vor den in der default.dat gemachten Einstellungen!

War dieser Artikel hilfreich?

Das ist großartig!

Vielen Dank für das Feedback

Leider konnten wir nicht helfen

Vielen Dank für das Feedback

Wie können wir diesen Artikel verbessern?

Wählen Sie wenigstens einen der Gründe aus
CAPTCHA-Verifikation ist erforderlich.

Feedback gesendet

Wir wissen Ihre Bemühungen zu schätzen und werden versuchen, den Artikel zu korrigieren