Der PDF Compressor beinhaltet die ABBYY-OCR-Technologie zur Volltextsuche in allen PDF- und PDF/A-Dateien sowie LuraTechs integrierte Klassifikations- und Datenextraktionslösung. Mit der Einbindung der Version 10 der Abbyy-Engine wird vor allem die OCR-Funktion hinsichtlich Schnelligkeit und Genauigkeit verbessert.
Anwender erreichen eine deutlich höhere Erkennungsrate, auch bei „schwierigen“ Dokumenten, beispielsweise verrauschten, kontrastarmen oder verdrehten Scans. Auch Dokumente mit Tabellen, Grafiken und Fotos werden exakter erkannt, sodass deren Struktur genau rekonstruiert und weiterverwendet werden kann. Darüber hinaus wurde die Erkennungsgenauigkeit für asiatische Schriftzeichen um fast 40 % gesteigert. Zusätzlich erzielt der PDF Compressor über den optimierten Schnellerkennungsmodus (OCR Fast Mode) einen bis zu zweifach erhöhten Seitendurchsatz.
Insbesondere für Bibliotheken, Verlage und Archive von hoher Bedeutung ist die optimierte Erkennung von Fraktur-Schriften. Sie können nun – auch aufgrund der geringeren Kosten – Projekte zur Digitalisierung und Volltexterkennung zu wirtschaftlich attraktiven Rahmenbedingungen umsetzen. Hierfür bietet der PDF Compressor Enterprise gegen Aufpreis ein optionales Tool, das mit den jetzt verfügbaren, verbesserten OCR-Technologien ausgestattet ist. Zusätzlich können die Text- und Layout-Informationen – neben der Möglichkeit zur Archivierung im PDF/A-Format – im ALTO-XML-Schema abgespeichert werden.
Darüber hinaus hat LuraTech in dem neuen Release das Born-Digital-Modul weiterentwickelt. Damit lassen sich elektronisch erzeugte Dokumente aus MS Office, Outlook (E-Mails) sowie elektronisch entstandene PDF-Dateien in PDF- oder PDF/A-Dateien genauso einfach stapelweise verarbeiten, wie gescannte Papierdokumente. Neu ist jetzt, dass auch E-Mails in HTML mit GIF-Bildern oder Trennstrichen sauber konvertiert werden. Außerdem läuft das Modul auch dann stabil weiter, wenn während der Konvertierung, die im Hintergrund gestarteten Programme abstürzen.