PDF Compressor 6.0 integriert ABBYY 10

Verbesserte OCR steigert Erkennungsraten und Performance

(PresseBox) (Berlin, 27.08.2012)

Die Version 6.0. des PDF Compressors der LuraTech Europe GmbH ist ab sofort verfügbar. Das neue Release der produktionstauglichen Anwendung zur Kompression, Wandlung nach PDF(/A), Zeichenerkennung (OCR), Klassifikation sowie Formulardatenextraktion wartet mit einigen neuen, interessanten Performance-Gewinnen auf. Von zentraler Bedeutung ist hierbei der Umstieg auf die Version 10 der ABBYY-OCR-Technologie. Damit wird das Auslesen gescannter Dokumente in puncto Schnelligkeit und Genauigkeit verbessert. Zusätzlich ist in der Standardlizenz die Erkennung von zweidimensionalen Barcodes, wie PDF417, Aztec, DataMatrix oder QR Code, enthalten. Schließlich hat LuraTech das Born-Digital-Modul ihres Flaggschiffprodukts dahingehend optimiert, dass HTML-E-Mails besser konvertiert und die Software selbst nach Abstürzen involvierter Programme stabil weiterläuft.

Der PDF Compressor beinhaltet die ABBYY-OCR-Technologie zur Volltextsuche in allen PDF- und PDF/A-Dateien sowie LuraTechs integrierte Klassifikations- und Datenextraktionslösung. Mit der Einbindung der Version 10 der Abbyy-Engine wird vor allem die OCR-Funktion hinsichtlich Schnelligkeit und Genauigkeit verbessert.

Anwender erreichen eine deutlich höhere Erkennungsrate, auch bei „schwierigen“ Dokumenten, beispielsweise verrauschten, kontrastarmen oder verdrehten Scans. Auch Dokumente mit Tabellen, Grafiken und Fotos werden exakter erkannt, sodass deren Struktur genau rekonstruiert und weiterverwendet werden kann. Darüber hinaus wurde die Erkennungsgenauigkeit für asiatische Schriftzeichen um fast 40 % gesteigert. Zusätzlich erzielt der PDF Compressor über den optimierten Schnellerkennungsmodus (OCR Fast Mode) einen bis zu zweifach erhöhten Seitendurchsatz.

Insbesondere für Bibliotheken, Verlage und Archive von hoher Bedeutung ist die optimierte Erkennung von Fraktur-Schriften. Sie können nun – auch aufgrund der geringeren Kosten – Projekte zur Digitalisierung und Volltexterkennung zu wirtschaftlich attraktiven Rahmenbedingungen umsetzen. Hierfür bietet der PDF Compressor Enterprise gegen Aufpreis ein optionales Tool, das mit den jetzt verfügbaren, verbesserten OCR-Technologien ausgestattet ist. Zusätzlich können die Text- und Layout-Informationen – neben der Möglichkeit zur Archivierung im PDF/A-Format – im ALTO-XML-Schema abgespeichert werden.

Darüber hinaus hat LuraTech in dem neuen Release das Born-Digital-Modul weiterentwickelt. Damit lassen sich elektronisch erzeugte Dokumente aus MS Office, Outlook (E-Mails) sowie elektronisch entstandene PDF-Dateien in PDF- oder PDF/A-Dateien genauso einfach stapelweise verarbeiten, wie gescannte Papierdokumente. Neu ist jetzt, dass auch E-Mails in HTML mit GIF-Bildern oder Trennstrichen sauber konvertiert werden. Außerdem läuft das Modul auch dann stabil weiter, wenn während der Konvertierung, die im Hintergrund gestarteten Programme abstürzen.

PDF Compressor 6.0 integriert ABBYY 10

Verbesserte OCR steigert Erkennungsraten und Performance

Foxit Europe GmbH

PresseMail abonnieren