Präzise und effizient: ABBYY FineReader Engine 9.0 Software Toolkit setzt Standards in der Konvertierung mehrseitiger Dokumente

Die neue Version kombiniert innovative Technologie zur exakten Rekonstruktion der logischen Struktur eines Dokuments mit der Leistung von Multi-Core Prozessoren

(PresseBox) (München, 30.10.2008)

ABBYY, führender Anbieter von Technologien für Dokumenterkennung, Data Capture und Linguistik, präsentiert FineReader Engine 9.0 für Windows. Die neueste Version des Software Development Kits (SDK) ermöglicht die Integration von ABBYYs Erkennungstechnologien in eigene Applikationen. FineReader Engine 9.0 ist ab sofort erhältlich und bietet innovative Technologien, die besonders bei der Verarbeitung mehrseitiger Dokumente neue Standards in puncto Erkennungsgenauigkeit und Leistungsstärke setzen. Verbesserte Kerntechnologien, kombiniert mit neuen Komponenten wie der einfachen Multi-Core-Skalierbarkeit, Erkennungsalgorithmen für asiatische Sprachen und sofort einsetzbaren User-Interface-Elementen machen FineReader 9.0 Engine zur idealen Lösung für die Integration genauester, höchst effizienter Erkennungstechnologien.

ABBYY FineReader Engine 9.0 ist ein großer Fortschritt in der Erkennung und Verarbeitung mehrseitiger Dokumente. Die neue Adaptive Document Recognition Technology (ADRT) bietet nicht nur genaueste Texterkennung und Rekonstruktion der Formatierung, sondern übernimmt auch den korrekten Textfluss sowie die logische Struktur und Integrität des Gesamtdokuments. Formatierungselemente wie Kopf- und Fußzeilen, Seitenzahlen, Fußnoten, Spalten, Tabellen, Unterschriften, Schriftarten und -stile werden richtig erkannt und in der nativen Microsoft Office Formatierung wiedergegeben.

Andrey Isaev, Director of Technology Products Department bei ABBYY, erklärt, wie sich die Dokumentenerkennung durch ADRT von einem seiten-orientierten Ansatz zu einem dokumenten-basierten Prozess entwickelt hat: "Im Gegensatz zur klassischen Dokumentenerkennung, die ein Dokument lediglich als eine Ansammlung einzelner Seiten betrachtet, verarbeitet ADRT das Dokument als ein Ganzes. Formatierungselemente der einzelnen Seiten werden analysiert und daraus genaue Hypothesen über Struktur und Formatierungseigenschaften des Dokuments abgeleitet. Das Ergebnis sind Ausgabedokumente, die noch einfacher bearbeitet und weiter verwendet werden können."

FineReader Engine 9.0 bietet zudem deutliche Verbesserungen hinsichtlich Leistung und Genauigkeit sowie zusätzliche Funktionalitäten:

Hohe Skalierbarkeit auf Multi Core Systemen

Zusätzlich zu den erweiterten Möglichkeiten bei der Erkennung mehrseitiger Dokumente liefert FineReader Engine 9.0 hervorragende Leistungen auf Multi-Core Prozessoren. Die neue FineReader Engine 9.0 ermöglicht die automatisierte, effektive Verteilung der Dokumentseiten auf mehrere CPUs. Das SDK kann einfach auf die Anzahl der benötigten CPUs skaliert werden, mit jedem hinzugefügten Core steigert sich die Verarbeitungsgeschwindigkeit deutlich. So steigt die Leistung bei Dual Core Prozessoren im Vergleich zu einer Single Core CPU um bis zu 90 Prozent, bei Quad Core Prozessoren um bis zu 270 Prozent*.

Neue Erkennungstechnologie für Chinesisch und Japanisch

Mit der neuen Erkennungstechnologie für asiatische Sprachen ist in FineReader Engine 9.0 ein großer Durchbruch hinsichtlich Leistung und Geschwindigkeit in der Verarbeitung von Chinesisch und Japanisch gelungen, zwei der in Bezug auf OCR komplexesten Sprachen. Ein neuer Algorithmus zur Erkennung der Dokumentsprache liefert zudem hervorragende Ergebnisse in der Verarbeitung mehrsprachiger Dokumente und ermöglicht die Konvertierung von Unterlagen, die sowohl ideographische (z.B. asiatische) als auch alphabetische (z.B. europäische) Sprachen enthalten, beispielsweise Texte mit Passagen in Chinesisch und Französisch oder Japanisch und Deutsch.

"Die asiatischen Märkte werden immer wichtiger und damit bekommen Sprachen wie Chinesisch immer mehr Gewicht in geschäftlicher Korrespondenz und Kommunikation", erklärt Isaev. "Bisher waren diese Sprachen mit ihren Tausenden von Schriftzeichen stets eine Herausforderung für OCR-Technologien. ABBYY hat viel in die Entwicklung dieser Technologien investiert, und wir sind stolz, beträchtliche Fortschritte auf diesem Gebiet vorzeigen zu können."

Visuelle Komponenten für geringeren Entwicklungsaufwand

Bei den neuen Visual Components handelt es sich um eine Reihe sofort einsatzbereiter, anpassbarer graphischer Elemente für die Benutzeroberfläche. Diese erleichtern es Entwicklern und Integratoren, dem Anwender Zugriff auf die OCR-Funktionalitäten in ihren Applikationen zu geben. Die Komponenten, verfügbar in 24 Sprachen, beinhalten beispielsweise intuitive Benutzeroberflächen für das Scannen/Öffnen von Bildern, das automatische oder manuelle Unterteilen eines Bildes, Textbearbeitung und Textüberprüfung. Alle diese Komponenten spiegeln ABBYYs langjährige Erfahrung in der Entwicklung von Endanwender-Applikationen wieder, wie beispielsweise dem preisgekrönten ABBYY FineReader Professional.

Innovative Komprimierungstechnologie für PDF und PDF/A

ABBYY FineReader Engine 9.0 liefert innovative Mixed Raster Content (MRC) Kompressionstechnologie für PDF und PDF/A. Die MRC-Kompression kann die Größe eines Ausgabe-PDFs im Vergleich zur herkömmlichen JPEG-Komprimierung um das Acht- bis Zehnfache* verkleinern. Die Technologie identifiziert die unterschiedlichen Ebenen in einem PDF und komprimiert diese ohne sichtbaren Qualitätsverlust. Hoch komprimierte, durchsuchbare PDFs und PDF/As sind unverzichtbar bei der Dokumentarchivierung sowie bei der Speicherung, von Farbdokumenten.

Die neue Generation der ABBYY OCR-Technologie für Digitalfotos

ABBYYs neues SDK wurde auch hinsichtlich der Erkennung von Text in Digitalfotos optimiert. ABBYYs OCR-Technologie für Digitalfotos bietet umfangreiche Funktionen zur Bildvorverarbeitung, darunter die automatische Erkennung der Bildauflösung, Korrektur schiefer Textzeilen und anderer Bildverzerrungen, die typischerweise beim Abfotografieren von Text auftreten.

Weitere Neuerungen in FineReader Engine 9.0:
- Export zu XML-basierten MS Office 2007 Formaten wie DOCX, XLSX und PPTX;
- Unterstützung für das JBIG2 Bildformat;
- Neue Erkennungssprachen - Das SDK bietet Unterstützung für 21 neue ICR-Sprachen und erkennt damit insgesamt 195 OCR- und 113 ICR-Sprachen. In FineReader Engine 9.0 wurde zudem die Erkennungsgenauigkeit für Hebräisch verbessert.

Über ABBYY Erkennungstechnologien und ABBYY Toolkits für unterschiedliche Plattformen

ABBYY FineReader Engine ist ein leistungsstarkes SDK, das Entwicklern und Integratoren alle notwendigen Werkzeuge zur Integration einer Vielzahl von Erkennungstechnologien in ihre Applikationen liefert. Das ABBYY-SDK bietet preisgekrönte optische Zeichenerkennung (OCR), Intelligent Character Recognition (ICR), Barcode-, Checkmark- und Field-Level/Zonal-Erkennung sowie PDF-Konvertierung zur Umwandlung gescannter Dokumente und Bilddateien in durchsuchbare, editierbare und leicht zu verarbeitende Textdateien. ABBYY FineReader Engine Toolkits sind verfügbar für unterschiedliche Plattformen, darunter Windows, Linux, FreeBSD und Mac OS und werden bereits vielfach als OCR-Komponente in führenden Lösungen für Dokumentenmanagement, Workflow und Archivierung eingesetzt. ABBYY bietet zudem ein plattformunabhängiges, kompaktes Toolkit zur Integration von OCR und Visitenkartenerkennung in mobile Applikationen, verfügbar u.a. für Windows Mobile, Symbian und Linux.

Verfügbarkeit und Preisgestaltung

ABBYY FineReader Engine 9.0 ist ab sofort weltweit erhältlich. Das SDK wird über eine flexible, modulare Lizenzpolitik vertrieben. Entwickler können die für ihr Projekt beste Kombination aus Funktionalitäten und Preisoptionen auswählen, der Preis variiert je nach Anzahl der CPU Cores, der Verarbeitungsstationen und der zu verarbeiteten Seiten. Für Informationen zu unseren Lizenzierungsmodellen und Preisen kontaktieren Sie bitte Ihre lokale ABBYY Geschäftsstelle.

Für Testzwecke steht eine spezielle, zeitlimitierte Testversion zur Verfügung. Für weitere Information über das Produkt, besuchen Sie www.ABBYY.com.

* Die angegebenen Zahlen basieren auf ABBYY-internen Testergebnissen.

Präzise und effizient: ABBYY FineReader Engine 9.0 Software Toolkit setzt Standards in der Konvertierung mehrseitiger Dokumente

Die neue Version kombiniert innovative Technologie zur exakten Rekonstruktion der logischen Struktur eines Dokuments mit der Leistung von Multi-Core Prozessoren

ABBYY Europe GmbH

PresseMail abonnieren