Dokumenterkennung, PDF-Umwandlung und Barcode-Erkennung
ABBYY FineReader Engine ermöglicht die effiziente und flexible Integration von OCR-Technologie, Barcode-Erkennung und PDF-Umwandlung in viele Anwendungen. Dazu gehören Lösungen für Archivierung und Storage, Content- & Dokumenten-Management, zur Überprüfung und Verifizierung ebenso wie zur Dokumentumwandlung oder Data Capture. Mit der Umwandlung von gescannten Bilddateien oder PDFs in editierbare und durchsuchbare Dateien ermöglicht die Software das Durchsuchen von Dokumenten, die Weiterverwertung von Dateien sowie die Erfassung von Informationen zur Übertragung in Datenbanken.
Die wichtigsten Vorteile der ABBYY FineReader Engine:
- Größte Genauigkeit durch detaillierte Dokumentanalyse: Das neue SDK ist die mit Abstand genaueste OCR-Engine, die jemals für die Linux-Plattform erhältlich war. Verglichen mit der Vorgängerversion erreicht die Version 8.0 um 30 Prozent genauere Ergebnisse. Im Vergleich mit anderen auf dem Markt verfügbaren OCR SDKs für Linux ist die Genauigkeit um 60 Prozent größer. Darüber hinaus bietet das SDK anspruchsvolle Dokumentanalyse speziell für verschiedene Erkennungsverfahren wie Vorverarbeitung von Rechnungen sowie Volltext-Indizierung und kann für jede einzelne Aufgabe unterschiedliche Algorithmen zur Dokumentanalyse anwenden.
- Leistungsstarke PDF-Umwandlung: Das SDK bietet leistungsstarke Funktionen bei der Umwandlung von PDF-Dateien. Die neue Version unterstützt alle Arten von PDF-Dateien, inklusive «Text und Bild», «Text über Bild», «Text unter Bild» und «Nur Bild», kann interne Links und Hyperlinks auslesen und im neuen Dokument rekonstruieren und unterstützt erweiterte Sicherheits- und Verschlüsselungseinstellungen. FineReader Engine 8.0 beherrscht auch die Ausgabe im Tagged PDF-Format und kann die Ausgabedatei mit Informationen zu den Dokumenteigenschaften versehen.
- Unterstützung mehrerer Sprachen und Schriftarten: FineReader ermöglicht OCR in bis zu 189 Sprachen (mehr als jede andere derzeit verfügbare OCR-Software), inklusive Chinesisch, Japanisch und Koreanisch. Zusätzlich ist die Erkennung von mit Nadeldruckern erstellten Texten, alten europäischen Schriften (beispielsweise Fraktur), den meisten gotischen Schriften sowie in der Finanzbranche verwendeten Sonderschriften wie OCR-A, OCR-B und MICR (E13B) integriert.
Unterstützung vieler Plattformen: ABBYY hat FineReader Engine 8.0 with Extended Platform Support auf den Betriebssystemen der führenden Anbieter getestet, inklusive Red Hat Enterprise Linux, Fedora, Suse Linux Enterprise, FreeBSD und Mac OS X (Intel).
- Flexible Architektur und Lizenzierung: Die FineReader-Technologie kann in Anwendungen jeglicher Größe und Komplexität eingebaut werden - von einfachen Client-Anwendungen bis hin zu serverbasierten, verteilten Projekten. Mit seinem flexiblen, modularen Aufbau und Lizenzmodell können Entwickler genau die Funktionen auswählen, die sie benötigen und haben gleichzeitig die Möglichkeit, bei Bedarf die Funktionalität der Applikationen weiter auszubauen.
"Entwicklern steht heutzutage eine große Bandbreite leistungsfähiger Komponenten zur Verfügung, aus denen sie bei der Entwicklung ihrer eigenen Lösungen wählen können", erklärt Alexander Rylov, Chief Product Manager von ABBYY. "FineReader Engine 8.0 ist eine leistungsstarke Plattform zur Dokumenterkennung und -umwandlung mit vielen speziellen Funktionen zur Erstellung durchsuchbarer PDF-Dateien für die Archivierung, zur Verarbeitung von Digitalfotos, Field Level (Zonal) Erkennung und Erfassung von Barcodes. Mit der neuen Version stehen diese Funktionalitäten nun auch Entwicklern zur Verfügung, die mit den Plattformen Linux, FreeBSD oder Mac OS X (Intel) arbeiten."
Neu in FineReader Engine 8.0 with Extended Platform Support
2003 hat ABBYY zum ersten Mal eine Version der FineReader Engine für die Linux-Plattform vorgestellt. Seitdem erarbeiteten die ABBYY Development Teams zusammen mit einer Reihe von Unternehmen und Entwicklern die ideale Kombination aus angebotenen Funktionen und unterstützten Plattformen. Neben der erweiterten Unterstützung von Plattformen bietet das SDK folgende Neuerungen:
- Vorverarbeitung von Bilddateien: FineReader Engine 8.0 bietet Neuerungen in der Vorverarbeitung von Bildern zur Verbesserung der Erkennungsgenauigkeit bei schwer lesbaren Dokumenten wie Zeitungen, Zeitschriftenseiten, Faxen, Kopien und Texten, die auf farbigem oder gemustertem Hintergrund gedruckt wurden. Zu diesen Vorverarbeitungstechnologien gehören die adaptive Binarisierung, die Filterung des Hintergrunds sowie die Vorverarbeitung von Digitalfotos zur Vermeidung von Problemen, die typischerweise bei der Verwendung von Digitalkameras auftreten.
- Multilevel Document Analysis (MDA) und spezielle Modi zur Dokumentanalyse: ABBYY FineReader Engine 8.0 unterstützt spezielle Modi für die Analyse und das Auslesen von Daten aus Dokumenten. Diese Modi sind entscheidend für unterschiedliche Aufgaben der Dokumentverarbeitung, wie Dokumentumwandlung, Volltext-Indizierung und Vorverarbeitung von Rechnungen. FineReader Engine 8.0 ist somit unverzichtbar für Lösungen zur Indizierung und Archivierung.
- Barcode-Erkennung: Das SDK ermöglicht das schnelle Auffinden und Auslesen von Barcodes auf einer Seite, unabhängig davon, wo und in welchem Winkel sie platziert sind. Es unterstützt über 18 1D Barcodes sowie 2D PDF 417 Barcodes.
- Field Level (Zonal) Erkennung: FineReader Engine 8.0 bietet leistungsstarke Texterkennung auf der Ebene von Textfeldern und -zonen. Sie wurde speziell für das Erkennen von wichtigen Informationen auf kleinen Textbereichen oder -schnipseln entwickelt. Diese Funktion ist entscheidend für bestimmte Aufgaben, wie die Indizierung von Schlüsselbegriffen und die Klassifizierung von Wörtern. Die Field Level Erkennung ermöglicht die Erkennung mehrsprachiger Texte und bietet zudem erweiterte Funktionen wie Definition der Feldinhalte, Erkennung von Zeichenabständen und Zwischenräumen, Verarbeitung von Textblöcken mit sich überschneidenden Elementen, Erkennung von Wörtern und Zeichen, die direkt auf der Feldbegrenzung platziert sind, und Säubern von Textblöcken. Entwickler haben so die Möglichkeit, die Erkennungskriterien zu bestimmen und die Erkennungsergebnisse zu verbessern.
- Verbesserte PDF-Umwandlung: Ein zweistufiges Verfahren zur intelligenten Verarbeitung von PDF-Dateien bestimmt die geeignete Methode zum Auslesen der Daten aus einem PDF. Die Informationen werden entweder direkt aus der Textebene der PDF-Datei gezogen oder das PDF wird als Bild behandelt und einem OCR-Prozess unterzogen. Das Ergebnis ist die größte Erkennungsgenauigkeit selbst bei PDF-Dateien, die durch Scanner erstellt wurden (PDF-Nur-Bild-Dateien) oder bei PDFs mit speziellen Verschlüsselungen. Weitere Optionen der PDF-Umwandlung sind die Rekonstruktion interner Links und Hyperlinks sowie die Einhaltung von Sicherheitseinstellungen. Gute Erkennungsergebnisse werden zudem durch das Einbeziehen der Adobe PDF-Library garantiert.
- Verbesserte Ausgabe von PDF-Dateien: Die neuen Optionen der PDF-Ausgabe beinhalten die Unterstützung von Sicherheits- und Verschlüsselungseinstellungen, Ausgabe im Tagged PDF-Format sowie das Hinzufügen von Dateieigenschaften.
- Vielfältige Ausgabe- und Exportmöglichkeiten: Neben Bild-PDFs und durchsuchbaren PDFs unterstützt die FineReader-Technologie auch die Ausgabe des erkannten Textes in einer Vielzahl anderer Formate, inklusive RTF, TXT, HTML, XML und XLS. Wichtige Formatierungen wie Aufzählungszeichen, besondere Bildformen und Formatierungsoptionen können sowohl in der Ausgabedatei festgehalten werden, als auch in den erweiterten Informationen zur Zeichenformatierung (genaue Informationen über Formatierung und unterschiedliche Arten von Wörtern und Zeichen u.ä. via API und XML). Dokumenteigenschaften können in den wichtigsten Ausgabeformaten individuell gesetzt werden.
- Optimale Steuerung der Verarbeitungsgeschwindigkeit: FineReader Engine 8.0 bietet eine Reihe von Optionen, mit denen Integratoren die besten Erkennungsergebnisse und die optimale Verarbeitungsgeschwindigkeit für ihre Applikationen einstellen können. Sie unterstützt den Modus "Ausbalanciertes Verarbeitungsverfahren" und stellt bereits vorbereitete Profile zur Verfügung, mit deren Hilfe weniger Zeit zur Auswahl der richtigen Parameter bei häufigen Verarbeitungsszenarien benötigt wird (z.B. Umwandlung in durchsuchbare PDFs, Field Level Erkennung, Archivierung und Indizierung).
Spezifikationen, Verfügbarkeit und Preisgestaltung
ABBYY FineReader Engine 8.0 besteht aus Komponenten, die den Entwicklern einen leichten Zugang zu den wichtigsten OCR-Funktionalitäten über ein Application Programming Interface (API) erlauben. Viele Funktionen sind zudem über ein Command Line Interface zugänglich.
Das SDK wird mit Entwickler-Lizenzen und Runtime-Lizenzen vertrieben. Für bestimmte Funktionen sind Add-on Module verfügbar. Eine Testversion ist auf Nachfrage erhältlich. Das Produkt wird voraussichtlich im vierten Quartal 2006 verfügbar sein. Informationen über Lizenzmodelle und Preisgestaltung sowie weitere technische Informationen sind bei den regionalen ABBYY-Niederlassungen erhältlich. Weitere Informationen über das Produkt und den Vertrieb stehen auch auf www.abbyy.de zur Verfügung.