Zwei Versionen
IRISPdf ist in zwei Versionen erhältlich: IRISPdf 3 for KODAK Capture Software (KCS) und IRISPdf 3 Server. IRISPdf for KCS ist eine Hochgeschwindigkeits-OCR-Produktionslösung für das Bearbeiten von großen Mengen an Dokumenten. Diese Software wird als Stapelverarbeitungs-Erweiterung für die KODAK Capture Software eingesetzt, der Hochgeschwindigkeits-Scan-Lösung von Kodak. KCS generiert den strukturierten Index, während IRISPdf den Volltext-Index erstellt – dadurch sind Informationen, die im Dokumenten-Management-System gespeichert wurden, jederzeit schnell wieder auffindbar. IRISPdf for KCS lässt sich sehr einfach einrichten. Einmal installiert und konfiguriert, verschmelzen KCS und IRISPdf zu einer Anwendung. Der IRISPdf-Prozess erfolgt dann in drei Schritten:
1. Wahl der Einstellungen
2. Scannen mit KCS 3
3. Erkennung mit IRISPdf
IRISPdf Server ist eine Stand-alone-Anwendung. Sie erstellt einen Suchindex für Dokumente, die in einem Bildformat vorliegen, und konvertiert sie auf Wunsch in editierbare Dokumente. Diese Version lässt sich auf drei verschiedene Arten einsetzen:
· Als SDK (Software Development Kit): IRISPdf Server lässt sich als verstecktes OCR-Modul in Dokumenten-Workflow-Anwendungen integrieren. Es steht darin als Funktionsaufruf zur Verfügung.
· Als Stapelverarbeitungs-OCR: IRISPdf Server bearbeitet den gesamten Inhalt eines ausgewählten Ordners.
· Als Verzeichnis-Überwachung: IRISPdf Server hält in festgelegten Ordnern Ausschau nach neuen Dateien und bearbeitet diese sofort.
„IRISPdf 3 ist ein Major-Upgrade der vorangegangenen Versionen. Neben bereits bekannten OCR-Funktionalitäten bietet die Software jetzt weiterentwickelte Bildverbesserungs-Funktionen und eine Strichcode-Erkennung“, erklärt Pierre de Muelenaere, President und CEO der I.R.I.S. Group. „Darüber hinaus kann IRISPdf 3 basierend auf einer Vorlage verschiedene Dateiformate in einem einzigen Bearbeitungsschritt erzeugen. Der Kunde hat somit eine leistungsfähige und schnelle OCR-Lösung an der Hand. Probleme dokumentiert IRISPdf 3 in einer Protokolldatei und macht so eine nachträgliche Korrektur möglich.“
Hauptleistungsmerkmale von IRISPdf 3
* IRISPdf 3 verwendet eine neue von I.R.I.S. entwickelte Erkennungs- und Formatierungstechnologie. Die Benutzeroberfläche der Software wurde komplett überarbeitet: Alle Optionen sind nun im Explorer-Design zu sechs Funktions-gruppen zusammengefasst. IRISPdf 3 erkennt alle wichtigen Strichcodes und eignet sich zur Separation und/oder Umbenennen von Dokumenten. Bei der Aufteilung der Dokumente helfen zwei neue Optionen, die sich an leeren Seiten oder Strichcodes orientieren.
* Ausgehend von einer Vorlagendatei lassen sich in einem Schritt mehrere Ausgabedateien in unterschiedlichen Formaten wie PDF, RTF, TXT und XML erzeugen. Das bearbeitete Dokument lässt sich zudem in verschiedenen Bildformaten wie TIFF, JPEG und BMP speichern. Für die Benennung der Ausgabedateien stehen jetzt mehrere Optionen zur Wahl: Beibehaltung des Originalnamens, Verwendung der Ordnerbezeichnung, Benutzung eines Barcode oder einer festen Zeichenkette mit inkrementellem Zähler.
* IRISPdf 3 unterstützt sämtliche europäischen Sprachen, darunter die zentraleuro-päischen und baltischen Sprachen, Griechisch und Kyrillisch (Russisch). Dieser Basis lassen sich mit dem Asien-Add-On-Modul vier asiatische Sprachen hinzufügen: Japanisch, Koreanisch, traditionelles und vereinfachtes Chinesisch. Auch für die Erkennung von Hebräisch steht eine Erweiterung zur Verfügung.
* Die Struktur des Eingangsverzeichnisses kann für den Ausgabeordner übernom-men werden. So lassen sich mit einem Klick alle archivierten Bilddateien inner-halb einer Verzeichnisstruktur transformieren. Ein Assistent hilft zudem bei der Deklaration der zu überwachenden Ordner. Darin neu angelegte Dateien werden automatisch bearbeitet.
* IRISPdf 3 bietet nun auch XML als Ausgabeformat. Es kann detaillierte Informa-tionen über den erkannten Text und die Position jedes Zeichens enthalten. Auch die Berichtsdatei liegt nun im XML-Format vor, so dass sie sich leicht in ein Dokumenten-Management-System einbinden lässt. Die Datei kann detaillierte Informationen wie die Position einzelner Zeichen, den Grad der Erkennungs-genauigkeit für jeden Buchstaben und mehr enthalten.
* Der aus dem I.R.I.S.-OCR-Prozess resultierende Text wird mit dem Vorlagenbild zu einer PDF-Abbilddatei verknüpft, die sich nach Zeichenfolgen durchsuchen lässt. Gefundene Stellen werden darin farbig markiert. Das generierte PDF kann nun auch eingebettete Schriftarten verwenden. Beim Erstellen von PDF-Abbildern besteht die Möglichkeit, die Bildauflösung zu verringern und die JPEG-Kompression zu ändern – unabhängig davon, ob das PDF-Dokument Textdateien enthält.
Preise und Verfügbarkeit
IRISPdf 3 wird über das VAR-Netzwerk von I.R.I.S. für 1.999 € (KCS-Version) und 2.999 € (Server-Version) vertrieben. Das Add-On für asiatische Sprachen kostet wie die Erweiterung für Hebräisch 499 €. Weitere Informationen sind unter var.opt@irislink.com erhältlich.
6.162 Zeichen bei durchschnittlich 100 Anschlägen (inklusive Leerzeichen) pro Zeile