PresseBox
Pressemitteilung BoxID: 5048 (ABBYY Europe GmbH)
  • ABBYY Europe GmbH
  • Landsberger Str. 300
  • 80687 München
  • http://www.abbyy.de

Abbyy mit Weltpremiere: Erste Omnifont OCR-Software zur Erkennung von Frakturschrift

(PresseBox) (, ) Neues Erkennungsmodul ermöglicht Digitalisierung wichtiger historischer Dokumente


München, 24. März 2003 - Abbyy stellt eine neue Technologie vor, welche die Archivierung alter Dokumente und Bücher wesentlich erleichtert. Der führende Anbieter linguistischer und Optical Character Recognition (OCR)-Software präsentiert die erste Omnifont OCR-Software zur Erkennung von Frakturschrift. Nach mehr als zwei Jahren Entwicklungszeit erkennt das FineReader Modul für Frakturschrift historische Texte in Deutsch, Nieder-ländisch und den skandinavischen Sprachen. Zusätzlich zu den kunstvollen und kalligrafischen Frakturschriften liest das neue Modul von ABBYY auch alte romanische Zeichen wie das verlängerte "s" in frühen englischen und französischen Texten.

Bisher war die Digitalisierung historischer Dokumenten eine teure und aufwändige Angelegenheit. Die Grenzen der Technologie und die Einzig-artigkeit der Dokumente, die in vielen verschiedenen historischen Schriften erstellt wurden, haben den Prozess der Texterkennung erschwert. Zwar konnten auch auf diesem Sektor OCR-Technologien in den letzten Jahren bessere Erkennungsraten erzielen und auch die Computer selbst wurden "intelligenter" und konnten so trainiert werden, dass sie kursive Schriften erkennen. Dennoch benötigten die meisten Systeme immer noch viele Stunden Training mit dem Wörterbuch, um ein einzelnes Dokument mit alten Schriftarten zu erkennen.

Erkennung alter Texte ohne langes Training Das ABBYY FineReader Modul für Frakturschrift ist das erste Omnifont OCR-System zur Erkennung von Fraktur-schrift. Anwender können jetzt Dokumente mit Frakturschrift einfach scannen und erkennen lassen. Die Texte können mit nur geringem Training und mini-maler Arbeit mit dem Wörterbuch digitalisiert werden. Das ermöglicht Abbyy durch den Einsatz eines speziellen Klassifizierers für Frakturschrift. Um eine hohe Genauigkeit zu erreichen, wurde das Frakturmodul mit Hunderten von Beispieldokumenten aus dem 19. und vom Beginn des 20. Jahrhunderts trainiert. Spezielle Wörterbücher wurden auf der Grundlage von Original-wörterbüchern mit der Orthographie des 19. und 20. Jahrhunderts für Deutsch, Englisch, Französisch, Italienisch und Spanisch entwickelt.

Erste Implementierung im METAe Projekt Im Laufe dieses Jahres wird die erste Implementierung eines Archivierungssystems mit Abbyys Omnifont OCR für Fraktur im METAe Projekt durchgeführt werden. METAe ist ein Konsortium von Bibliotheken und Digitalisierungsunternehmen aus ganz Europa, die eine Software-Lösung zur Archivierung und Umwandlung historischer Dokumente wie Bücher, Zeitschriften, Magazine und Zeitungen erstellen. Das FineReader Modul wird dabei die Hauptkomponente für die Archivierung der kostbarsten historischen Dokumente Europas darstellen. Partner im METAe Projekt sind unter anderen: Die Universität von Innsbruck, die Universität von Florenz, die Nationalbibliothek von Frankreich, die Nationalbibliothek von Norwegen, die Friedrich-Ebert-Stiftung, CCS Compact Computer Systeme (Deutschland) und die Cornell Library Universität (USA).

Hintergrund: Frakturschrift Frakturschrift ist eine alte kalligrafi-sche/kursive Schrift und eine deutsche Ableitung der gotischen Schrift, die Künstler der Renaissance gebraucht hatten und die auch für die Bibliothek des Kaisers Maximilian I. und verschiedene religiöse Publikationen ver-wendet wurde. Sie war zwischen der Mitte des 15. Jahrhunderts und dem Beginn des 20. Jahrhunderts gebräuchlich. Der Ausdruck "Frakturschrift" leitet sich aus dem Lateinischen ab und bedeutet gebrochene Schrift, weil die Verziehrungen der Buchstaben den Wortfluss unterbrechen. Außer in Deutschland wurde Frakturschrift auch in anderen Ländern Mittel- und Nordeuropas verwendet: Dänemark, Schweden, Slowakei, Tschechien und Lettland. Andere Sprachen wie etwa Italienisch, Französisch und Spanisch verwendeten ebenfalls Fraktur-verwandte Ableitungen der gotischen Schrift. Beispielsatz für Frakturschrift:


Preise und Verfügbarkeit: Das FineReader Modul für Fraktur wird als Add-On Modul für FineReader Corporate Edition, FineReader Scripting Edition oder FineReader Engine angeboten. Das Modul kann nach Terminabsprache in der a-Version vorgeführt werden und wird in der zweiten Jahreshälfte 2003 zum Kauf angeboten. Der Preis ist Projekt-abhängig.


Weitere Informationen:
ABBYY Europe GmbH
Paula Fujimoto
Anglerstraße 6
D - 80339 München
Tel.: 089/511 159-55
Fax: 089/511 159-59
E-Mail: fujimoto@abbyyeu.com

Pressekontakt:
AxiCom GmbH
Detlev Henning
Junkersstraße 1
D - 82178 Puchheim
Tel.: 089/800908-14
Fax: 089/800908-10
E-Mail: detlev.henning@axicom.de

ABBYY Europe GmbH

ABBYY Europe ist ein Mitglied der ABBYY Gruppe und veröffentlicht und vertreibt ABBYY-Produkte in Westeuropa. ABBYY (ABBYY Software House) entwickelt linguistische Software und Software für Künstliche Intelligenz, darunter eine komplette Produktlinie für OCR und Texterkennungsprogramme und Lösungen. Das Produkt-Portfolio von ABBYY bietet: FineReader OCR Systeme - eine Produktfamilie für Endkunden und SDKs zur Erkennung von gedruckten Texten, Tabellen und Formularen; FormReader - ein ICR Programm zur Erkennung und Verarbeitung von Formularen, die per Hand ausgefüllt wurden; ABBYY Retrieval & Morphology Engine - Tools für Entwickler zur Integration von Volltextsuche und linguistischen Funktionen in externe Applikationen. Zu den Lizenznehmern der Erkennungs-Technologien von ABBYY zählen Siemens Nixdorf, Samsung Electronics, C-Technologies, Sumitomo Electric Systems, Banctec, BenQ, Documentum, EPSON, Freedom Scientific, Hewlett-Packard, Kurzweil, Kofax, Microtek, NewSoft, Notable Solutions, Panasonic, Stellent, Toshiba, Verity, Neurascript, Saperion und SWT. Die Zentrale der ABBYY Gruppe befindet sich in Moskau, Niederlassungen gibt es in der Ukraine (ABBYY Ukraine), den USA (ABBYY USA, Fremont, CA), Großbritannien (ABBYY UK, Bishops Stortford, England) und Deutschland (ABBYY Europe, München). Weitere Informationen über ABBYY finden sich im Web unter www.abbyy.com oder direkt bei ABBYY Europe GmbH, Anglerstraße 6, 80339 München, E-Mail: sales_eu@abbyy.com.

ABBYY, das ABBYY Logo, FineReader, FormReader und FlexiCapture sind entweder registrierte Warenzeichen oder Warenzeichen von ABBYY Software Ltd. Andere hier erwähnte Produktnamen sind Warenzeichen und/oder registrierte Warenzeichen der entsprechenden Inhaber. Adobe und Adobe PDF Library sind entweder registrierte Warenzeichen oder Warenzeichen von Adobe Systems Incorporated in den Vereinigten Staaten und/oder anderen Ländern. Die Marke FreeBSD ist ein registriertes Warenzeichen von The FreeBSD Foundation und wird von ABBYY mit Erlaubnis von The FreeBSD Foundation verwendet. Intel ist ein registriertes Warenzeichen von Intel Corporation oder seinen Tochterfirmen in den Vereinigten Staaten und anderen Ländern. Linux ist ein registriertes Warenzeichen von Linus Torvalds in den Vereinigten Staaten und anderen Ländern. Mac OS und das Mac Logo sind Warenzeichen von Apple Computer Incorporated in den Vereinigten Staaten und anderen Ländern. Bei der hier vorliegenden Pressemitteilung handelt es sich um eine unabhängige Publikation, die von Apple Computer Incorporated weder autorisiert, gesponsert oder in irgendeiner anderen Weise genehmigt wurde. Fedora ist ein Warenzeichen von Red Hat Incorporated. RED HAT ist ein registriertes Warenzeichen von Red Hat Incorporated und seinen Tochterfirmen in den Vereinigten Staaten und anderen Ländern. Captiva und Documentum sind registrierte Warenzeichen von EMC Corporation in den Vereinigten Staaten. SUSE ist ein registriertes Warenzeichen von Novell Incorporated in den Vereinigten Staaten und anderen Ländern.