Erste Omnifont OCR für Fraktur: Erkennung alter Texte ohne langes Training
Nach mehr als zwei Jahren Entwicklungszeit erkennt ABBYY FineReader XIX alte Texte, die zwischen 1800 und 1938 in Frakturschrift gedruckt wurden. Die Software unterstützt Deutsch, Englisch, Französisch, Italienisch und Spanisch. FineReader XIX erkennt Frakturschrift, Schwabacher und viele Texturschriften (Gotische Schriften) und romanische Schriftzeichen, die nicht mehr verwendet werden, wie z.B. das verlängerte „s“ in frühen englischen und französischen Texten.
Bisher brauchten Erkennungssysteme viele Stunden oder gar Tage an Training, um Frakturzeichen zu erkennen. ABBYY entwickelte FineReader XIX als ein Omnifont-System für Frakturschrift und alte europäische Sprachen. Dadurch können Anwender Dokumente in Frakturschrift scannen und lesen und in digitale Texte umwandeln, ohne das System lange zu trainieren oder viel mit dem Wörterbuch zu arbeiten. ABBYY hat dazu mit seinem Partner ATAPY Software spezielle Klassifizierer oder Alphabete für Frakturschrift entwickelt. Um die größtmögliche Genauigkeit zu erreichen, wurde ABBYY FineReader XIX mit hunderten von Beispieldokumenten trainiert, darunter 10 verschiedene Wörterbücher und mehr als 105 Bücher, die zwischen 1808 und 1930 veröffentlicht wurden. Zusätzlich wurde die Software an 31.000 Seiten Text aus verschiedenen Quellen getestet. Es wurden auch spezielle Erkennungswörterbücher, die auf historischen Wörterbüchern beruhen und die deutsche Orthografie des 19. Jahrhunderts darstellen, entwickelt.
Entwickelt für das META e Projekt
ABBYY FineReader XIX wurde unter Berücksichtigung der Bedürfnisse von Universitäten und Forschungseinrichtungen entwickelt. Das Produkt ist das Ergebnis einer Zusammenarbeit im weltweiten METAe Projekt. METAe ist ein Konsortium von Bibliotheken und Digitalisierungsunternehmen aus ganz Europa, die eine Software-Lösung zur Archivierung und Umwandlung historischer Dokumente wie Bücher, Zeitschriften, Magazine und Zeitungen erstellen. Im Rahmen des Projektes wird FineReader XIX die Hauptkomponente für die Archivierung der kostbarsten historischen Dokumente Europas darstellen. Partner im METAe Projekt sind unter anderen: Die Universität von Innsbruck, die Universität von Florenz, die Nationalbibliothek von Frankreich, die Nationalbibliothek von Norwegen, die Friedrich-Ebert-Stiftung, CCS Compact Computer Systeme (Deutschland) und die Cornell Library Universität (USA).
Systemvoraussetzungen
FineReader XIX unterstützt Windows 2003, XP, 2000 und NT 4.0 (mit SP6 oder höher). Die Software bietet 17 Oberflächensprachen. Erkannter Text kann in viele verschiedene Dateiformate exportiert und gespeichert werden, wie z.B. Microsoft Word, Microsoft Excel, Text, Rich Text Format, Microsoft Word XML und Adobe PDF.
Verfügbarkeit und Preis
FineReader XIX ist ab sofort zu einem Preis ab 910 Euro erhältlich. Eine spezielle Version mit begrenzter Nutzungsdauer und Seitenanzahl steht auch für eigene Tests zur Verfügung. Weitere Produktinformationen bekommen Kunden unter www.frakturschrift.de oder direkt über Herrn Daniel Eder unter 089/511159-44.