Kontakt
QR-Code für die aktuelle URL

Story Box-ID: 1063387

ExxTainer AG Unterdorfstrasse 12 8808 Pfäffikon SZ, Schweiz http://www.exxtainer.com
Ansprechpartner:in Herr Dr. Werner Simon +49 89 888263
Logo der Firma ExxTainer AG
ExxTainer AG

Digitalisierung am Belegeingang: "Erkennen kann Texte jedes Tool, verstehen nur wenige"

Semantisch logische Texterkennung - PDF-Mapper® der ExxTainer AG konvertiert komplexe PDF-Belege in maschinenlesbares EDI/XML

(PresseBox) (Pfäffikon, )
Es gibt eine Vielzahl von Tools, mit denen PDF in durchsuchbare Formate wie .doc, .odt, .csv, .jpg usw. ungewandelt werden kann, aber nur wenige, die PDF in XML oder EDIFACT wandeln können. Strukturierte, maschinenlesbare Daten einschließlich zugehöriger Positionsinformationen werden aber von Inhousesystemen wie einer Buchungssoftware, einer Warenwirtschaft, einem Kommissionierungstool, einer ERP- oder einer Verwaltungssoftware benötigt, um automatisch weiterverarbeitet werden zu können. Einfach online durchsuchbare PDF-Dokumente zu erstellen, reicht deshalb häufig für Anwender in Industrie und Handel oder für komplexe Verwaltungsabläufe nicht. Der PDF-Mapper® der ExxTainer AG bietet hier Abhilfe. Mit seinem "Starter" stellt ExxTainer außerdem eine kostenfreie Einstiegsvariante für das semantische Auslesen von Texten aus Dokumenten und Formularen bereit.

PDF-Mapper® beendet Suche nach semantischer Texterkennung

Die Google-Recherche nach „PDF Auslesen“ zeigt unzählige Treffer zu einfachen Tools, weiß Dr. Werner Simon, Geschäftsführer der ExxTainer AG. Aber entweder lesen diese Tools einfach nur den Text ohne weiteren Bezug aus oder arbeiten wie die Abbyy-OCR-Maschine und legen über ein Pixel-Bild einen Layer mit Textboxen. Das Ergebnis ist zwar ein durchsuchbares PDF, aber nicht semantisch. „Alle diese Lösungen sind für einfache Belege und für private Zwecke sicherlich nützlich und auch dort, wo nicht zwingend das vollständige Auslesen der Texte und ihrer jeweiligen Bedeutung mit höchster Erkennungsgenauigkeit gefragt ist.“

Semantisch bedeutet, dass nicht nur der reine Text erkannt werden muss, sondern auch die Wortlogik dahinter. Das heißt, bei einem Datum muss das Programm erkennen, ob es sich beispielsweise um ein Lieferdatum oder eine Zahlungsfrist handelt.

In Industrie und Handel wird das semantische Auslesen von Bestell-, Liefer- und Rechnungsinformationen benötigt; für Verwaltungen und Behörden sind Namens- und Adressdaten, Paragraphentexte und Ausführungsbestimmungen sowie Fristen wichtig. Aber auch in Handwerk, Ausbaugewerbe und Baugroßhandel ist das (manuelle) Erfassen von Ausschreibungstexten mit bis zu 300 Textseiten mühselig und zeitraubend.

Kommen z. B. in einem Handelsbetrieb Hunderte von Bestellungen an, die in kurzer Zeit kommissioniert und zur Lieferung bereitgestellt werden müssen, reicht einfache Texterkennung nicht aus. Eintippen dauert zu lange. Scannen mit OCR erfordert Nacharbeit. Selbst neuere  Lösungen mit Algorithmen der künstlichen Intelligenz erfordern ein Training der Texterkennung und bieten keine 100-prozentige Sicherheit. Abläufe beim Beleghandling müssen jedoch reibungslos funktionieren. 

Als intelligente Capturing-Technologie erfasst der PDF-Mapper® jedes einzelne Feld eines Belegs oder Formulars vollständig und fehlerfrei und spielt seine Stärken insbesondere aus,
  • wenn Beleginhalte komplex (mehrzeilige oder mehrspaltig) aufgebaut sind
  • wenn Belege viele Seiten umfassen
  • wenn Kopf- und Fußzeilen zwischen erster und Folgeseiten abweichen
  • wenn eventuell unterschiedliche Lieferadressen und abweichende Liefertermine pro Belegposition vorhanden sind
  • wenn ausführliche Produktbeschreibung oder viele Artikelpositionen verarbeitet werden müssen
  • bei fremdsprachigen Inhalten
Mit dem "Starter" bietet ExxTainer eine kostenfrei Einstiegsvariante, um die Konvertierung von PDF nach Excel/CSV/XML und die sich ergebenden Vorteile zu testen: PDF-Mapper kostenfrei testen.

Website Promotion

Website Promotion
Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.
Wichtiger Hinweis:

Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die unn | UNITED NEWS NETWORK GmbH gestattet.

unn | UNITED NEWS NETWORK GmbH 2002–2024, Alle Rechte vorbehalten

Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.