Kontakt
QR-Code für die aktuelle URL

Story Box-ID: 1066342

SiteFusion GmbH Küstriner Straße 14 94315 Straubing, Deutschland http://www.sitefusion.de
Ansprechpartner:in Herr Thomas Weinberger +49 9421 7847125
Logo der Firma SiteFusion GmbH

Im Austausch mit künstlicher Intelligenz: Neues Forschungsprojekt rückt mehrsprachige Frage-Antwort-Systeme in den Fokus

(PresseBox) (Straubing, )
Milliarden Menschen nutzen täglich das Internet und produzieren dabei Quintillionen Bytes an Daten. Künstliche Intelligenz (KI) ermöglicht es, aus diesen riesigen Datenmengen strukturierte Erkenntnisse zu gewinnen. Davon profitieren insbesondere Unternehmen, die auf Grundlage von Daten geschäftskritische Entscheidungen treffen. Das Problem: Obwohl die Daten heute in einer Vielzahl von Sprachen verfügbar sind, mangelt es an mehrsprachigen Datensätzen wie Wissensgraphen (engl.: Knowledge Graphs), die Informationen strukturiert modellieren und Grundlage für viele KI-Anwendungen sind. In einem neuen Forschungsprojekt arbeiten Wissenschaftler der Fachgruppe Data Science am Institut für Informatik der Universität Paderborn mit Partnern aus der Industrie daran, Endanwendern die Abfrage großer Mengen mehrsprachiger Textdaten mithilfe von Wissensgraphen zu ermöglichen. Durch diese Schlüsselkomponente soll der Einsatz von KI-gestützten Lösungen in Unternehmen effizienter werden, beispielsweise bei Frage-Antwort-Systemen (Question Answering, kurz: QA) in Form von Chatbots oder Enterprise Search, also firmeninternen Suchmaschinen.

Das Projekt mit dem Titel „Polylingual Hybrid Question Answering“ (PORQUE) wird für die nächsten drei Jahre vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Förderprogramms „Eurostars“ mit insgesamt 1,2 Millionen Euro gefördert. Zu den Projektpartnern zählen das Unternehmen Semantic Web Company (Konsortialführer) und der Softwareentwickler SiteFusion.

Neue Plattform vereint mehrsprachige Daten

„Unser Projekt zielt darauf ab, polylinguale, also mehrsprachige, konversationelle KI weiterzuentwickeln, um Nutzenden die Möglichkeit zu bieten, eine Vielzahl mehrsprachiger Datenquellen abzufragen. Dadurch sollen Unternehmen in der Lage sein, weltweit verfügbaren Daten zu nutzen, um informiert geschäftskritische Entscheidungen treffen zu können“, so Prof. Dr. Axel-Cyrille Ngonga Ngomo, Leiter der Fachgruppe „Data Science“ am Institut für Informatik der Universität Paderborn.

Die Herausforderung liegt darin, komplexe Fragen über mehrere Sprachen hinweg, basierend auf großen Mengen heterogener Daten zu beantworten. „Die Innovation unseres Ansatzes liegt in der Kombination aus automatischer maschineller Übersetzung und Wissensgraphen“, erläutert der Informatiker. „Wissensgraphen bilden die Grundlage, ohne die viele KI-Anwendungen und -Assistenten heute nicht funktionieren würden: Sie stecken in Lösungen zum Auffinden von Informationen und QA-Systemen“, so Artem Revenko, Director Research, PoolParty Semantic Suite. Beispielsweise verbergen sich die Datensätze hinter den Informationsblöcken, die Google bei Suchanfragen einblendet, noch bevor man eine Seite aufruft, oder werden bei Amazon zum Beantworten von Fragen an Alexa genutzt. „Neben der Schwierigkeit, dass ein Mensch eine Frage auf viele verschiedene Arten stellen kann, mangelt es an Wissensgraphen in anderen Sprachen als Englisch, da knapp die Hälfte aller Informationen im Web nicht auf Englisch verfügbar sind“, erklärt Ngonga Ngomo. „Obwohl bereits ein großer Aufwand betrieben wurde, Wissensgraphen sprachübergreifend verfügbar zu machen, sind die meisten populären Wissensgraphen, z. B. DBpedia, in ihrer englischen Version am umfangreichsten. Dieser Mangel an mehrsprachigen Datensätzen schränkt die Übertragung von Modellen, die auf maschinellem Lernen basieren – wie QA-Systeme –, auf unterschiedliche Sprachen ein“, so der Wissenschaftler weiter.

Beantwortung sprachübergreifender Fragen aus dem europäischen Markt

Die neuartige Plattform zur mehrsprachigen Beantwortung von Fragen soll eine Hybrid-Lösung werden, erläutert Ngonga Ngomo. „Unsere Plattform soll die Übersetzung und sprachübergreifende Anreicherung von Wissensgraphen, gekoppelt mit Informationen aus Texten aus dem Web umfassen. Sobald ein Wissensgraph mit mehrsprachigem Inhalt angereichert ist, wollen wir ihn als Hintergrundwissen für die Erstellung und Qualitätsverbesserung von polylingualen QA-Systemen verwenden.“ Das sei insbesondere im europäischen Kontext relevant, da Daten in diesem Raum in einer Vielzahl von Sprachen verfügbar sind.

Bisher gebe es nur sehr wenige Lösungen, die in Texten enthaltene Entitätsnamen (wie Namen von Personen oder Orten) mit polylingualem Domänenwissen verknüpfen, um Fragen zu beantworten, so Ngonga Ngomo.

„Kommerzielle Anwendungen, die ein mehrsprachiges QA ermöglichen, hängen bislang stark von Menschen ab, die einen Teil der Qualitätssicherung der Daten übernehmen, was zeitaufwendig und kostenintensiv ist. Indem wir die maschinelle Übersetzung als automatisiertes System mit spezifischen Sprachverarbeitungstechniken kombinieren, ermöglichen wir es Endanwendenden, mehrsprachige Fragen zu stellen und automatisiert präzise Antworten zu erhalten“, ergänzt Ngonga Ngomo (Foto (Judith Kraft): Prof. Dr. Axel-Cyrille Ngonga Ngomo leitet am Institut für Informatik der Universität Paderborn das Fachgebiet „Data Science“.)

Website Promotion

Website Promotion
SiteFusion

SiteFusion GmbH

Die SiteFusion GmbH ist mit der gleichnamigen Software SiteFusion® einer der führenden Anbieter von XML-basierten Content Management und Workflow Lösungen für Publisher im deutschsprachigen Raum.

Zahlreiche namhafte Kunden setzen auf SiteFusion bei der Erstellung, Verwaltung und Veröffentlichung von Inhalten in unterschiedlichste analoge und digitale Kanäle. Die integrierte BPMN Workflow Engine ermöglicht ein einfaches und schnelles Customizing der Standard-Software und schafft zugleich Transparenz über alle Prozesse im Verlag hinweg. Die als OEM-Version integrierte Enterprise NoSQL/XML-Datenbank MarkLogic™ erlaubt die performante und flexible Verwaltung der Assets sowie die semantische Verknüpfung zueinander. Die Einbindung weiterer Services und Komponenten im Bereich Authoring und Publishing runden den modernen Best-of-Breed Ansatz der Lösung ab.

Integrationspartner:
pagina, EBCONT, C.H. Beck Media Solutions

Technologiepartner:
MarkLogic, Camunda, Fonto, parsX, DeltaXML, Mathtype, Moresophy, AntennaHouse, Adobe, CI HUB, vlow, doctronic

Referenzen (Auszug):
Cornelsen, Deutscher Sparkassen Verlag, Avoxa, Bund-Verlag, Deutscher Anwaltverlag, Bastei Lübbe, Lambertus Verlag, IUBH, Kohlhammer, MANZ, Reguvis, Westermann, Mohr Siebeck Verlag, Verlag SKV, W1 Media, Klett, Verlag für Standesamtswesen, Walhalla Fachverlag, Peter Lang AG, Mittelbayerische Zeitung

Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.
Wichtiger Hinweis:

Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die unn | UNITED NEWS NETWORK GmbH gestattet.

unn | UNITED NEWS NETWORK GmbH 2002–2024, Alle Rechte vorbehalten

Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.