Kontakt
QR-Code für die aktuelle URL

Story Box-ID: 911258

Lingenio GmbH Karlsruher Str. 10 69126 Heidelberg, Deutschland https://lingenio.de/
Ansprechpartner:in Herr Kurt Eberle +49 6221 6552706
Logo der Firma Lingenio GmbH
Lingenio GmbH

Lingenio mit neuen Algorithmen auf der EAMT

Prof. Babych von Lingenio und der Universität Leeds stellt neues Verfahren für die MÜ- Datengewinnung vor

(PresseBox) (Heidelberg, )
Bogdan Babych, neuer Technischer Leiter bei der Lingenio GmbH und Professor an der Universität Leeds, trägt bei der diesjährigen Konferenz der European Association for Machine Translation (EAMT) in Alicante über eine neues Verfahren zur Gewinnung von Übersetzungsdaten aus sog. vergleichbaren Corpora mit großem Potenzial für die mehrsprachige Termextraktion vor.

Die EAMT veranstaltet jährlich eine Konferenz zu neuesten Entwicklungen in der Maschinellen Übersetzung. Dieses Jahr fand die Veranstaltung in Alicante statt. (The 21st Annual Conference of the European Association for Machine Translation). Ein wichtiges aktuelles Thema ist die Gewinnung von Übersetzungsdaten aus sog. 'vergleichbaren Corpora' (Comparable Corpora), d.h. von Texten unterschiedlicher Sprache die nicht Übersetzungen voneinander sind, sondern nur in der Thematik ähnlich.

Das ist gerade für Übersetzungen von und in sog. 'kleinere Sprachen' wichtig. Das sind solche, für die es vergleichsweise wenig elektronisch verfügbare Texte gibt und – vor allem – wenig Übersetzungen in 'große Sprachen' wie Englisch oder Französisch. Um Übersetzungssysteme trainieren zu können, muss dann auf andere, nur vergleichbare, Korpora ausgewichen werden. Für diese ist es von großer Bedeutung, sog. Cognates zu finden, d.h. Wörter in den Texten die mit großer Sicherheit als Übersetzung voneinander erkannt werden können. Bei Vorliegen von nur bescheidenen Wörterbüchern, wie oft z.B. zwischen asiatischen und europäischen Sprachen der Fall, ist das ein großes Problem.

Prof. Babych hat nach detaillierten Studien zu diesem Thema nun eine vielversprechende Arbeit vorgelegt die zur Bestimmung von Cognates zusätzliche, standardisierte und automatisch abfragbare Kriterien aus der Phonologie mit einbezieht. Die Arbeit ist auf großes Interesse bei Kollegen gestoßen, u.a. von der School of Computing der University of Dublin und der Universitat d'Alicant, beides bekannte Zentren innovativer Forschung zur automatischen Übersetzung.

Lingenio wird das Verfahren in seine Term-Extraktions-Systeme zur Unterstützung von diversen Übersetzungsprozessen integrieren.

Mehr zu der Arbeit zu 'Development and evaluaton of phonological models for cognate identification' findet sich in den Proceedings der Konferenz.

 

Website Promotion

Website Promotion
Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.
Wichtiger Hinweis:

Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die unn | UNITED NEWS NETWORK GmbH gestattet.

unn | UNITED NEWS NETWORK GmbH 2002–2024, Alle Rechte vorbehalten

Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.