lfg als interlingua in der maschinellen Übersetzung referat von zuzana pesselová am mittwoch, den...
Post on 06-Apr-2016
216 Views
Preview:
TRANSCRIPT
LFG als Interlingua in der maschinellen Übersetzung
Referat von Zuzana Pesselováam Mittwoch, den 05.02.2003
Interlingua• Ziel
Eine Repräsentation soll Hierarchien von Substrukturen abbilden, dabei jedoch klare Zwischenbeziehungen zeigen.
• gewünschtes Ergebnis Eine Repräsentation des Textes, die unabhängig
von einer Einzelsprache existiert (= Basis für die Generierung des zielsprachigen Textes).
• NachteileAnalyse und Generierung müssen streng getrennt
seinWährend der Generierung ist es nicht möglich, auf
den Originaltext zurückzugreifen.
strukturelle Repräsentation in den Interlingua-Systemen
• Propositionale Logik• Any government is dependent on its supporters.
– All(X), government (X), indefinite (Y), plural (Y), support (Y, X, T), depend on (X, Y, T), timeless (T)
• Wertung– Problemlose Analyse, Generierung beinahe unmöglich, da
keine syntaktische Information vorhanden.• Lösungen: „multilingual paraphrasing“
– Every governmet has supporters which it depends on.– People who support all governments are depended on by
them.– All governments depend on people who support them.
strukturelle Repräsentation in den Interlingua-Systemen
• LFG• Zusammenfassung mehrerer Sprachen beim
gleichzeitigen Ausgleich deren Unterschiede.
lexikalische Repräsentation in den Interlingua-Systemen
• Konzepte
• sprachunabhängige lexikalische Einheiten
• „meanings derived from the process of understanding of texts“
• Text (sein linguistischer Inhalt), über Phänomene (Einheiten, Aktionen, Begebenheiten) außerhalb des Textes (außersprachliche Realität)
Definition von Interlingua
• Eine Interlingua ist keine Sprache in herkömmlichen Sinne, sondern eine Art der Repräsentation (der Struktur).
• Üblicherweise wird sie gezielt bei ausgewählten Sprachpaaren oder bei mehreren verwandten Sprachen angewandt.
Die Interlingua-Grammatiken• Generative Transformationsgrammatik
(Chomsky, seit 1955)– 50.-90. Jahre– Oberflächenstruktur vs. Tiefenstruktur– Transformationen, die eine TS in eine OS
überführen– Die Annahme, dass es sich um eine sprach-
unabhängige Basis für die semantische Interpretation handelt, hat sich nicht bestätigt.
Die Interlingua-Grammatiken• 2. Kasusgrammatik
(Fillmore, 1968)– Vermutung, dass die Repräsentationen der
Kasusstruktur die Syntaxuniversalien abbilden
– oft benutzt worden in bilingualen transfer-basierten Systemen (z.B. Japanisch)
– Problem: Kasusrollen nicht standardisiert(„no widely agreed set of case relations“)
Maschinelle Übersetzung mit LFG
• 70. Jahre (Bresnan, Kaplan)• als Kritik an GTG• zwei Ebenen der syntaktischen Repräsentation
– C-Struktur (constituent-structure)– F-Struktur (functional-structure)
• werden erzeugt über die Phrasenstrukturregeln• zusätzlich
– Funktionen (als Grundbegriffe)– Lexikoneinträge (mit lexikalischen Regeln)
C-Struktur und F-Struktur• Beispiel
C-Struktur und F-Struktur• C-Struktur
– Phrasenstrukturbaum– geordnete Aufstellung der Wörter und Phrasen des
Satzes– kontextfreie Notation
• F-Struktur– hierarchische Funktion– enspricht den grammatischen Funktionen (S, O,
etc.)– umfaßt auch morphosyntaktische Merkmale (Case,
Num, Tense)
Transfer mit F-Strukturen• Einlesen des Quellsprachensatzes (Parser)• Ergebnis ist/sind F-Struktur(en) der
Quellsprache• Übersetzung der F-Struktur(en) mithilfe von
– Transfer-Lexikon (inkl. Subkategorisierung)– Top-Down-Verfahren
• Ergebnis ist/sind F-Struktur(en) der Zielsprache
• Generieren der Oberfläche (Generator)
Top down beim Transfer mit F-Strukturen
• Suche von PRED (zunächst das vom Wurzelknoten dominierte PRED)
• Überfprüfung der Valenz in der vorliegenden F-Struktur
• Suche vom Eintrag mit der gleichen Valenz• Eintrag = Grundlage für die F-Struktur der
Zeilsprache• anschl. PRED der nächste niedrigen Stufe wird
gesucht
Transfer mit F-Strukturen• Beispiel
Funktionen in der LFG• Description-by-analysis
– Die Struktur kann nur diejenigen Eigenschaften haben, die aus der Information abgeleitet wurde, die in der vorliegenden Struktur explizit identifiziert wurde.
• Codescription– Diese Beschreibungen lassen zu, dass die
endgültige Struktur Eigenschaften hat, die in der F-Struktur nicht vorhanden sein können.
Funktionen in der LFG• Funktionen signalisieren das Überführen der
Strukturen in andere Strukturen (z.B. von C-Strukturen zu F-Strukturen, von F-Strukturen zu semantischen Strukturen).
Vorgehensweise bei der MÜ mit LFG (Stufe 2)
• Die Beschreibung der zielsprachigen Strukturen ist von den quellsprachigen Strukturen mittels Analyse und Codescription abgeleitet.
• Dabei werden zusätzliche Vermerke auf der Basis der C-Strukturen und der lexikalischen Einheiten gemacht.
• Dies dient als Input für die Generierung der zielsprachigen Version.
Beispiel für die Leistungsfähigkeit
• The student is likely to work.• Il est probable que l´etudiant travaillera.
Beispiel für die Leistungsfähigkeit
• Berücksichtigung der Tempuskonkordanz
Fazit des Ansatzes von Kaplan • „an approach to machine translation that
exploits the potential of simultaneous correspondences between different levels of linguistic representation“
• it allows „partial specification“ and „multi-level-transfer“
Kommerzielle Nutzung• XLE (Xerox Linguistic Environment)
– Xerox Palo Alto Research Center in California
– Xerox Research Center in Europe (Grenoble)– Institut für maschinelle Sprachverarbeitung
(Stuttgart)• FUJITSU (Japan)• NEC (Japan)
top related